Skip to main content
Open In ColabOpen on GitHub

工作空间

这本笔记本展示了如何使用RSpace文档加载器将来自RSpace电子实验记录本的研究笔记和文件导入Langchain管道中。

开始前,您需要一个RSpace账户和一个API密钥。

您可以在此处设置免费账户:https://community.researchspace.com 或使用您的机构 RSpace。

您可以从账户的配置页面获取 RSpace API令牌。

%pip install --upgrade --quiet  rspace_client

最好将您的RSpace API密钥存储为环境变量。

RSPACE_API_KEY=<YOUR_KEY>

您还需要设置您的RSpace安装的URL,例如:<br>

RSPACE_URL=https://community.researchspace.com

如果使用这些确切的环境变量名称,它们将被自动检测到。

from langchain_community.document_loaders.rspace import RSpaceLoader
API 参考:RSpaceLoader

您可以从RSpace导入各种项目:

  • 单个RSpace结构化或基本文档。这将一对一映射到一个Langchain文档。
  • 一个文件夹或笔记本。笔记本或文件夹内的所有文档将被导入为Langchain文档。
  • 如果您在RSpace画廊中有PDF文件,这些文件可以逐个导入。后台使用的是Langchain的PDF加载器,并且会为每个PDF页面创建一个Langchain文档。
## replace these ids with some from your own research notes.
## Make sure to use global ids (with the 2 character prefix). This helps the loader know which API calls to make
## to RSpace API.

rspace_ids = ["NB1932027", "FL1921314", "SD1932029", "GL1932384"]
for rs_id in rspace_ids:
loader = RSpaceLoader(global_id=rs_id)
docs = loader.load()
for doc in docs:
## the name and ID are added to the 'source' metadata property.
print(doc.metadata)
print(doc.page_content[:500])

如果您不想使用上述环境变量,可以将这些参数传递给RSpaceLoader

loader = RSpaceLoader(
global_id=rs_id, api_key="MY_API_KEY", url="https://my.researchspace.com"
)