Skip to main content
在 GitHub 上打开

Arxiv

arXiv 是一个开放访问的档案库,收录了物理学领域的 200 万篇学术文章, 数学、计算机科学、定量生物学、定量金融、统计学、电气工程和 系统科学和经济学。

安装和设置

首先,您需要安装arxivpython 软件包。

pip install arxiv

其次,您需要安装PyMuPDFpython 软件包,用于转换从arxiv.orgsite 转换为文本格式。

pip install pymupdf

文档加载器

请参阅使用示例

from langchain_community.document_loaders import ArxivLoader
API 参考:ArxivLoader

Retriever

请参阅使用示例

from langchain_community.retrievers import ArxivRetriever
API 参考:ArxivRetriever