Skip to main content
Open In Colab在 GitHub 上打开

单仓库加载器

SingleStoreLoader允许您直接从 SingleStore 数据库表加载文档。它是langchain-singlestore集成包。

概述

集成详细信息

JS 支持
SingleStoreLoaderlangchain_singlestore

特征

  • 延迟加载文档以高效处理大型数据集。
  • 支持本机异步作。
  • 易于配置以使用不同的数据库架构。

设置

要使用SingleStoreLoader,您需要安装langchain-singlestore包。请按照下面的安装说明进行作。

安装

安装 langchain_singlestore

%pip install -qU langchain_singlestore

初始化

初始化SingleStoreLoader,您需要为 SingleStore 数据库提供连接参数,并指定要从中加载文档的表和字段。

必需参数:

  • 主机 (str):数据库的主机名、IP 地址或 URL。
  • table_name (str):要查询的表的名称。默认为embeddings.
  • content_field (str):包含文档内容的字段。默认为content.
  • metadata_field (str):包含文档元数据的字段。默认为metadata.

可选参数:

  • id_field (str):包含文档 ID 的字段。默认为id.

连接池参数:

  • pool_size (int):池中的活动连接数。默认为5.
  • max_overflow (int):超出的最大连接数pool_size.默认为10.
  • 超时 (float):连接超时(以秒为单位)。默认为30.

其他选项:

  • pure_python (bool):启用纯 Python 模式。
  • local_infile (bool):允许本地文件上传。
  • 字符集 (str):字符串值的字符集。
  • ssl_keyssl_cert ssl_ca (str):SSL 文件的路径。
  • ssl_disabled (bool):禁用 SSL。
  • ssl_verify_cert (bool):验证服务器的证书。
  • ssl_verify_identity (bool):验证服务器的身份。
  • 自动提交 (bool):启用自动提交。
  • results_type (str):查询结果的结构(例如tuples,dicts).
from langchain_singlestore.document_loaders import SingleStoreLoader

loader = SingleStoreLoader(
host="127.0.0.1:3306/db",
table_name="documents",
content_field="content",
metadata_field="metadata",
id_field="id",
)

负荷

docs = loader.load()
docs[0]
print(docs[0].metadata)

延迟加载

page = []
for doc in loader.lazy_load():
page.append(doc)
if len(page) >= 10:
# do some paged operation, e.g.
# index.upsert(page)

page = []

API 参考

有关所有 SingleStore Document Loader 功能和配置的详细文档,请访问 github 页面:https://github.com/singlestore-labs/langchain-singlestore/