Skip to main content
Open In ColabOpen on GitHub

SingleStoreLoader

The SingleStoreLoader 允许您直接从 SingleStore 数据库表加载文档。它是 langchain-singlestore 集成包的一部分。

概览

集成细节

ClassJS支持
SingleStoreLoaderlangchain_singlestore

特性

  • 懒加载文档以高效处理大型数据集。
  • 支持原生异步操作。
  • 轻松配置以与不同的数据库模式协同工作。

设置

要使用 SingleStoreLoader,您需要安装 langchain-singlestore 包。请按照以下安装说明进行操作。

安装

安装 langchain_singlestore

%pip install -qU langchain_singlestore

初始化

要初始化 SingleStoreLoader,您需要提供 SingleStore 数据库的连接参数,并指定用于加载文档的表和字段。

所需参数:

  • host (str): 数据库的主机名、IP地址或URL。
  • 表名 (str): 要查询的表格名称。默认为 embeddings
  • 内容字段 (str): 包含文档内容的字段。默认值为 content.
  • metadata_field (str): 包含文档元数据的字段。默认值为 metadata

可选参数:

  • id_field (str): 文档ID字段。默认值为id

连接池参数:

  • pool_size (int): 连接池中的活跃连接数量。默认值为 5
  • max_overflow (int): 超过 pool_size 的最大连接数。默认值为 10
  • 超时 (float): 连接超时秒数。默认值为 30

Additional Options:

  • pure_python
    (bool): 启用纯Python模式。
  • local_infile (bool): 允许上传本地文件。
  • 字符集 (str): 字符串的字符集。
  • ssl_key, ssl_cert, ssl_ca (str): 路径到SSL文件。
  • ssl_disabled (bool): 禁用SSL。
  • ssl_verify_cert (bool): 验证服务器的证书。
  • ssl_verify_identity (bool): 验证服务器的身份。
  • autocommit (bool): 启用自动提交。
  • 结果类型 (str): 查询结果的结构(例如,tuplesdicts)。
from langchain_singlestore.document_loaders import SingleStoreLoader

loader = SingleStoreLoader(
host="127.0.0.1:3306/db",
table_name="documents",
content_field="content",
metadata_field="metadata",
id_field="id",
)

加载

docs = loader.load()
docs[0]
print(docs[0].metadata)

懒加载

page = []
for doc in loader.lazy_load():
page.append(doc)
if len(page) >= 10:
# do some paged operation, e.g.
# index.upsert(page)

page = []

API 参考

详细介绍了所有SingleStore Document Loader功能和配置的文档,请访问github页面: https://github.com/singlestore-labs/langchain-singlestore/