单仓库加载器
这SingleStoreLoader允许您直接从 SingleStore 数据库表加载文档。它是langchain-singlestore集成包。
概述
集成详细信息
| 类 | 包 | JS 支持 |
|---|---|---|
SingleStoreLoader | langchain_singlestore | ❌ |
特征
- 延迟加载文档以高效处理大型数据集。
- 支持本机异步作。
- 易于配置以使用不同的数据库架构。
设置
要使用SingleStoreLoader,您需要安装langchain-singlestore包。请按照下面的安装说明进行作。
安装
安装 langchain_singlestore。
%pip install -qU langchain_singlestore
初始化
初始化SingleStoreLoader,您需要为 SingleStore 数据库提供连接参数,并指定要从中加载文档的表和字段。
必需参数:
- 主机 (
str):数据库的主机名、IP 地址或 URL。 - table_name (
str):要查询的表的名称。默认为embeddings. - content_field (
str):包含文档内容的字段。默认为content. - metadata_field (
str):包含文档元数据的字段。默认为metadata.
可选参数:
- id_field (
str):包含文档 ID 的字段。默认为id.
连接池参数:
- pool_size (
int):池中的活动连接数。默认为5. - max_overflow (
int):超出的最大连接数pool_size.默认为10. - 超时 (
float):连接超时(以秒为单位)。默认为30.
其他选项:
- pure_python (
bool):启用纯 Python 模式。 - local_infile (
bool):允许本地文件上传。 - 字符集 (
str):字符串值的字符集。 - ssl_key、ssl_cert ssl_ca (
str):SSL 文件的路径。 - ssl_disabled (
bool):禁用 SSL。 - ssl_verify_cert (
bool):验证服务器的证书。 - ssl_verify_identity (
bool):验证服务器的身份。 - 自动提交 (
bool):启用自动提交。 - results_type (
str):查询结果的结构(例如tuples,dicts).
from langchain_singlestore.document_loaders import SingleStoreLoader
loader = SingleStoreLoader(
host="127.0.0.1:3306/db",
table_name="documents",
content_field="content",
metadata_field="metadata",
id_field="id",
)
负荷
docs = loader.load()
docs[0]
print(docs[0].metadata)
延迟加载
page = []
for doc in loader.lazy_load():
page.append(doc)
if len(page) >= 10:
# do some paged operation, e.g.
# index.upsert(page)
page = []
API 参考
有关所有 SingleStore Document Loader 功能和配置的详细文档,请访问 github 页面:https://github.com/singlestore-labs/langchain-singlestore/