SingleStoreLoader
The SingleStoreLoader 允许您直接从 SingleStore 数据库表加载文档。它是 langchain-singlestore 集成包的一部分。
概览
集成细节
| Class | 包 | JS支持 |
|---|---|---|
SingleStoreLoader | langchain_singlestore | ❌ |
特性
- 懒加载文档以高效处理大型数据集。
- 支持原生异步操作。
- 轻松配置以与不同的数据库模式协同工作。
设置
要使用 SingleStoreLoader,您需要安装 langchain-singlestore 包。请按照以下安装说明进行操作。
安装
安装 langchain_singlestore。
%pip install -qU langchain_singlestore
初始化
要初始化 SingleStoreLoader,您需要提供 SingleStore 数据库的连接参数,并指定用于加载文档的表和字段。
所需参数:
- host (
str): 数据库的主机名、IP地址或URL。 - 表名 (
str): 要查询的表格名称。默认为embeddings。 - 内容字段 (
str): 包含文档内容的字段。默认值为content. - metadata_field (
str): 包含文档元数据的字段。默认值为metadata。
可选参数:
- id_field (
str): 文档ID字段。默认值为id。
连接池参数:
- pool_size (
int): 连接池中的活跃连接数量。默认值为5。 - max_overflow (
int): 超过pool_size的最大连接数。默认值为10。 - 超时 (
float): 连接超时秒数。默认值为30。
Additional Options:
- pure_python
(bool): 启用纯Python模式。 - local_infile (
bool): 允许上传本地文件。 - 字符集 (
str): 字符串的字符集。 - ssl_key, ssl_cert, ssl_ca (
str): 路径到SSL文件。 - ssl_disabled (
bool): 禁用SSL。 - ssl_verify_cert (
bool): 验证服务器的证书。 - ssl_verify_identity (
bool): 验证服务器的身份。 - autocommit (
bool): 启用自动提交。 - 结果类型 (
str): 查询结果的结构(例如,tuples,dicts)。
from langchain_singlestore.document_loaders import SingleStoreLoader
loader = SingleStoreLoader(
host="127.0.0.1:3306/db",
table_name="documents",
content_field="content",
metadata_field="metadata",
id_field="id",
)
加载
docs = loader.load()
docs[0]
print(docs[0].metadata)
懒加载
page = []
for doc in loader.lazy_load():
page.append(doc)
if len(page) >= 10:
# do some paged operation, e.g.
# index.upsert(page)
page = []
API 参考
详细介绍了所有SingleStore Document Loader功能和配置的文档,请访问github页面: https://github.com/singlestore-labs/langchain-singlestore/