Skip to main content
在 GitHub 上打开

MyScale

本页介绍了如何在 LangChain 中使用 MyScale 向量数据库。 它分为两部分:安装和设置,然后是对特定 MyScale 包装器的引用。

借助 MyScale,您可以管理结构化和非结构化(矢量化)数据,并使用 SQL 对这两种类型的数据执行联合查询和分析。此外,MyScale 的云原生 OLAP 架构构建在 ClickHouse 之上,即使在海量数据集上也能实现闪电般的数据处理。

介绍

MyScale 和高性能矢量搜索概述

您现在可以在我们的 SaaS 上注册并立即启动集群!

如果你也对我们如何集成 SQL 和 vector 感兴趣,请参考此文档以获取进一步的语法参考。

我们还在 huggingface 上提供现场演示!请查看我们的 huggingface 空间!他们在眨眼间搜索了数百万个向量!

安装和设置

  • 安装 Python SDKpip install clickhouse-connect

设置环境

有两种方法可以设置 myscale 索引的参数。

  1. 环境变量

    在运行应用程序之前,请使用export:export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ...

    您可以在我们的 SaaS 上轻松找到您的帐户、密码和其他信息。有关详细信息,请参阅此文档MyScaleSettings可以使用 prefix 设置MYSCALE_并且不区分大小写。

  2. 创造MyScaleSettings带参数的对象

    from langchain_community.vectorstores import MyScale, MyScaleSettings
    config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
    index = MyScale(embedding_function, config)
    index.add_documents(...)

包装

支持的功能:

  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

矢量存储

MyScale 数据库周围有一个包装器,允许您将其用作矢量存储, 无论是用于语义搜索还是类似的示例检索。

要导入此 vectorstore:

from langchain_community.vectorstores import MyScale
API 参考:MyScale

有关 MyScale 包装器的更详细演练,请参阅此笔记本