Skip to main content
Open on GitHub

MyScale

此页面介绍了如何在LangChain中使用MyScale向量数据库。 它被分为两部分:安装和设置,然后是具体的MyScale封装参考。

使用MyScale,您可以管理和查询结构化和非结构化(向量化)数据,并且可以通过SQL对这两种类型的数据进行联合查询和分析。此外,MyScale基于ClickHouse构建的云原生OLAP架构能够即使在大规模数据集上也能实现闪电般的快速数据处理。

简介

MyScale 概览与高性能向量搜索

您可以现在注册我们的SaaS并立即启动一个集群!

如果您也对如何我们将SQL和向量进行集成感兴趣,请参阅此文档获取进一步的语法参考。

我们将为您提供实时演示,在huggingface上!请访问我们的huggingface空间!它们可以在眨眼之间搜索数百万个向量!

安装与设置

  • 使用 pip install clickhouse-connect 安装 Python SDK

设置环境

有两条途径可以设置 myscale 索引的参数。

  1. 环境变量

    在运行应用程序之前,请设置环境变量,使用以下代码:export: export MYSCALE_HOST='<your-endpoints-url>' MYSCALE_PORT=<your-endpoints-port> MYSCALE_USERNAME=<your-username> MYSCALE_PASSWORD=<your-password> ...

    您可以在我们的SaaS上轻松找到您的账户、密码和其他信息。详情请参阅此文档 每个属于MyScaleSettings下的属性都可以通过前缀MYSCALE_设置,并且不区分大小写。

  2. 使用参数创建 MyScaleSettings 对象

    from langchain_community.vectorstores import MyScale, MyScaleSettings
    config = MyScaleSettings(host="<your-backend-url>", port=8443, ...)
    index = MyScale(embedding_function, config)
    index.add_documents(...)

包装器

supported functions:

  • add_texts
  • add_documents
  • from_texts
  • from_documents
  • similarity_search
  • asimilarity_search
  • similarity_search_by_vector
  • asimilarity_search_by_vector
  • similarity_search_with_relevance_scores
  • delete

向量存储

存在一个围绕MyScale数据库的封装,允许你将其用作向量存储,无论是用于语义搜索还是类似示例检索。

要导入此向量存储库:

from langchain_community.vectorstores import MyScale
API 参考:MyScale

要详细了解MyScale包装器,请参见这个笔记本