Upstash 为开发者提供无服务器数据库和消息传递平台，帮助他们构建强大的应用程序，而无需担心大规模运行数据库的操作复杂性。

Upstash 的一个显著优势是其数据库支持 HTTP，并且所有 SDK 都使用 HTTP。这意味着你可以在无服务器平台、边缘计算平台或任何不支持 TCP 连接的平台上运行它。

目前，LangChain 提供了两种 Upstash 集成方式： Upstash Vector 作为向量嵌入数据库，以及 Upstash Redis 作为缓存和内存存储。

Upstash Vector

Upstash Vector 是一个无服务器的向量数据库，可用于存储和查询向量。

安装

在Upstash控制台创建一个新的无服务器向量数据库。根据您的模型选择首选的距离度量和维度数量。

使用 pip install upstash-vector 安装 Upstash Vector Python SDK。 langchain 中的 Upstash Vector 集成是对 Upstash Vector Python SDK 的封装。这就是为什么需要 upstash-vector 包。

集成

使用来自Upstash控制台的凭据创建一个UpstashVectorStore对象。您还需要传入一个可以将文本转换为向量嵌入的Embeddings对象。

from langchain_community.vectorstores.upstash import UpstashVectorStore
import os

os.environ["UPSTASH_VECTOR_REST_URL"] = "<UPSTASH_VECTOR_REST_URL>"
os.environ["UPSTASH_VECTOR_REST_TOKEN"] = "<UPSTASH_VECTOR_REST_TOKEN>"

store = UpstashVectorStore(
    embedding=embeddings
)

API 参考：UpstashVectorStore

另一种UpstashVectorStore的方式是传递embedding=True。这是UpstashVectorStore的一项独特功能，得益于Upstash Vector索引能够关联嵌入模型的能力。在此配置中，我们想要插入的文档或想要搜索的查询只需作为文本发送到Upstash Vector。在后台，Upstash Vector会对这些文本进行嵌入处理，并使用这些嵌入执行请求。要使用此功能，通过选择模型创建一个Upstash Vector索引，然后简单传递embedding=True：

from langchain_community.vectorstores.upstash import UpstashVectorStore
import os

os.environ["UPSTASH_VECTOR_REST_URL"] = "<UPSTASH_VECTOR_REST_URL>"
os.environ["UPSTASH_VECTOR_REST_TOKEN"] = "<UPSTASH_VECTOR_REST_TOKEN>"

store = UpstashVectorStore(
    embedding=True
)

API 参考：UpstashVectorStore

查看更多关于嵌入模型的详细信息，请参阅Upstash Vector 文档。

命名空间

你可以使用命名空间将数据分区存储在索引中。当你需要查询大量数据时，命名空间非常有用，它可以帮助你对数据进行分区，从而加快查询速度。使用命名空间时，查询结果不会有后过滤操作，这将使查询结果更加精确。

from langchain_community.vectorstores.upstash import UpstashVectorStore
import os

os.environ["UPSTASH_VECTOR_REST_URL"] = "<UPSTASH_VECTOR_REST_URL>"
os.environ["UPSTASH_VECTOR_REST_TOKEN"] = "<UPSTASH_VECTOR_REST_TOKEN>"

store = UpstashVectorStore(
    embedding=embeddings
    namespace="my_namespace"
)

API 参考：UpstashVectorStore

插入向量

from langchain.text_splitter import CharacterTextSplitter
from langchain_community.document_loaders import TextLoader
from langchain_openai import OpenAIEmbeddings

loader = TextLoader("../../modules/state_of_the_union.txt")
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# Create a new embeddings object
embeddings = OpenAIEmbeddings()

# Create a new UpstashVectorStore object
store = UpstashVectorStore(
    embedding=embeddings
)

# Insert the document embeddings into the store
store.add_documents(docs)

API 参考：CharacterTextSplitter | TextLoader | OpenAIEmbeddings

在插入文档时，首先会使用 Embeddings 对象对它们进行嵌入。

大多数嵌入模型可以一次嵌入多个文档，因此文档会被分批并行嵌入。可以使用 embedding_chunk_size 参数来控制批次的大小。

嵌入向量随后存储在Upstash向量数据库中。发送时，多个向量会被批量处理以减少HTTP请求的数量。可以使用batch_size参数来控制批量的大小。Upstash向量在免费层中每批次限制为1000个向量。

store.add_documents(
    documents,
    batch_size=100,
    embedding_chunk_size=200
)

查询向量

向量可以通过文本查询或另一个向量进行查询。

返回的值是一个文档对象列表。

result = store.similarity_search(
    "The United States of America",
    k=5
)

或者使用向量：

vector = embeddings.embed_query("Hello world")

result = store.similarity_search_by_vector(
    vector,
    k=5
)

在搜索时，您还可以利用filter参数，该参数允许您通过元数据进行过滤：

result = store.similarity_search(
    "The United States of America",
    k=5,
    filter="type = 'country'"
)

参见 Upstash Vector 文档了解更多关于元数据过滤的详细信息。

删除向量

可以通过其ID删除向量。

store.delete(["id1", "id2"])

获取有关存储的信息

你可以使用 info 函数获取有关数据库的信息，例如距离度量维度。

当插入操作发生时，数据库会进行索引。在此期间，新的向量无法被查询。pendingVectorCount 表示当前正在被索引的向量数量。

info = store.info()
print(info)

# Output:
# {'vectorCount': 44, 'pendingVectorCount': 0, 'indexSize': 2642412, 'dimension': 1536, 'similarityFunction': 'COSINE'}

Upstash Redis

本页面介绍如何在LangChain中使用Upstash Redis。

安装与设置

Upstash Redis Python SDK 可以通过 pip install upstash-redis 安装
可以在Upstash控制台创建一个全球分布、低延迟且高可用的数据库

集成

所有 Upstash-LangChain 集成均基于 upstash-redis Python SDK，该SDK被用作 LangChain 的封装器。此 SDK 通过从控制台提供 UPSTASH_REDIS_REST_URL 和 UPSTASH_REDIS_REST_TOKEN 参数来利用 Upstash Redis 数据库。

缓存

Upstash Redis 可用作LLM提示和响应的缓存。

要导入此缓存：

from langchain.cache import UpstashRedisCache

API 参考：UpstashRedisCache

与您的LLMs一起使用：

import langchain
from upstash_redis import Redis

URL = "<UPSTASH_REDIS_REST_URL>"
TOKEN = "<UPSTASH_REDIS_REST_TOKEN>"

langchain.llm_cache = UpstashRedisCache(redis_=Redis(url=URL, token=TOKEN))

存储

查看一个使用示例。

from langchain_community.chat_message_histories import (
    UpstashRedisChatMessageHistory,
)

API 参考：UpstashRedisChatMessageHistory

安装​

集成​

命名空间​

插入向量​

查询向量​

删除向量​

获取有关存储的信息​

Upstash Redis

安装与设置​

集成​

缓存​

存储​

安装

集成

命名空间

插入向量

查询向量

删除向量

获取有关存储的信息

安装与设置

集成

缓存

存储