Epsilla
Epsilla 是一个基于先进并行图遍历技术的开源向量数据库。Epsilla 采用 GPL-3.0 许可证。
您需要使用 langchain-community 安装 pip install -qU langchain-community 才能使用此集成
这个笔记本展示了如何使用与Epsilla向量数据库相关的功能。
作为先决条件,您需要运行一个运行中的Epsilla向量数据库(例如,通过我们的docker镜像),并安装pyepsilla包。完整文档请参阅docs。
!pip/pip3 install pyepsilla
我们需要使用 OpenAIEmbeddings,因此必须获取 OpenAI API 密钥。
import getpass
import os
if "OPENAI_API_KEY" not in os.environ:
os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")
OpenAI API密钥: ········
from langchain_community.vectorstores import Epsilla
from langchain_openai import OpenAIEmbeddings
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter
loader = TextLoader("../../how_to/state_of_the_union.txt")
documents = loader.load()
documents = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0).split_documents(
documents
)
embeddings = OpenAIEmbeddings()
API 参考:文本加载器 |CharacterTextSplitter
Epsilla vectordb 正在使用默认主机"localhost"和端口"8888"运行。我们使用自定义的数据库路径、数据库名称和集合名称,而不是默认的那些。
from pyepsilla import vectordb
client = vectordb.Client()
vector_store = Epsilla.from_documents(
documents,
embeddings,
client,
db_path="/tmp/mypath",
db_name="MyDB",
collection_name="MyCollection",
)
query = "What did the president say about Ketanji Brown Jackson"
docs = vector_store.similarity_search(query)
print(docs[0].page_content)
在州接州,新法律被通过,不仅为了压制选民投票,还为了颠覆整个选举。
我们不能让这种情况发生。
今晚,我呼吁参议院:通过《自由投票法》。通过《约翰·刘易斯投票权法案》。顺便说一句,在这之后,请通过《披露法案》,这样美国人才能知道谁在资助我们的选举。
今晚,我想向一位为这个国家奉献一生的人致敬:斯蒂芬·布雷耶大法官——一名陆军退伍军人、宪法学者以及即将退休的美国最高法院大法官。布雷耶大法官,感谢您的服务。
美国总统最重要的宪法职责之一是提名法官担任美国最高法院的职务。
我四天前就做了这件事,当时我提名了巡回上诉法院法官卡特尼·布朗·杰克逊。我们国家顶尖的法律头脑之一,她将继续布雷耶大法官卓越传统的遗产。