Skip to main content
Open In Colab在 GitHub 上打开

GPT4全部

GPT4All 是一个免费使用、本地运行、具有隐私意识的聊天机器人。不需要 GPU 或 Internet。它具有流行的模型和自己的模型,例如 GPT4All Falcon、Wizard 等。

本笔记本介绍了如何将 GPT4All 嵌入向量与 LangChain 结合使用。

安装 GPT4All 的 Python 绑定

%pip install --upgrade --quiet  gpt4all > /dev/null

注意:您可能需要重启内核才能使用更新的软件包。

from langchain_community.embeddings import GPT4AllEmbeddings
API 参考:GPT4AllEmbeddings
gpt4all_embd = GPT4AllEmbeddings()
100%|████████████████████████| 45.5M/45.5M [00:02<00:00, 18.5MiB/s]
``````output
Model downloaded at: /Users/rlm/.cache/gpt4all/ggml-all-MiniLM-L6-v2-f16.bin
``````output
objc[45711]: Class GGMLMetalClass is implemented in both /Users/rlm/anaconda3/envs/lcn2/lib/python3.9/site-packages/gpt4all/llmodel_DO_NOT_MODIFY/build/libreplit-mainline-metal.dylib (0x29fe18208) and /Users/rlm/anaconda3/envs/lcn2/lib/python3.9/site-packages/gpt4all/llmodel_DO_NOT_MODIFY/build/libllamamodel-mainline-metal.dylib (0x2a0244208). One of the two will be used. Which one is undefined.
text = "This is a test document."

嵌入文本数据

query_result = gpt4all_embd.embed_query(text)

使用 embed_documents 可以嵌入多段文本。您还可以使用 Nomic 的 Atlas 映射这些嵌入,以查看数据的可视化表示。

doc_result = gpt4all_embd.embed_documents([text])