GPT4All
GPT4All 是一个可免费使用、本地运行、注重隐私的聊天机器人。无需GPU或互联网连接。它支持多种流行模型以及其自有模型,例如 GPT4All Falcon、Wizard 等。
本笔记本介绍了如何将GPT4All 嵌入与 LangChain 结合使用。
安装 GPT4All 的 Python 绑定
%pip install --upgrade --quiet gpt4all > /dev/null
注意:您可能需要重新启动内核才能使用更新的包。
from langchain_community.embeddings import GPT4AllEmbeddings
API 参考:GPT4All嵌入
gpt4all_embd = GPT4AllEmbeddings()
100%|████████████████████████| 45.5M/45.5M [00:02<00:00, 18.5MiB/s]
``````output
Model downloaded at: /Users/rlm/.cache/gpt4all/ggml-all-MiniLM-L6-v2-f16.bin
``````output
objc[45711]: Class GGMLMetalClass is implemented in both /Users/rlm/anaconda3/envs/lcn2/lib/python3.9/site-packages/gpt4all/llmodel_DO_NOT_MODIFY/build/libreplit-mainline-metal.dylib (0x29fe18208) and /Users/rlm/anaconda3/envs/lcn2/lib/python3.9/site-packages/gpt4all/llmodel_DO_NOT_MODIFY/build/libllamamodel-mainline-metal.dylib (0x2a0244208). One of the two will be used. Which one is undefined.
text = "This is a test document."
嵌入文本数据
query_result = gpt4all_embd.embed_query(text)
使用 embed_documents 可以嵌入多段文本。您还可以通过 Nomic 的 Atlas 将这些嵌入可视化,以查看数据的直观表示。
doc_result = gpt4all_embd.embed_documents([text])