Skip to main content
Open In ColabOpen on GitHub

泰坦起飞

TitanML 通过我们的训练、压缩和推理优化平台,帮助企业构建和部署更优质、更小巧、更便宜且更快速的自然语言处理(NLP)模型。

我们的推理服务器Titan Takeoff 可通过单个命令在您的硬件上本地部署大语言模型(LLM)。大多数嵌入模型均开箱即用,如果您在使用特定模型时遇到问题,请通过hello@titanml.co告知我们。

示例用法

以下是使用 Titan Takeoff Server 开始上手的一些有用示例。在运行这些命令之前,您需要确保 Takeoff Server 已在后台启动。更多信息请参见 启动 Takeoff 的文档页面

import time

from langchain_community.embeddings import TitanTakeoffEmbed

Example 1

假设 Takeoff 在您的机器上使用默认端口(即 localhost:3000)运行时的基本用法。

embed = TitanTakeoffEmbed()
output = embed.embed_query(
"What is the weather in London in August?", consumer_group="embed"
)
print(output)

Example 2

使用 TitanTakeoffEmbed Python 包装器启动读取器。如果您尚未在首次启动 Takeoff 时创建任何读取器,或者您想添加另一个读取器,可以在初始化 TitanTakeoffEmbed 对象时进行操作。只需将您想要启动的模型列表作为 models 参数传入即可。

您可以通过使用 embed.query_documents 一次性嵌入多个文档。预期输入为字符串列表,而不是 embed_query 方法所期望的单个字符串。

# Model config for the embedding model, where you can specify the following parameters:
# model_name (str): The name of the model to use
# device: (str): The device to use for inference, cuda or cpu
# consumer_group (str): The consumer group to place the reader into
embedding_model = {
"model_name": "BAAI/bge-large-en-v1.5",
"device": "cpu",
"consumer_group": "embed",
}
embed = TitanTakeoffEmbed(models=[embedding_model])

# The model needs time to spin up, length of time need will depend on the size of model and your network connection speed
time.sleep(60)

prompt = "What is the capital of France?"
# We specified "embed" consumer group so need to send request to the same consumer group so it hits our embedding model and not others
output = embed.embed_query(prompt, consumer_group="embed")
print(output)