vLLM 聊天

vLLM 可以部署为一个模仿 OpenAI API 协议的服务器。这使得 vLLM 能够作为使用 OpenAI API 的应用程序的直接替代品。该服务器可以使用与 OpenAI API 相同的格式进行查询。

概览

这将帮助您开始使用vLLM 聊天模型，这些模型利用了langchain-openai包。有关所有ChatOpenAI特性和配置的详细文档，请访问API参考。

集成详情

类	包	本地	可序列化的	JS 支持	软件包下载	最新包裹
ChatOpenAI	langchain_openai	✅	beta	❌

模型特性

特定的模型功能——例如工具调用、对多模态输入的支持、对逐令牌流式传输的支持等——将取决于托管的模型。

设置

请参阅vLLM文档这里。

要通过LangChain访问vLLM模型，您需要安装langchain-openai集成包。

凭据

身份验证将取决于推理服务器的具体情况。

要启用模型调用的自动跟踪，请设置您的 LangSmith API 密钥：

# os.environ["LANGSMITH_TRACING"] = "true"
# os.environ["LANGSMITH_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")

安装

LangChain vLLM 集成可以通过 langchain-openai 包访问：

%pip install -qU langchain-openai

实例化

现在我们可以实例化我们的模型对象并生成聊天补全：

from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    SystemMessagePromptTemplate,
)
from langchain_openai import ChatOpenAI

inference_server_url = "http://localhost:8000/v1"

llm = ChatOpenAI(
    model="mosaicml/mpt-7b",
    openai_api_key="EMPTY",
    openai_api_base=inference_server_url,
    max_tokens=5,
    temperature=0,
)

调用

messages = [
    SystemMessage(
        content="You are a helpful assistant that translates English to Italian."
    ),
    HumanMessage(
        content="Translate the following sentence from English to Italian: I love programming."
    ),
]
llm.invoke(messages)

AIMessage(content=' Io amo programmare', additional_kwargs={}, example=False)

链式调用

我们可以像这样将我们的模型与提示模板链接：

from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate(
    [
        (
            "system",
            "You are a helpful assistant that translates {input_language} to {output_language}.",
        ),
        ("human", "{input}"),
    ]
)

chain = prompt | llm
chain.invoke(
    {
        "input_language": "English",
        "output_language": "German",
        "input": "I love programming.",
    }
)

API 参考：ChatPromptTemplate

API 参考

有关通过 langchain-openai 暴露的所有功能和配置的详细文档，请访问API参考： https://python.langchain.com/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html

同时参考vLLM的文档。

聊天模型概念指南
聊天模型操操作指南

概览​

集成详情​

模型特性​

设置​

凭据​

安装​

实例化​

调用​

链式调用​

API 参考​

相关​

概览

集成详情

模型特性

设置

凭据

安装

实例化

调用

链式调用

API 参考

相关