Skip to main content
Open In ColabOpen on GitHub

ModelScopeChatEndpoint

ModelScope (主页 | GitHub) 是建立在“模型即服务”(MaaS) 的理念之上的。它旨在汇集来自人工智能社区的最先进的机器学习模型,并简化将 AI 模型应用于实际应用的过程。此仓库中开源的核心 ModelScope 库提供了接口和实现,允许开发者进行模型推理、训练和评估。

这将帮助你开始使用ModelScope聊天端点。

概览

集成细节

提供者Class本地序列化Package downloadsPackage 最新版本
ModelScopeModelScopeChatEndpointlangchain-modelscope-integrationPyPI - DownloadsPyPI - Version

设置

要访问ModelScope聊天端点,您需要创建一个ModelScope账户、获取SDK令牌,并安装langchain-modelscope-integration集成包。

Credentials

前往 ModelScope 注册并生成 SDK 令牌。完成此操作后,请设置 MODELSCOPE_SDK_TOKEN 环境变量:

import getpass
import os

if not os.getenv("MODELSCOPE_SDK_TOKEN"):
os.environ["MODELSCOPE_SDK_TOKEN"] = getpass.getpass(
"Enter your ModelScope SDK token: "
)

安装

The LangChain 模型集成位于 langchain-modelscope-integration 包中:

%pip install -qU langchain-modelscope-integration

Instantiation

现在我们就可以实例化我们的模型对象并生成聊天完成内容:

from langchain_modelscope import ModelScopeChatEndpoint

llm = ModelScopeChatEndpoint(
model="Qwen/Qwen2.5-Coder-32B-Instruct",
temperature=0,
max_tokens=1024,
timeout=60,
max_retries=2,
# other params...
)

Invocation

messages = [
(
"system",
"You are a helpful assistant that translates English to Chinese. Translate the user sentence.",
),
("human", "I love programming."),
]
ai_msg = llm.invoke(messages)
ai_msg
AIMessage(content='我喜欢编程。', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 3, 'prompt_tokens': 33, 'total_tokens': 36, 'completion_tokens_details': None, 'prompt_tokens_details': None}, 'model_name': 'qwen2.5-coder-32b-instruct', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-60bb3461-60ae-4c0b-8997-ab55ef77fcd6-0', usage_metadata={'input_tokens': 33, 'output_tokens': 3, 'total_tokens': 36, 'input_token_details': {}, 'output_token_details': {}})
print(ai_msg.content)
我喜欢编程。

链式调用

我们可以通过以下方式将模型与提示模板进行链接

from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate(
[
(
"system",
"You are a helpful assistant that translates {input_language} to {output_language}.",
),
("human", "{input}"),
]
)

chain = prompt | llm
chain.invoke(
{
"input_language": "English",
"output_language": "Chinese",
"input": "I love programming.",
}
)
AIMessage(content='我喜欢编程。', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 3, 'prompt_tokens': 28, 'total_tokens': 31, 'completion_tokens_details': None, 'prompt_tokens_details': None}, 'model_name': 'qwen2.5-coder-32b-instruct', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-9f011a3a-9a11-4759-8d16-5b1843a78862-0', usage_metadata={'input_tokens': 28, 'output_tokens': 3, 'total_tokens': 31, 'input_token_details': {}, 'output_token_details': {}})

API 参考

详细文档请参阅所有ModelScopeChatEndpoint功能和配置: https://modelscope.cn/docs/model-service/API-Inference/intro