元2.0

本笔记本介绍如何将 LangChain 中的 YUAN2 API 与 langchain.chat_models 结合使用。ChatYuan2 的

Yuan2.0 是 IEIT System 开发的新一代基础大语言模型。我们发布了所有三种模型，Yuan 2.0-102B、Yuan 2.0-51B 和 Yuan 2.0-2B。我们为其他开发人员提供用于预训练、微调和推理服务的相关脚本。Yuan2.0 基于 Yuan1.0，利用更广泛的高质量预训练数据和指令微调数据集来增强模型对语义、数学、推理、代码、知识等方面的理解。

开始

安装

首先，Yuan2.0 提供了一个兼容 OpenAI 的 API，我们使用 OpenAI 客户端将 ChatYuan2 集成到 langchain 聊天模型中。因此，请确保在您的 Python 环境中安装了 openai 软件包。运行以下命令：

%pip install --upgrade --quiet openai

导入所需的模块

安装后，将必要的模块导入到 Python 脚本中：

from langchain_community.chat_models import ChatYuan2
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage

API 参考：ChatYuan2 | AIMessage | HumanMessage （人工消息） | SystemMessage 系统

设置 API 服务器

按照 yuan2 openai api server 设置与 OpenAI 兼容的 API 服务器。如果你在本地部署了 api server，你可以简单地设置yuan2_api_key="EMPTY"或任何你想要的东西。只需确保yuan2_api_base设置正确。

yuan2_api_key = "your_api_key"
yuan2_api_base = "http://127.0.0.1:8001/v1"

初始化 ChatYuan2 模型

以下是初始化聊天模型的方法：

chat = ChatYuan2(
    yuan2_api_base="http://127.0.0.1:8001/v1",
    temperature=1.0,
    model_name="yuan2",
    max_retries=3,
    streaming=False,
)

基本用法

使用系统和人工消息调用模型，如下所示：

messages = [
    SystemMessage(content="你是一个人工智能助手。"),
    HumanMessage(content="你好，你是谁？"),
]

print(chat.invoke(messages))

流式处理的基本用法

要进行持续交互，请使用流式处理功能：

from langchain_core.callbacks import StreamingStdOutCallbackHandler

chat = ChatYuan2(
    yuan2_api_base="http://127.0.0.1:8001/v1",
    temperature=1.0,
    model_name="yuan2",
    max_retries=3,
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)
messages = [
    SystemMessage(content="你是个旅游小助手。"),
    HumanMessage(content="给我介绍一下北京有哪些好玩的。"),
]

API 参考：StreamingStdOutCallbackHandler

chat.invoke(messages)

高级功能

与异步调用一起使用

使用非阻塞调用调用模型，如下所示：

async def basic_agenerate():
    chat = ChatYuan2(
        yuan2_api_base="http://127.0.0.1:8001/v1",
        temperature=1.0,
        model_name="yuan2",
        max_retries=3,
    )
    messages = [
        [
            SystemMessage(content="你是个旅游小助手。"),
            HumanMessage(content="给我介绍一下北京有哪些好玩的。"),
        ]
    ]

    result = await chat.agenerate(messages)
    print(result)

import asyncio

asyncio.run(basic_agenerate())

与提示模板一起使用

使用非阻塞调用和使用的聊天模板调用模型，如下所示：

async def ainvoke_with_prompt_template():
    from langchain_core.prompts.chat import (
        ChatPromptTemplate,
    )

    chat = ChatYuan2(
        yuan2_api_base="http://127.0.0.1:8001/v1",
        temperature=1.0,
        model_name="yuan2",
        max_retries=3,
    )
    prompt = ChatPromptTemplate.from_messages(
        [
            ("system", "你是一个诗人，擅长写诗。"),
            ("human", "给我写首诗，主题是{theme}。"),
        ]
    )
    chain = prompt | chat
    result = await chain.ainvoke({"theme": "明月"})
    print(f"type(result): {type(result)}; {result}")

API 参考：ChatPromptTemplate

asyncio.run(ainvoke_with_prompt_template())

流式处理中异步调用的用法

对于具有流式输出的非阻塞调用，请使用 astream 方法：

async def basic_astream():
    chat = ChatYuan2(
        yuan2_api_base="http://127.0.0.1:8001/v1",
        temperature=1.0,
        model_name="yuan2",
        max_retries=3,
    )
    messages = [
        SystemMessage(content="你是个旅游小助手。"),
        HumanMessage(content="给我介绍一下北京有哪些好玩的。"),
    ]
    result = chat.astream(messages)
    async for chunk in result:
        print(chunk.content, end="", flush=True)

import asyncio

asyncio.run(basic_astream())

聊天模型概念指南
聊天模型操作指南