Flyte

Flyte is an open-source orchestrator that facilitates building production-grade data and ML pipelines. It is built for scalability and reproducibility, leveraging Kubernetes as its underlying platform.

本笔记本的目的是演示如何将 FlyteCallback 集成到您的 Flyte 任务中，从而有效监控和跟踪您的 LangChain 实验。

安装与设置

通过运行命令 pip install flytekit 安装 Flytekit 库。
通过运行命令 pip install flytekitplugins-envd 安装 Flytekit-Envd 插件。
通过运行命令 pip install langchain 安装 LangChain。
在您的系统上安装 Docker。

Flyte Tasks

Flyte 任务是 Flyte 的基础构建模块。要执行 LangChain 实验，您需要编写定义具体步骤和操作的 Flyte 任务。

注意：快速入门指南提供了详细的分步说明，介绍如何在本地安装 Flyte 并运行您的首个 Flyte 流水线。

首先，导入支持您 LangChain 实验所需的必要依赖项。

import os

from flytekit import ImageSpec, task
from langchain.agents import AgentType, initialize_agent, load_tools
from langchain.callbacks import FlyteCallbackHandler
from langchain.chains import LLMChain
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
from langchain_core.messages import HumanMessage

设置必要的环境变量以使用 OpenAI API 和 Serp API：

# Set OpenAI API key
os.environ["OPENAI_API_KEY"] = "<your_openai_api_key>"

# Set Serp API key
os.environ["SERPAPI_API_KEY"] = "<your_serp_api_key>"

将 <your_openai_api_key> 和 <your_serp_api_key> 替换为从 OpenAI 和 Serp API 获取的相应 API 密钥。

为了确保您的管道具有可重现性，Flyte 任务会被容器化。每个 Flyte 任务都必须关联一个镜像，该镜像可以是整个 Flyte 工作流共享的，也可以为每个任务单独提供。

为了简化为每个Flyte任务提供所需依赖项的过程，您可以初始化一个 ImageSpec 对象。这种方法会自动触发Docker构建，从而无需用户手动创建Docker镜像。

custom_image = ImageSpec(
    name="langchain-flyte",
    packages=[
        "langchain",
        "openai",
        "spacy",
        "https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.5.0/en_core_web_sm-3.5.0.tar.gz",
        "textstat",
        "google-search-results",
    ],
    registry="<your-registry>",
)

您可以灵活地将Docker镜像推送到您偏好的注册表。 Docker Hub 或 GitHub容器注册表（GHCR）是一个方便的起点选项。

选择注册表后，你可以继续创建 Flyte 任务，将 LangChain 指标记录到 Flyte Deck 中。

以下示例展示了与 OpenAI LLM、链以及带有工具的代理相关的任务：

LLM

@task(disable_deck=False, container_image=custom_image)
def langchain_llm() -> str:
    llm = ChatOpenAI(
        model_name="gpt-3.5-turbo",
        temperature=0.2,
        callbacks=[FlyteCallbackHandler()],
    )
    return llm.invoke([HumanMessage(content="Tell me a joke")]).content

Chains

@task(disable_deck=False, container_image=custom_image)
def langchain_chain() -> list[dict[str, str]]:
    template = """You are a playwright. Given the title of play, it is your job to write a synopsis for that title.
Title: {title}
Playwright: This is a synopsis for the above play:"""
    llm = ChatOpenAI(
        model_name="gpt-3.5-turbo",
        temperature=0,
        callbacks=[FlyteCallbackHandler()],
    )
    prompt_template = PromptTemplate(input_variables=["title"], template=template)
    synopsis_chain = LLMChain(
        llm=llm, prompt=prompt_template, callbacks=[FlyteCallbackHandler()]
    )
    test_prompts = [
        {
            "title": "documentary about good video games that push the boundary of game design"
        },
    ]
    return synopsis_chain.apply(test_prompts)

代理

@task(disable_deck=False, container_image=custom_image)
def langchain_agent() -> str:
    llm = OpenAI(
        model_name="gpt-3.5-turbo",
        temperature=0,
        callbacks=[FlyteCallbackHandler()],
    )
    tools = load_tools(
        ["serpapi", "llm-math"], llm=llm, callbacks=[FlyteCallbackHandler()]
    )
    agent = initialize_agent(
        tools,
        llm,
        agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
        callbacks=[FlyteCallbackHandler()],
        verbose=True,
    )
    return agent.run(
        "Who is Leonardo DiCaprio's girlfriend? Could you calculate her current age and raise it to the power of 0.43?"
    )

这些任务可作为您在 Flyte 中运行 LangChain 实验的起点。

在Kubernetes上执行Flyte任务

要在已配置的 Flyte 后端上执行 Flyte 任务，请使用以下命令：

pyflyte run --image <your-image> langchain_flyte.py langchain_llm

此命令将启动在 Flyte 后端上执行 langchain_llm 任务。您可以以类似方式触发其余两个任务。

指标将在 Flyte UI 上按如下方式显示：

Screenshot of Flyte Deck showing LangChain metrics and a dependency tree visualization.

安装与设置​

Flyte Tasks​

LLM​

Chains​

代理​

在Kubernetes上执行Flyte任务​

安装与设置

Flyte Tasks

LLM

Chains

代理

在Kubernetes上执行Flyte任务