Skip to main content

评估指南

这些指南解答“我如何……?”格式的问题。 它们以目标为导向且具体明确,旨在帮助您完成特定任务。 如需概念性解释,请参阅 概念指南。 如需端到端的分步教程,请查看 教程。 如需每个类和函数的完整描述,请参阅 API 参考

关键特性

离线评估

在部署之前评估并改进您的应用程序。

运行评估

定义评估器

配置评估数据

配置评估作业

向数据集添加默认评估器

为所有实验设置评估器,这些评估器会自动针对数据集运行。

测试集成

使用您喜欢的测试工具运行评估。

在线评估

在真实生产数据上评估和监控您系统的实时性能。

分析实验结果

使用 UI 和 API 来理解您的实验结果。

数据集管理

管理 LangSmith 中用于评估的数据集。

标注队列和人类反馈

从领域专家和用户那里收集反馈,以改进您的应用程序。


此页面有帮助吗?


您可以留下详细的反馈 在 GitHub 上