Skip to main content

如何评估现有实验(仅限 Python)

目前,对现有实验的评估仅在 Python SDK 中受支持。

如果您已经运行过实验并希望添加额外的评估指标, 您可以像之前一样使用 evaluate() / aevaluate() 方法将任何评估器应用到实验中。 只需传入实验名称/ID,而不是目标函数:

from langsmith import evaluate

def always_half(inputs: dict, outputs: dict) -> float:
return 0.5

experiment_name = "my-experiment:abc" # Replace with an actual experiment name or ID
evaluate(experiment_name, evaluators=[always_half])

此页面有帮助吗?


您可以留下详细的反馈 在 GitHub 上