提供商更多HTML 转文本在此页面上HTML to text html2text 是一个 Python 包,它将 HTML 页面转换为干净、易读的纯文本 ASCII text。 ASCII 同时也恰好是一个有效的 Markdown(一种文本到 HTML 的格式)。 安装与设置¶ pip install html2text 文档转换器 查看 使用示例。 from langchain_community.document_loaders import Html2TextTransformer