提供商更多HTML 转文本本页内容HTML to text html2text 是一个 Python 包,它将HTML转换为干净、易于阅读的普通文本ASCII text. ASCII 也恰好是有效的Markdown(一种文本到 HTML 格式)。 安装和设置 pip install html2text 文档转换器 请参阅使用示例。 from langchain_community.document_loaders import Html2TextTransformer