Skip to main content
在 GitHub 上打开

HTML to text

html2text 是一个 Python 包,它将HTML转换为干净、易于阅读的普通文本ASCII text.

ASCII 也恰好是有效的Markdown(一种文本到 HTML 格式)。

安装和设置

pip install html2text

文档转换器

请参阅使用示例

from langchain_community.document_loaders import Html2TextTransformer