Skip to main content
Open on GitHub

HTML to text

html2text 是一个 Python 包,它将 HTML 页面转换为干净、易读的纯文本 ASCII text

ASCII 同时也恰好是一个有效的 Markdown(一种文本到 HTML 的格式)。

安装与设置

pip install html2text

文档转换器

查看 使用示例

from langchain_community.document_loaders import Html2TextTransformer