Skip to main content
在 GitHub 上打开

ScrapeGraph AI

ScrapeGraph AI 是一项提供 AI 驱动的 Web 抓取功能的服务。 它提供了用于提取结构化数据、将网页转换为 Markdown 和处理本地 HTML 内容的工具 使用自然语言提示。

安装和设置

安装所需的软件包:

pip install langchain-scrapegraph

设置您的 API 密钥:

export SGAI_API_KEY="your-scrapegraph-api-key"

工具

请参阅使用示例

有四种工具可用:

from langchain_scrapegraph.tools import (
SmartScraperTool, # Extract structured data from websites
MarkdownifyTool, # Convert webpages to markdown
LocalScraperTool, # Process local HTML content
GetCreditsTool, # Check remaining API credits
)

每个工具都有特定的用途:

  • SmartScraperTool:从给定 URL、提示和可选输出架构的网站中提取结构化数据
  • MarkdownifyTool:将任何网页转换为干净的 markdown 格式
  • LocalScraperTool:从本地 HTML 文件中提取结构化数据,给定提示和可选输出架构
  • GetCreditsTool:检查您剩余的 ScrapeGraph AI 积分