ScrapeGraph AI
ScrapeGraph AI 是一项提供 AI 驱动的 Web 抓取功能的服务。 它提供了用于提取结构化数据、将网页转换为 Markdown 和处理本地 HTML 内容的工具 使用自然语言提示。
安装和设置
安装所需的软件包:
pip install langchain-scrapegraph
设置您的 API 密钥:
export SGAI_API_KEY="your-scrapegraph-api-key"
工具
请参阅使用示例。
有四种工具可用:
from langchain_scrapegraph.tools import (
SmartScraperTool, # Extract structured data from websites
MarkdownifyTool, # Convert webpages to markdown
LocalScraperTool, # Process local HTML content
GetCreditsTool, # Check remaining API credits
)
每个工具都有特定的用途:
SmartScraperTool:从给定 URL、提示和可选输出架构的网站中提取结构化数据MarkdownifyTool:将任何网页转换为干净的 markdown 格式LocalScraperTool:从本地 HTML 文件中提取结构化数据,给定提示和可选输出架构GetCreditsTool:检查您剩余的 ScrapeGraph AI 积分