ScrapeGraph AI
ScrapeGraph AI是提供基于AI的网页抓取能力的服务。 它提供了提取结构化数据、将网页转换为markdown以及使用自然语言提示处理本地HTML内容的工具。
安装与设置¶
安装所需的包:
pip install langchain-scrapegraph
设置您的API密钥:
export SGAI_API_KEY="your-scrapegraph-api-key"
工具
查看 使用示例。
有四个可用的工具:
from langchain_scrapegraph.tools import (
SmartScraperTool, # Extract structured data from websites
MarkdownifyTool, # Convert webpages to markdown
LocalScraperTool, # Process local HTML content
GetCreditsTool, # Check remaining API credits
)
每个工具都有其特定的功能:<br>
SmartScraperTool: 从给定的URL、提示和可选输出结构中提取网页中的结构化数据MarkdownifyTool: 将任何网页转换为干净的Markdown格式LocalScraperTool: 从本地HTML文件中提取结构化数据,给定提示和可选的输出模式GetCreditsTool: 检查剩余的ScrapeGraph AIcredits