Browserbase
Browserbase 是一个开发者平台,用于可靠地运行、管理和监控无头浏览器。
使用以下功能增强您的 AI 数据检索:
- 无服务器基础设施 提供可靠的浏览器,用于从复杂的用户界面中提取数据
- 隐身模式,包含指纹识别策略和自动验证码求解功能
- 会话调试器 用于检查您的浏览器会话,包含网络时间线和日志
- 实时调试 以快速调试您的自动化流程
安装与设置¶
- 从 browserbase.com 获取 API 密钥和项目 ID,并将其设置为环境变量(
BROWSERBASE_API_KEY,BROWSERBASE_PROJECT_ID)。 - 安装 Browserbase SDK:
%pip install browserbase
加载文档
您可以使用BrowserbaseLoader将网页加载到LangChain中。可选地,可以设置text_content参数以将页面转换为纯文本表示。
import os
from langchain_community.document_loaders import BrowserbaseLoader
load_dotenv()
BROWSERBASE_API_KEY = os.getenv("BROWSERBASE_API_KEY")
BROWSERBASE_PROJECT_ID = os.getenv("BROWSERBASE_PROJECT_ID")
API 参考:BrowserbaseLoader
loader = BrowserbaseLoader(
api_key=BROWSERBASE_API_KEY,
project_id=BROWSERBASE_PROJECT_ID,
urls=[
"https://example.com",
],
# Text mode
text_content=False,
)
docs = loader.load()
print(docs[0].page_content[:61])
Loader Options
urls必须。要获取的URL列表。text_content仅检索文本内容。默认是False。api_key浏览器基础API密钥。默认是BROWSERBASE_API_KEY环境变量。project_id浏览器基础项目ID。默认是BROWSERBASE_PROJECT_ID环境变量。session_id可选。提供一个现有的会话ID。proxy可选. 启用/禁用代理。