AWS S3 目录
这介绍了如何从一个AWS S3 Directory对象加载文档对象。
%pip install --upgrade --quiet boto3
from langchain_community.document_loaders import S3DirectoryLoader
API 参考:S3目录加载器
loader = S3DirectoryLoader("testing-hwc")
loader.load()
指定前缀
您也可以指定前缀以更精细地控制加载哪些文件。
loader = S3DirectoryLoader("testing-hwc", prefix="fake")
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': 's3://testing-hwc/fake.docx'}, lookup_index=0)]
配置AWS Boto3客户端
您可以配置AWS Boto3 客户端,通过在创建 S3DirectoryLoader 时传递命名参数。 这对于例如当 AWS凭据不能设置为环境变量的情况非常有用。请参见可以进行配置的参数列表。
loader = S3DirectoryLoader(
"testing-hwc", aws_access_key_id="xxxx", aws_secret_access_key="yyyy"
)
loader.load()