Amazon Bedrock AgentCore 浏览器新增代理配置、配置文件及扩展支持

基本信息

来源: AWS Machine Learning Blog (blog)
发布时间: 2026-02-13T22:57:34+00:00
链接: https://aws.amazon.com/blogs/machine-learning/customize-ai-agent-browsing-with-proxies-profiles-and-extensions-in-amazon-bedrock-agentcore-browser

摘要/简介

今天，我们宣布三项满足这些需求的新能力：代理配置、浏览器配置文件和浏览器扩展。这些功能共同赋予你对 AI 智能体与 Web 交互方式的精细控制。本文将逐一介绍每一项能力，并提供配置示例和实际用例，助你快速上手。

导语

随着 AI 智能体与 Web 交互的场景日益复杂，如何在保障安全的前提下实现精细化管理，已成为开发者关注的重点。本文将介绍 Amazon Bedrock AgentCore Browser 推出的代理配置、浏览器配置文件及浏览器扩展三项新能力，旨在赋予开发者对智能体浏览行为的底层控制权。通过阅读本文，你将了解这些功能的具体配置方法与实际用例，从而构建出更符合业务需求的自动化浏览方案。

摘要

今天，我们宣布推出三项全新功能——代理配置、浏览器配置文件和浏览器扩展，旨在满足您的定制化需求。这些功能共同赋予您精细化的控制能力，助您优化 AI 代理与网络的交互方式。本文将逐一介绍每项功能，并提供配置示例及实际应用场景，帮助您快速上手。

中心观点 这篇文章揭示了AI智能体技术正从单纯的“对话与推理”向“具备环境感知与合规能力的自主作业”演进，通过赋予智能体代理配置、用户画像及扩展插件三大能力，Amazon Bedrock试图解决企业级应用中最后也是最难的“最后一公里”落地问题。

支撑理由与深度评价

1. 从“裸奔”到“伪装”：解决企业合规与地域限制的刚需

[事实陈述] 文章重点介绍了Proxy Configuration（代理配置）功能，允许智能体流量通过特定中间节点传输。
[深度分析] 这是企业级AI落地的“门票”。在金融或医疗领域，直接让AI访问公网是违规的。通过代理，企业不仅能满足数据不出域的安全合规要求，还能解决AI服务在全球不同地域的访问延迟与封锁问题。这标志着AI Agent开始具备现实世界中的“身份属性”和“网络 citizenship（网络公民权）”。
[反例/边界条件] 尽管代理解决了出口问题，但引入代理会增加网络链路的复杂性，可能导致推理延迟显著增加，且代理服务器的单点故障会直接导致Agent任务失败。

2. 环境持久化：对抗“无状态”挑战的关键突破

[事实陈述] 文章提到支持Browser Profiles（浏览器配置文件），即保存Cookies、Session和缓存。
[你的推断] 这一点对于提升Agent的“成功率”至关重要。传统的爬虫或无头浏览器往往每次都是全新的环境，容易触发网站的反爬机制（如WAF）。通过复用Profile，Agent的行为更像一个“老用户”而非“机器”，这对于需要登录状态、多步骤交互的复杂任务（如自动化运维、电商下单）是决定性的。
[反例/边界条件] 环境持久化会带来“状态污染”风险。如果一个Agent处理了A用户的银行数据，由于Profile未隔离或清理不彻底，下一个任务可能泄露前一个任务的上下文信息，造成严重的数据安全隐患。

3. 扩展性：突破大模型“工具使用”的瓶颈

[事实陈述] 文章宣布支持Browser Extensions（浏览器扩展）。
[作者观点] 这是一个极具实用价值的“补丁”。大模型（LLM）的原生能力在处理特定格式（如验证码识别、特定复杂的DOM解析、2FA验证）时往往力不从心。通过加载现成的浏览器扩展（如AdBlocker、专用翻译器或验证码求解器），Agent可以即插即用地获得这些“超能力”，而无需重新训练模型或编写复杂的专用代码。这降低了构建垂直领域Agent的门槛。

4. 行业影响：推动Agent从“玩具”走向“工具”

[你的推断] 此次更新不仅仅是功能堆叠，而是对Agent“鲁棒性”的补全。此前，许多Agent项目失败的原因不是逻辑不对，而是因为IP被封、Session过期或页面结构异常。Bedrock通过提供标准化的基础设施来处理这些“脏活累活”，使得开发者可以专注于业务逻辑，这将加速RPA（机器人流程自动化）与生成式AI的融合。

5. 争议点与潜在风险

[作者观点] 虽然文章未明说，但这套功能组合拳极易被用于“高级灰产”。配合代理和Profile，恶意Agent可以轻易绕过大多数网站的防刷机制，进行大规模数据抓取、舆情操纵或自动化攻击。AWS需要在开放能力与防止滥用之间寻找平衡，这可能会引发未来针对“自动化流量”的监管升级。

实际应用建议

构建隔离池：在利用Profile功能时，必须为不同租户或不同敏感级别的任务建立严格的Profile隔离机制，实施“用完即焚”的沙箱策略。
代理路由策略：不要将所有流量通过单一代理出口。建议根据任务类型（如爬虫 vs. 购物）分流至不同类型的代理IP池，以模拟真实的人类流量分布，避免触发风控。
扩展管理：仅加载必要的白名单扩展。每一个扩展都是一个潜在的攻击面或性能拖累点，避免在Agent环境中加载过于臃肿的第三方插件。

可验证的检查方式

成功率对比测试（指标）：
- 实验：选取10个需要登录且含有反爬机制的网站（如LinkedIn, Amazon），分别使用纯Headless Browser和配置了Bedrock Profile+Proxy的Agent进行访问。
- 观察窗口：连续运行24小时，记录任务完成率（Success Rate）和触发验证码的次数。
- 预期结果：Bedrock方案的任务成功率应显著高于纯方案，且IP封锁率更低。
延迟与性能基准（指标）：
- 实验：测量Agent在开启代理（Proxy）和未开启代理情况下，完成单次页面搜索与解析的平均端到端延迟。
- 观察窗口：监控100次请求的P50和P99延迟。
- 预期结果：开启代理后，P99延迟可能会增加20%-30%，需评估是否在业务可接受范围内。
状态泄露测试（安全性验证）：
- 实验：Agent A访问Site X并登录；随后Agent B（复用同一Profile池或配置）访问Site X。
- 检查点：观察Agent B是否能看到Agent A的个性化内容或处于已登录状态。
- 预期结果

技术分析

基于您提供的文章标题和摘要，以下是对 Amazon Bedrock AgentCore Browser 新增功能（代理配置、浏览器配置文件、浏览器扩展）的深入分析。

深入分析：定制化 AI 智能体浏览体验

1. 核心观点深度解读

文章的主要观点 文章的核心观点在于：AI 智能体不仅仅是被动的查询响应工具，更是需要具备高度环境适应性的“数字劳动者”。 为了让 AI 智能体在企业级和生产环境中真正发挥作用，必须赋予其控制网络环境、维持会话状态以及扩展功能边界的能力。Amazon Bedrock 通过引入代理、配置文件和扩展这三个维度，实现了对 AI 浏览行为从“被动访问”到“主动控制”的转变。

作者想要传达的核心思想 作者传达了一种**“企业级环境适配”**的思想。通用的网页抓取或简单的 API 调用已无法满足复杂业务需求。企业需要 AI 智能体能够像真实员工一样，通过特定的 IP 地址（代理）访问地域受限内容，保持登录状态和个性化设置（配置文件），并具备特定的业务逻辑处理能力（扩展）。这标志着 AI 智能体正从玩具级应用向具备独立操作系统的“数字员工”进化。

观点的创新性和深度 这一观点的创新性在于解耦了 AI 推理能力与浏览器环境上下文。过去，我们关注大模型的智商（推理能力），现在关注大模型的“身体”和“工具”（浏览器环境）。深度在于承认了 Web 的复杂性：防火墙、反爬虫机制、多用户环境等现实约束，并提供了系统性的工程解决方案，而非仅仅依靠模型去“猜测”如何处理。

为什么这个观点重要 这一观点至关重要，因为它解决了 AI 落地“最后一公里”的信任与兼容性问题。

合规性与安全：通过代理，企业可以确保数据流量符合审计要求。
状态持久化：没有配置文件，AI 就是无状态的流浪者，无法处理复杂的、需要登录的工作流。
可扩展性：允许企业将遗留系统或特定的 Web 逻辑封装为扩展，使得 AI 能够操作那些未提供 API 的老旧系统。

2. 关键技术要点

涉及的关键技术或概念

AgentCore Browser：Bedrock 中负责执行网页导航和内容提取的底层引擎。
Proxy Configuration（代理配置）：通过中间服务器路由 AI 流量的技术。
Browser Profiles（浏览器配置文件）：类似于 Chrome 的 User Profile，包含 Cookies、缓存、历史记录和指纹信息。
Browser Extensions（浏览器扩展）：基于 Chromium 标准的插件系统，用于注入自定义 JavaScript 或 CSS。

技术原理和实现方式

代理原理：在 HTTP 请求层面，AgentCore 不直接连接目标网站，而是通过配置的 SOCKS5/HTTP 代理服务器进行隧道传输。这使得目标网站看到的 IP 是代理服务器的 IP。
配置文件隔离：利用 Chromium 的多用户架构，为每个 AI 实例分配独立的用户数据目录。这使得 AI 可以同时以“用户A”和“用户B”的身份访问同一站点，互不干扰，且各自保留 Session。
扩展注入：通过 Manifest V3 标准，允许开发者在页面加载前注入自定义脚本。这些脚本可以在 DOM 渲染前修改页面结构，或拦截特定 API 请求，辅助 AI 更好地解析页面。

技术难点和解决方案

难点：反机器人检测。现代网站使用 WAF（如 Cloudflare, Akamai）检测无头浏览器。
- 解决方案：使用配置文件可以模拟真实用户的浏览器指纹（Canvas, WebGL 等），配合代理模拟真实 IP，极大降低了被封禁的风险。
难点：动态内容渲染。AI 往往无法直接读取 SPA（单页应用）中通过 JS 动态加载的内容。
- 解决方案：扩展可以编写特定的等待逻辑或数据提取脚本，将动态数据“翻译”成 AI 容易理解的静态 HTML 或 JSON 格式。

技术创新点分析 最大的创新在于将浏览器工程能力无缝集成到 AI 编排层。以前开发者需要编写复杂的 Puppeteer 或 Playwright 脚本来辅助 LLM，现在 Bedrock 原生支持这些配置，降低了“AI + RPA（流程自动化）”的开发门槛。

3. 实际应用价值

对实际工作的指导意义 这意味着开发者不再需要为了“登录”或“换 IP”而编写繁琐的胶水代码。可以将精力集中在业务逻辑上，让 AI 专注于决策，而环境配置交给基础设施。

可以应用到哪些场景

全球电商价格监控：使用不同国家的代理，模拟当地用户查询商品价格，避免被价格歧视算法检测。
自动化审计与合规：以特定权限的配置文件访问内部系统，记录操作日志，确保 AI 的行为符合企业安全策略。
社交媒体管理：利用配置文件保持多个社交媒体账号的登录状态，AI 可以直接发布内容或回复私信，而无需每次重新登录。
遗留系统集成：开发一个浏览器扩展，将旧版 ERP 系统的 HTML 表单转化为 API 供 AI 调用。

需要注意的问题

隐私泄露：配置文件中可能包含敏感的认证 Token，必须确保这些存储在 Bedrock 中的数据是加密的。
扩展权限：恶意的扩展可能会窃取 AI 正在浏览的数据，需要对扩展代码进行严格审查。

实施建议 在实施时，应采用“最小权限原则”。例如，代理仅用于特定业务流，配置文件在使用后应自动清除敏感数据，扩展应仅限于必要的 DOM 操作。

4. 行业影响分析

对行业的启示 这一举措预示着AI Agent 基础设施正在“垂直化”和“精细化”。通用的 API 调用无法满足复杂的现实世界需求，云厂商开始比拼谁能提供更深度的系统集成能力（浏览器、操作系统、数据库）。

可能带来的变革 它将加速 “自主 AI” 的普及。以前 AI 只能“读”网页，现在它可以像人一样“生活”在网页中（保持登录、记住偏好、使用工具）。这将催生新一代的“个人助理”，真正意义上的替用户管理复杂的数字生活。

相关领域的发展趋势

RPA 与 AI 的融合：传统的 RPA（UiPath, Blue Prism）将面临来自 AI Agent 的巨大挑战。AI 不再需要硬编码流程，而是通过浏览器上下文理解意图。
反爬虫军备竞赛升级：随着 AI 能够利用代理和 Profile 伪装，网站的反爬虫技术将不得不升级，不仅检测 IP，还要检测鼠标轨迹、打字节奏等更深层的行为特征。

对行业格局的影响 Amazon Bedrock 通过这些功能，进一步巩固了其在企业级 AI 市场的地位。对于依赖简单爬虫工具的小型初创公司来说，这构成了降维打击，因为它们很难提供如此稳定和合规的浏览器环境管理能力。

5. 延伸思考

引发的其他思考

数字身份的归属权：如果 AI 拥有完美的 Profile 和历史记录，它是否在法律上构成了某种形式的“数字人”？当 AI 使用代理进行操作时，法律责任由谁承担？
浏览器指纹的对抗：未来的 Web 可能会要求更严格的人类验证（如 Passkeys），AI 如何通过浏览器扩展配合硬件密钥进行验证？

可以拓展的方向

视觉与浏览的结合：结合多模态模型（如 Claude 3.5 Sonnet 或 GPT-4o），利用浏览器扩展进行截图，让 AI “看”页面并进行视觉定位，而不仅仅是解析 DOM。
移动端 Profile：目前的 Profile 主要针对桌面浏览器。未来是否会支持移动端 User-Agent 和触摸事件模拟，以欺骗移动端网页？

需要进一步研究的问题

如何在分布式 AI 系统中同步浏览器状态？（例如一个 AI 在浏览器 A 登录，另一个 AI 在浏览器 B 如何感知？）
扩展的沙箱机制如何防止恶意网页通过 XSS 攻击 AI 的扩展接口？

6. 实践建议

如何应用到自己的项目

评估需求：检查你的 AI 应用是否遇到了 403 Forbidden（IP 封禁）或 Session 丢失（重复登录）问题。如果是，这三项功能是必选项。
构建代理池：不要使用单一代理。建立住宅 IP 池，并在 Bedrock Agent 中配置轮换策略。

具体的行动建议

开发调试扩展：编写一个简单的 Chrome 扩展，用于在页面上高亮显示 AI 当前关注的元素，这对于调试 AI 的行为逻辑非常有帮助。
配置文件模板化：为不同的业务场景（如“采购员”、“审计员”）预配置好浏览器 Profile 模板，包含必要的书签和 Cookie。

需要补充的知识

深入理解 HTTP/SOCKS 代理协议。
学习 Chrome Extension Manifest V3 开发规范。
掌握 Chromium 的启动参数（如 --headless, --no-sandbox）。

实践中的注意事项

并发限制：浏览器 Profile 是资源密集型的，要注意并发 Agent 的数量，避免撑爆内存。
数据隔离：确保不同任务使用的代理和 Profile 是物理隔离或逻辑隔离的，防止数据交叉污染（例如，一个 AI 查到的 Cookie 被另一个 AI 误用）。

7. 案例分析

结合实际案例说明 场景：一家跨国供应链管理公司使用 AI 监控全球供应商的发货状态。

旧方案：AI 直接请求供应商网站，导致频繁触发 IP 封禁，且无法处理复杂的验证码，只能人工介入。
新方案（Bedrock + Proxy + Profile + Extension）：
1. Proxy：配置对应供应商所在国家（如中国、越南）的住宅 IP，确保访问合规且不被封。
2. Profile：为每个供应商账号创建独立的 Profile，保持登录状态，避免每次都验证码。
3. Extension：开发扩展，当检测到页面出现“发货单号”时，自动提取并格式化为 JSON，直接传给 LLM 分析，无需 LLM 理解复杂的网页布局。

成功案例分析 Klarna（金融支付）：虽然未明确使用 Bedrock，但其 AI 助手通过类似的深度集成技术，处理了 2/3 的客户服务工作。成功的关键在于能够像真实员工一样操作后台系统，这离不开对浏览器环境的精细控制。

失败案例反思 某初创公司试图用 AI 批量抓取 LinkedIn 数据。失败原因：忽视了 LinkedIn 强大的反爬虫机制（主要是针对无头浏览器的指纹检测）。教训：仅仅使用代理是不够的，必须配合高质量的 Profile（伪装指纹）和拟人化的操作延迟，这正是 Bedrock 新功能试图解决的痛点。

8. 哲学与逻辑：论证地图

中心命题 为了使 AI 智能体在复杂的 Web 环境中具备企业级的可靠性与功能性，必须通过代理、配置文件和扩展对其浏览器环境进行细粒度的定制控制。

最佳实践

最佳实践指南

实践 1：通过代理配置实现严格的网络隔离与地理围栏

说明: 在处理敏感数据或需要遵守特定地区法规（如 GDPR）时，直接让 AI 代理访问公网存在风险。通过配置 HTTP/HTTPS 代理，可以控制 AgentCore Browser 的出口流量，确保所有浏览请求都经过受信任的企业网络节点，并允许通过 IP 地址白名单限制目标网站的访问权限。

实施步骤:

在 Bedrock Agent 配置中，指定代理服务器的终端节点（Endpoint）和端口。
配置身份验证（如需要），使用 AWS Secrets Manager 存储代理的用户名和密码。
设置网络策略，确保代理服务器仅允许访问特定业务相关的域名或 IP 范围。

注意事项:

确保代理服务器具有高可用性，以免成为 AI 代理任务的单点故障。
监控代理日志以检测异常流量模式或潜在的数据泄露尝试。

实践 2：利用用户配置文件管理会话状态与身份验证

说明: 许多网站需要登录才能访问完整内容，或者会根据用户历史记录显示个性化内容。利用浏览器配置文件功能，可以为 AI 代理创建持久化的会话上下文，使其能够保持登录状态、存储 Cookie 并处理多因素认证（MFA），从而模拟真实用户行为。

实施步骤:

创建专用的浏览器配置文件，并将其与特定的 S3 存储桶关联以保存状态数据。
在代理任务开始前，通过脚本或手动方式预先完成目标网站的登录流程。
配置 AgentCore Browser 在执行任务时加载该特定的用户配置文件。

注意事项:

定期轮换配置文件中存储的凭据，避免因账号泄露导致的安全风险。
注意目标网站的反机器人策略，确保配置文件的指纹（如 User-Agent）符合正常用户特征。

实践 3：通过浏览器扩展增强数据提取与解析能力

说明: 标准的 HTML 解析可能无法有效处理复杂的单页应用（SPA）或动态加载的内容。通过安装自定义浏览器扩展（如 AdBlockers、自定义脚本执行器或特定的格式化工具），可以修改网页 DOM 结构或拦截网络请求，从而简化 AI 代理提取结构化数据的过程。

实施步骤:

开发或获取符合隐私要求的扩展程序（.crx 文件或未打包的源代码）。
将扩展文件上传至 S3 存储桶，并确保 Bedrock Agent 具有读取权限。
在创建浏览器会话时，指定需要加载的扩展列表。

注意事项:

仅安装经过审计的扩展，防止恶意代码窃取敏感数据。
扩展可能会增加页面加载时间，需在超时设置中预留缓冲时间。

实践 4：实施超时控制与重试机制以处理不稳定的网页

说明: 互联网环境瞬息万变，目标网站可能会出现响应缓慢、挂起或返回 5xx 错误的情况。如果没有合理的超时和重试策略，AI 代理可能会长时间挂起等待响应，消耗宝贵的计算资源并导致任务失败。

实施步骤:

根据目标网页的平均加载时间，为每个浏览步骤设置合理的最大超时时间（例如 30 秒）。
在 Agent 的 Prompt 或工作流中配置指数退避重试逻辑，例如在失败后等待 2s、4s、8s 再重试。
定义明确的失败退出条件，例如连续 3 次失败后终止任务并通知人工介入。

注意事项:

避免设置过于激进的超时时间，以免在慢速网站上误判为失败。
对于动态内容，建议结合等待元素出现的逻辑，而非仅仅依赖固定的时间超时。

实践 5：优化 Prompt 指令以减少不必要的页面交互

说明: AI 代理的浏览成本与页面加载和 JavaScript 执行的次数直接相关。模糊或过于宽泛的指令会导致代理在无关的页面上徘徊，点击无效链接。优化 Prompt 可以让代理更直接地定位目标信息。

实施步骤:

在 Prompt 中明确指定目标 URL 或具体的导航路径，而不是让代理自行搜索。
指示代理仅提取必要的信息，并限制其点击链接的深度（例如 “不要点击超过 2 层链接”）。
使用结构化的输出指令（如 JSON 格式），迫使代理专注于数据提取而非浏览探索。

注意事项:

定期审查代理的执行轨迹，识别并修正导致无效浏览的指令模式。
平衡指令的严格性与灵活性，以免因路径变更导致任务无法完成。

实践 6：建立结构化的数据输出与验证流程

说明: 从浏览器获取的数据通常是非结构化的文本或 HTML。为了确保下游系统能够有效利用这些数据，必须在代理层面建立标准化的输出格式，并实施基础的数据验证，确保提取内容的准确性。

实施步骤:

在系统提示词中定义

学习要点

Amazon Bedrock AgentCore Browser 支持通过配置代理服务器来隐藏 IP 地址并绕过地理限制，从而确保 AI 智能体在访问网页时的合规性与稳定性。
利用浏览器配置文件可以隔离会话状态并模拟特定用户环境，使 AI 智能体能够访问需要登录凭据的个性化内容。
系统支持无缝集成第三方浏览器扩展，允许开发者通过定制插件来增强 AI 智能体处理特定网页任务的能力。
该工具通过自动化网页交互显著提升了 AI 智能体在执行复杂浏览任务时的效率与准确性。
开发者可以通过精细化的配置选项，在保障安全性的前提下灵活控制智能体的网络访问行为。
这一解决方案有效解决了 AI 智能体在动态网页内容抓取和验证码处理方面的常见技术挑战。

引用

注：文中事实性信息以以上引用为准；观点与推断为 AI Stack 的分析。

站内链接

分类： AI 工程 / 大模型
标签： Amazon Bedrock / AgentCore / AI Agent / 浏览器自动化 / 代理配置 / 浏览器扩展 / 配置文件 / AWS
场景： AI/ML项目

Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持
Amazon Bedrock AgentCore 浏览器更新：新增代理、配置文件及扩展支持
Amazon Bedrock AgentCore 浏览器支持代理、配置文件及扩展
Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持
Amazon Bedrock AgentCore Browser 推出代理、配置文件与扩展支持 本文由 AI Stack 自动生成，包含深度分析与方法论思考。

AI Stack

Amazon Bedrock AgentCore 浏览器新增代理配置、配置文件及扩展支持