Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持

基本信息

来源: AWS Machine Learning Blog (blog)
发布时间: 2026-02-13T22:57:34+00:00
链接: https://aws.amazon.com/blogs/machine-learning/customize-ai-agent-browsing-with-proxies-profiles-and-extensions-in-amazon-bedrock-agentcore-browser

摘要/简介

今天，我们宣布三项满足这些需求的新能力：代理配置、浏览器配置文件和浏览器扩展。这些功能共同赋予你对 AI 智能体如何与 Web 交互的精细控制。本文将逐一介绍每一项能力，并提供配置示例和实际用例，助你快速上手。

导语

随着 AI 智能体深入 Web 交互场景，如何确保其行为合规且符合业务逻辑成为关键挑战。Amazon Bedrock AgentCore Browser 新增的代理配置、浏览器配置文件及扩展功能，正是为了解决这一痛点，赋予开发者对智能体网络行为的精细控制权。本文将逐一解析这些能力，并提供配置示例与实际用例，助你快速构建安全、可控的智能浏览解决方案。

摘要

本文介绍了 Amazon Bedrock AgentCore Browser 浏览器新增的三项功能，旨在让用户精细定制 AI 智能体与网络的交互方式：

代理配置：允许通过代理服务器来管理智能体的网络流量。
浏览器配置文件：支持使用特定的配置文件来隔离和管理浏览会话。
浏览器扩展：允许安装浏览器扩展以增强智能体的浏览能力。

文章将结合实际的配置示例和用例，详细讲解如何利用这些功能来实现对 AI Agent 浏览行为的定制化控制。

评价报告：Amazon Bedrock AgentCore Browser 新增功能的技术与行业分析

1. 中心观点

文章核心观点在于：通过引入代理配置、浏览器配置文件和扩展程序这三大企业级管控能力，Amazon Bedrock 试图将 AI 智能体从简单的“网页抓取者”升级为具备身份管理、合规审计和复杂交互能力的“企业级数字员工”，从而解决大模型落地生产环境时的安全与隔离痛点。

2. 深度评价与支撑理由

支撑理由一：从“无状态浏览”向“有状态工作流”的技术跨越

[事实陈述] 文章强调了浏览器配置文件的作用，允许保存 Cookies、Session 和缓存。
[作者观点] 这标志着 AI Agent 交互模式的根本性转变。传统的 LLM 调用通常是无状态的，而现实世界的业务流程（如电商下单、SaaS 管理）高度依赖状态保持。Profile 功能使得 Agent 能够模拟真实用户的持续会话，处理多步骤任务，这是实现复杂自动化工作的基石。
[你的推断] 这一功能将显著降低 Agent 在处理登录验证流或多跳页面跳转时的失败率。

支撑理由二：企业合规与安全边界的必要妥协

[事实陈述] 引入代理配置和扩展程序支持。
[作者观点] 在企业级应用中，直接放行 AI Agent 访问公网或内部网是巨大的安全风险。Proxy 支持使得流量可以被审计和过滤，符合企业安全策略；Extensions 则允许企业注入自定义的安全逻辑（如数据脱敏插件）或验证码处理逻辑。这是为了让 AI 融入企业现有 IT 治理框架所做的必要“补丁”。

支撑理由三：扩展性打破了原生浏览器的功能黑盒

[事实陈述] 文章提到支持安装浏览器扩展。
[作者观点] 这是一个极具前瞻性的架构设计。原生浏览器的行为是固定的，但通过 Extensions，开发者可以无限扩展 Agent 的能力边界（例如安装专门的截图插件、PDF 解析插件或特定的 RPA 辅助脚本）。这实际上构建了一个 Agent 的“插件生态系统”，使得 Bedrock Agent 不再完全依赖底层模型的更新来获取新能力。

反例与边界条件：

[反例/边界 1：性能损耗] 每一个额外的层级（代理路由、扩展加载、Profile 读写）都会增加网络延迟和计算开销。对于对实时性要求极高的场景（如高频交易辅助或实时客服），这种架构的响应速度可能无法接受。
[反例/边界 2：复杂性陷阱] 管理 Profile 和 Extensions 本身就是一个运维难题。如果 Agent 需要模拟 1000 个不同的用户身份，维护 1000 个 Profile 的状态一致性、过期时间和指纹反关联将带来巨大的 DevOps 成本，甚至可能因为指纹特征过于明显而被目标网站识别并封禁。

3. 维度详细分析

1. 内容深度与论证严谨性 文章属于典型的“功能发布通告”。其论证逻辑在于“提出需求（企业管控） -> 给出方案（三大功能）”。虽然技术实现细节（如指纹管理机制、反爬虫对抗能力）披露较少，但紧扣企业级落地最核心的“安全”与“状态管理”痛点，逻辑闭环完整。深度在于它不仅仅是在讲 API，而是在讲如何将 AI 能力“工程化”嵌入现有架构。

2. 实用价值 价值极高。对于正在构建 Agentic Workflow 的开发者而言，这解决了最头疼的“环境隔离”问题。例如，一个电商比价 Agent，现在可以通过不同的 Profiles 同时模拟“企业采购员”和“普通消费者”进行比价，而不会互相干扰或触发风控。

3. 创新性 将传统的浏览器自动化技术（Puppeteer/Selenium 的概念）与 LLM Agent 平台深度融合，并将其 Serverless 化、托管化。这并非全新的技术发明，而是工程架构上的创新，降低了开发者维护复杂浏览器基础设施的门槛。

4. 行业影响 这可能会加速 AI Agent 从“玩具”向“工具”的转化。随着竞争对手（如 Microsoft Copilot、LangChain 生态）也在加强类似的集成能力，Bedrock 的这一举措确立了“企业级浏览器自动化”作为 Agent 基础设施的标准配置。

5. 争议点

版权与爬虫伦理： 赋予 Agent 更强的伪装和穿透能力，可能会加剧网站与 AI 机器人之间的军备竞赛。网站可能会加强针对 Headless Browser 的检测。
安全双刃剑： Extensions 功能如果被滥用，可能会成为攻击者注入恶意代码进入企业内网的通道。

4. 实际应用建议

用于复杂的 B2B 自动化场景： 不要仅用于简单的信息检索。应利用 Profile 功能处理需要登录、多步骤操作的 ERP 或 CRM 系统自动化任务。
建立严格的扩展审计机制： 在生产环境部署 Extensions 前，必须建立代码审查流程，防止第三方扩展窃取敏感数据。
监控代理延迟： 在启用 Proxy 后，务必在 Prompt 中增加对超时的容错处理，或调整 Agent 的重试策略。

5. 可验证的检查方式

为了验证这些功能的实际效果，建议进行以下检查：

[指标检查] 状态保持成功率： 构建一个需要登录后 3 步跳转的测试流程，对比使用 Profile 与不使用 Profile 在 100 �

技术分析

基于您提供的文章标题和摘要，我们将对 Amazon Bedrock AgentCore Browser 推出的三项新功能（代理配置、浏览器配置文件、浏览器扩展）进行深度剖析。这篇文章虽然篇幅可能不长，但它标志着 AI Agent 从“简单的对话模型”向“具备完整工程化能力的数字员工”演进的关键一步。

以下是详细分析：

深度分析：定制化 AI 智能体浏览体验——Amazon Bedrock AgentCore Browser 的新维度

1. 核心观点深度解读

主要观点

文章的核心观点是：为了让 AI Agent 在企业级生产环境中真正可用，必须赋予其与人类员工同等水平的网络环境控制能力，包括合规的出口管理、独立的会话上下文以及特定功能的扩展加载。

核心思想

作者试图传达的核心思想是**“环境定制化”**。过往的 AI 浏览器工具往往运行在一个“裸奔”的通用沙箱中，无法适应复杂的现实世界网络拓扑和企业安全规范。通过引入 Proxy（代理）、Profiles（配置文件）和 Extensions（扩展），Amazon 将 Agent 的浏览行为从“随机访问”转变为“可控、可管、可审计”的企业级操作。

创新性与深度

这不仅仅是功能的堆叠，而是将浏览器工程化的最佳实践引入了 AI 领域。

深度：它触及了 AI 落地的痛点——安全与隔离。没有 Profile，多租户环境下的 Agent 会互相干扰（例如登录状态混淆）；没有 Proxy，企业无法允许 Agent 访问内网资源；没有 Extension，Agent 难以处理复杂的网页交互（如验证码、特定 DOM 解析）。
创新性：将传统的浏览器自动化技术（如 Puppeteer/Selenium 的概念）与 LLM 的推理能力无缝集成，并托管在 Bedrock 这样的无服务器架构中。

为什么重要

随着 AI Agent 从“阅读”网页转向“操作”网页，安全风险和复杂性呈指数级上升。如果不解决这些问题，企业不敢让 AI 访问核心业务系统，也不敢赋予其过高的权限。这三项功能是解锁 AI Agent 在金融、医疗、内网运维等敏感领域应用的关键钥匙。

2. 关键技术要点

涉及的关键技术概念

Proxy Configuration (代理配置)：支持 HTTP/HTTPS/SOCKS 代理，用于流量转发、监控和地理位置伪装。
Browser Profiles (浏览器配置文件)：类似于 Chrome 的 User Profile，隔离 Cookies、Cache、History 和 Session 数据。
Browser Extensions (浏览器扩展)：支持加载 CRX 文件，允许注入自定义 JavaScript 脚本或修改网页 DOM。

技术原理与实现方式

代理原理：在 AgentCore Browser 的底层网络栈中配置出口代理。技术实现上可能涉及在浏览器启动参数中注入 --proxy-server，或在容器网络层进行流量拦截。
配置文件隔离：技术实现上，每次浏览任务启动时，系统会分配一个独立的用户数据目录。这意味着 Agent A 登录了 Amazon，Agent B 在同一个浏览器实例中看到的依然是未登录状态，彻底解决了“状态污染”问题。
扩展注入：利用 Chromium 扩展 API。在 Bedrock 场景下，这允许用户预装特定的扩展（例如广告拦截器、自定义 CSS 注入器、或特定的数据提取辅助工具），使得 Agent 在加载网页时，扩展能够自动预处理页面内容。

技术难点与解决方案

难点：无头浏览器环境下的扩展兼容性。许多扩展依赖 GUI 交互。
解决：Bedrock 可能限制了需要 GUI 的扩展，或者提供了特定的 API 供扩展与 Agent 通信，而非依赖用户点击。
难点：代理带来的延迟与稳定性。
解决：通常建议配合 VPC 接口终端节点使用，确保流量在内网闭环，不暴露给公网。

技术创新点分析

最大的创新在于声明式配置与动态执行的结合。用户不需要编写 Puppeteer 脚本来“启动浏览器、配置代理、加载扩展”，而是通过 Bedrock Agent 的配置参数直接定义，LLM 自动根据这些约束条件去执行浏览任务。这降低了浏览器自动化的编程门槛。

3. 实际应用价值

对实际工作的指导意义

这意味着开发者可以构建**“懂规矩”的 AI**。以前 AI 可能会被某些网站的防火墙误判为爬虫而封禁，或者无法访问企业内部的 Wiki。现在，通过配置白名单代理和特定的 User-Agent（通过 Profile），AI 可以更稳定地工作。

应用场景

企业内网知识问答：Agent 通过代理连接到企业内网，读取只有内网能访问的文档（如 Jira/Confluence/ServcieNow）。
竞品监控与价格分析：通过住宅代理轮换 IP 地址，模拟真实用户访问电商网站，避免被反爬虫机制识别。
多租户 SaaS 操作：在一个 Bedrock 环境中服务多个客户，利用 Profiles 确保客户 A 的 Agent 不会意外登出客户 B 的账户。
复杂网页自动化：加载特定的辅助扩展，帮助 Agent 理解复杂的 Canvas 图表或特定的 Web 组件。

需要注意的问题

合规性：使用代理（特别是用于隐藏身份的代理）必须符合目标网站的服务条款和当地法律法规。
扩展安全：加载不受信任的扩展可能会窃取 Agent 正在浏览的敏感数据。

实施建议

最小权限原则：为 Agent 配置的代理只应允许访问特定的目标域名，而不是全网通。
定期清理：虽然 Profiles 提供了隔离，但对于敏感任务，建议在任务结束后销毁 Profile 数据，防止数据泄露。

4. 行业影响分析

对行业的启示

这标志着AI Agent 基础设施正在“补课”。早期的 AI Agent 只关注“大脑”（LLM），现在开始关注“手脚”的精细控制。行业将意识到，仅靠 Prompt 是无法解决所有工程问题的，必须依赖底层的浏览器工程能力。

可能带来的变革

从“RAG”到“CAG”：从检索增强生成转向上下文感知生成。Agent 不仅仅是抓取文本，而是带着登录状态、带着特定工具去“体验”网页。
企业级 AI 的合规门槛降低：IT 部门不再视 AI 为不可控的黑盒流量，因为流量可以通过 Proxy 审计，状态可以通过 Profile 隔离。

发展趋势

未来，浏览器将成为 AI Agent 的标准“外设”。我们可能会看到更多针对 AI 优化的浏览器扩展出现（专门为 AI 阅读设计的网页结构化插件）。

5. 延伸思考

拓展方向

指纹识别对抗：既然有了 Profiles，是否意味着 AI 可以更完美地模拟人类指纹（Canvas 指纹、字体列表等）？这将引发一场“AI vs 反作弊”的军备竞赛。
扩展市场：是否会诞生一个“Agent Extension Store”，专门售卖让 AI 更聪明的插件？

需进一步研究的问题

扩展与 LLM 的交互深度：扩展能否直接调用 LLM 的推理能力，还是仅仅修改 DOM？如果扩展能通过 DOM 向 LLM 注入隐藏指令，是否存在安全风险？

6. 实践建议

如何应用到自己的项目

评估网络需求：如果你的 Agent 需要访问内网，立即配置 Proxy；如果需要同时操作多个账号，强制使用 Profiles。
开发专用扩展：不要指望 LLM 能完美解析所有网页。编写一个简单的 Chrome 扩展，将网页上的非结构化数据清洗成 LLM 易读的 JSON 格式，并注入到页面中。

具体行动建议

行动 1：在测试环境中，尝试使用 Profile 功能让 Agent 同时登录两个不同的 Gmail 账号并互发邮件，验证隔离性。
行动 2：编写一个简单的 JS 扩展，将网页背景色改为红色（作为视觉验证），加载到 Bedrock Agent 中，验证 Agent 是否能“看到”变化。

知识补充

需要学习 Chromium 启动参数（如 --load-extension, --proxy-server）。
了解 Selenium/Puppeteer 的基本概念，以便更好地理解 AgentCore Browser 的底层逻辑。

7. 案例分析

成功案例构想：跨国电商数据同步

场景：一家跨国公司需要让 AI 每天检查其在不同国家网站的库存情况。
挑战：不同国家网站有语言障碍，且有 IP 封锁机制。
解决方案：
- Proxy：为不同国家的 Agent 配置当地的数据中心代理或住宅代理。
- Extension：加载一个自动翻译扩展，将页面内容实时翻译为英文，供 LLM 理解。
- Profile：每个国家的爬虫任务使用独立的 Profile，避免 Cookie 污染导致的风控。
结果：AI 成功绕过了地理限制和反爬虫，准确汇报了库存数据。

失败案例反思：未隔离的混乱

场景：一个客服 Agent 同时服务两个客户。
失误：未使用 Browser Profiles。
后果：Agent 在帮客户 A 查询订单时，误操作登入了客户 B 的账户，导致客户 B 的订单被取消，引发严重的隐私泄露事故。

8. 哲学与逻辑：论证地图

中心命题

为了使 AI Agent 能够在复杂、安全敏感的现实世界网络环境中可靠地执行任务，必须赋予其对网络出口、会话状态和功能模块的细粒度控制权。

支撑理由

安全性与合规性：企业网络通常不允许直接公网访问，必须通过代理进行审计和过滤。
- 依据：企业 IT 安全策略（事实）。
状态隔离：AI Agent 在处理多用户或多任务时，必须避免上下文混淆。
- 依据：多租户系统的设计原则（事实）。
环境适应性：现代 Web 极其复杂，标准浏览器无法满足所有定制化解析需求。
- 依据：网页技术的碎片化和反爬虫机制的存在（事实）。

反例与边界条件

反例：对于简单的、一次性的、无状态的信息检索（如仅读取公开的新闻文章），配置这些功能会增加不必要的复杂度和延迟。
边界条件：如果目标网站完全提供结构化 API，使用 Browser 代理本身就是一种反模式，应直接调用 API。

命题性质分析

事实：Bedrock 发布了这些功能。
价值判断：“必须赋予控制权”是基于工程实践和安全性考虑的价值导向。
可检验预测：采用这些配置的企业，其 AI Agent 的任务成功率和稳定性将显著高于未配置的对照组。

立场与验证

立场：支持将浏览器工程化能力作为 AI Agent 的基础设施标配。

最佳实践

最佳实践指南

实践 1：利用代理配置管理网络访问与安全合规

说明: 在构建企业级 AI Agent 时，直接访问公网可能存在安全风险或受限于网络策略。通过配置代理，您可以精细控制 Agent 的流量出口，确保所有浏览活动符合企业的安全合规要求，同时解决 Agent 运行环境可能面临的网络连通性问题（如防火墙限制）。

实施步骤:

在 Amazon Bedrock Agent 配置中，指定可信的 HTTP/HTTPS 代理端点。
确保代理服务器已列入白名单，允许 Bedrock 服务 IP 进行访问。
配置身份验证（如需要），确保 Agent 通过代理时的凭证安全流转。

注意事项: 代理会增加网络延迟，建议对代理服务器进行性能测试，以确保不影响 Agent 的响应速度。

实践 2：使用浏览器配置文件隔离会话与状态

说明: 为了防止不同任务之间的数据污染或“状态泄露”，应为每个 Agent 实例或特定任务类型分配独立的浏览器配置文件。这类似于使用浏览器的无痕模式或独立的用户配置，确保 Cookie、缓存和本地存储不会在无关的会话之间共享。

实施步骤:

定义清晰的配置文件命名规范，例如 agent-task-type-env。
在 Agent 初始化阶段，动态挂载或创建指定的浏览器配置文件目录。
确保配置文件的生命周期与 Agent 任务会话绑定，任务结束后清理或归档。

注意事项: 存储大量配置文件可能会消耗存储空间，建议实施自动清理策略，删除超过特定时间限制的旧配置文件。

实践 3：通过扩展程序增强数据提取与上下文理解

说明: 虽然 AI 模型具备强大的解析能力，但在面对复杂的网页结构（如 Canvas 渲染的图表、混淆的代码）时可能表现不佳。通过安装自定义浏览器扩展，Agent 可以直接读取 DOM 结构、提取隐藏数据或执行自定义 JavaScript，从而获取纯 HTML 无法提供的深度上下文。

实施步骤:

开发或选择无头浏览器兼容的扩展程序。
将扩展程序打包并托管在可访问的存储位置（如 S3 桶）。
在 Bedrock Agent 的浏览器配置中，加载必要的扩展 ID 或路径。

注意事项: 扩展程序会增加页面加载时间和内存消耗。仅加载必需的扩展，避免安装广告拦截器等可能干扰页面正常渲染的工具。

实践 4：实施严格的隐身模式与反爬虫策略

说明: 许多现代网站具备强大的反机器人机制，可能会阻止自动化浏览器的访问。最佳实践是配置浏览器以模仿真实用户行为，包括设置真实的 User-Agent 字符串、管理浏览器指纹，并控制请求频率，以避免被目标网站封禁。

实施步骤:

配置浏览器启动参数，设置通用的且真实的 User-Agent。
禁用或伪装自动化特征（如 navigator.webdriver 属性）。
在 Agent 逻辑中引入随机延迟，模拟人类阅读和操作的时间间隔。

注意事项: 遵守目标网站的 robots.txt 和服务条款。不要试图绕过安全验证机制（如 CAPTCHA）以获取未授权数据。

实践 5：建立基于代理的智能重试与超时机制

说明: 网络波动或目标网站响应慢是常见的故障点。不要让 Agent 因单次请求失败而终止整个工作流。实施具有退避算法的重试机制，可以显著提高 Agent 完成复杂浏览任务的可靠性。

实施步骤:

为浏览器操作设置合理的超时时间（例如页面加载超时 30 秒）。
实现指数退避重试策略，例如首次失败等待 1 秒，第二次等待 2 秒，最多重试 3 次。
在代码层面捕获特定的超时或网络异常，并触发重试逻辑。

注意事项: 避免无限重试导致资源耗尽。必须设置最大重试次数和总超时限制，并在达到限制后优雅地降级或报错。

实践 6：集中管理浏览器日志与调试数据

说明: 当 Agent 产生错误的推理或操作失败时，缺乏可视化使得调试变得困难。最佳实践包括自动捕获并集中存储浏览器控制台日志、网络请求头甚至截图。这些数据对于事后分析 Agent 行为至关重要。

实施步骤:

启用浏览器的详细日志记录选项。
将 Console Logs、Performance Logs 异步发送到 CloudWatch Logs 或 S3。
在关键步骤失败时，自动触发截图保存功能。

注意事项: 日志可能包含敏感的 PII（个人身份信息）数据。务必在传输和存储前对日志进行脱敏处理。

学习要点

通过集成代理、用户配置文件和浏览器扩展，Amazon Bedrock AgentCore Browser 能够模拟真实用户行为并绕过反爬虫检测，从而解决 AI 智能体在访问公开网站时面临的访问受限问题。
利用用户配置文件可以管理 Cookie、指纹和会话状态，使智能体能够保持登录状态并访问需要身份验证的页面，实现更复杂的交互任务。
支持加载自定义浏览器扩展，允许智能体调用第三方工具（如广告拦截器或特定 API 客户端），以增强数据抓取能力或适应特定的网页环境。
使用代理服务器可以智能地路由流量，通过指定 IP 地址的地理位置来访问区域限制内容，并有效防止因高频请求导致的 IP 封禁。
该工具显著提升了 AI 智能体在动态网站上的导航与交互能力，使其能够更精准地提取实时数据，弥补了基础模型训练数据的滞后性。
借助这些定制化功能，企业能够构建更可靠的自动化工作流，用于执行竞品监控、市场趋势分析等需要高度网页兼容性的任务。

引用

注：文中事实性信息以以上引用为准；观点与推断为 AI Stack 的分析。

站内链接

分类： AI 工程 / 开发工具
标签： Amazon Bedrock / AgentCore / AI Agent / 浏览器自动化 / 代理配置 / 浏览器扩展 / 配置文件 / AWS
场景： AI/ML项目

Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持
Amazon Bedrock AgentCore 浏览器新增代理配置、配置文件及扩展支持
Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持
Amazon Bedrock AgentCore 浏览器功能更新：支持代理、配置文件与扩展
Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持 本文由 AI Stack 自动生成，包含深度分析与方法论思考。

Amazon Bedrock AgentCore 浏览器新增代理、配置文件及扩展支持