Iberdrola 利用 Amazon Bedrock AgentCore 重塑 IT 运营

基本信息

来源: AWS Machine Learning Blog (blog)
发布时间: 2026-02-10T18:31:57+00:00
链接: https://aws.amazon.com/blogs/machine-learning/iberdrola-enhances-it-operations-using-amazon-bedrock-agentcore

摘要/简介

Iberdrola 是全球最大的公用事业公司之一，已采用前沿的人工智能技术，对其在 ServiceNow 中的 IT 运营进行革新。通过与 AWS 合作，Iberdrola 借助 Amazon Bedrock AgentCore 实施了多种智能体架构，重点聚焦三个关键领域：在草拟阶段优化变更请求验证、利用情境智能丰富事件管理，以及通过对话式 AI 简化变更模型选择。这些创新不仅减少了瓶颈，帮助团队加速工单解决，还在全公司范围内确保了数据处理的持续高质量与一致性。

导语

作为全球领先的公用事业企业，Iberdrola 面临着庞大的 IT 运营管理挑战。本文详细介绍了该公司如何通过与 AWS 合作，利用 Amazon Bedrock AgentCore 在 ServiceNow 环境中构建智能体架构，从而优化变更请求验证并简化事件管理流程。阅读本文，您将了解到具体的技术落地路径，以及如何利用生成式 AI 在保障数据质量的前提下，显著提升工单处理效率并消除运营瓶颈。

摘要

Iberdrola（伊维尔德罗拉），作为全球最大的公用事业公司之一，正通过采用尖端的人工智能技术，对其 ServiceNow 平台中的 IT 运营进行彻底革新。

通过与 AWS 的合作，Iberdrola 利用 Amazon Bedrock AgentCore 实施了多种智能体架构，重点优化以下三个关键领域：

优化变更请求验证：在变更请求的草拟阶段提升验证效率。
丰富事件管理：利用情境智能增强事件管理能力。
简化变更模型选择：通过对话式 AI 简化变更模型的选择流程。

这些创新举措成功消除了运营瓶颈，不仅帮助团队加速了工单解决速度，还在整个组织范围内实现了高质量且一致的数据处理。

深度评论：Iberdrola 基于 Amazon Bedrock AgentCore 的 IT 运维实践

核心观点 文章记录了公用事业企业 Iberdrola 通过在 ServiceNow 中集成 Amazon Bedrock AgentCore，尝试将 IT 运维流程从人工操作转向自动化辅助的实践案例。这反映了能源行业在 IT 治理中开始探索生成式 AI 的具体落地路径。

技术架构与业务逻辑分析

1. 多智能体架构的集成方式（事实陈述） 文章指出 Iberdrola 构建了基于 AgentCore 的架构，并将其集成至 ServiceNow 工作流。

技术逻辑： 该方案利用 AgentCore 进行任务编排，将 LLM 的能力与 ServiceNow 的知识库及 CMDB（配置管理数据库）结合。这属于 RAG（检索增强生成）与自动化工具调用的组合应用，旨在通过自然语言接口触发结构化的后台查询或脚本执行。
局限性： 这种集成高度依赖于 ServiceNow 的数据标准化程度及 API 的可用性。对于缺乏标准接口的遗留系统，智能体难以直接获取数据，可能仍需依赖传统的 RPA 或人工介入。

2. 运维效率与知识检索（事实陈述） 文章提到该方案主要针对工单分类、根因分析等场景。

应用价值： 通过将非结构化的自然语言转化为查询指令，系统可辅助运维人员快速定位日志或历史事件，减少了人工检索信息的时间成本。
风险边界： 在处理复杂的分布式系统故障或从未见过的异常情况时，模型可能无法准确归纳根因。此外，自动化修复（如重启服务）存在操作风险，若缺乏严格的权限控制和“人机回路”确认机制，可能导致误操作影响业务连续性。

3. 行业合规与数据安全（基于事实的推断） 作为受监管的公用事业企业，Iberdrola 的选择暗示了其对数据主权的关注。

实施考量： 使用 AWS Bedrock 通常意味着利用其 VPC 端点和数据不出域的承诺。这表明企业倾向于在受控的云环境下利用 AI 能力，而非直接使用公有云通用模型，以符合行业合规要求。
适用性： 这种架构适合具有成熟 IT 团队和预算的大型企业。对于 IT 基础设施较薄弱或预算有限的中小型公用事业公司，此类定制化开发的集成成本较高，可能不具备性价比。

综合评价

内容参考性： 文章提供了一个具体的架构参考，展示了如何利用云厂商 PaaS 能力增强现有 SaaS 平台的自动化水平。
落地挑战： 文章主要展示了应用潜力，但在实际落地中，模型输出的稳定性、Prompt 的维护成本以及处理“幻觉”问题的策略，仍是技术团队需要持续攻克的难题。

技术分析

基于您提供的文章标题和摘要（尽管摘要被截断，但结合Iberdrola、AWS、Amazon Bedrock AgentCore和ServiceNow等关键词，以及该案例在业界的典型性），我将为您构建一份深度分析报告。该分析将基于“大型公用事业公司利用生成式AI代理（Agent）重构IT运维”这一核心逻辑展开。

深度分析报告：Iberdrola 利用 Amazon Bedrock AgentCore 增强IT运维

1. 核心观点深度解读

文章的主要观点

Iberdrola（伊维尔德罗拉）作为全球最大的公用事业公司之一，通过与AWS合作，利用 Amazon Bedrock AgentCore 构建了一种新型的代理架构。这种架构不仅仅是简单的自动化脚本，而是具备推理能力的智能体，旨在彻底革新其在ServiceNow平台上的IT运营流程，实现从“人工执行”到“AI自主编排”的跨越。

作者想要传达的核心思想

“智能体优先”的企业级AI落地范式。 核心思想在于：企业不应仅仅将大语言模型（LLM）视为聊天机器人，而应将其作为能够理解上下文、调用工具并执行复杂工作流的“大脑”。通过AgentCore这样的框架，企业可以将生成式AI的推理能力与现有的企业系统（如ServiceNow）深度集成，从而解决实际业务问题。

观点的创新性和深度

从“支持”到“代理”的转变：传统的RAG（检索增强生成）主要用于回答问题，而该案例展示的是Agent模式，即AI不仅能回答问题，还能代表用户采取行动（如自动创建工单、分配任务、查询状态）。
企业级治理的平衡：在公有云（AWS）和企业核心系统之间建立了一个受控的代理层，既利用了基础模型的强大能力，又确保了企业对流程的管控权。
针对非结构化数据的处理：IT运维中存在大量非结构化日志和描述，AgentCore能够理解这些自然语言并将其转化为结构化的ServiceNow操作，这是深度的技术创新。

为什么这个观点重要

对于像Iberdrola这样的资产密集型企业，IT系统的稳定性直接关系到电网的安全和效率。传统的ITSM（IT服务管理）流程繁琐、人工干预多、响应慢。引入Agentic AI意味着：

效率指数级提升：减少人工在系统间切换和数据录入的时间。
降低人为错误：AI遵循预设的严谨逻辑执行操作。
释放人力：让IT专家从繁琐的工单处理中解放出来，专注于架构优化和战略问题。

2. 关键技术要点

涉及的关键技术或概念

Amazon Bedrock：AWS的全托管生成式AI服务，提供对多种基础模型（如Anthropic Claude, Meta Llama等）的访问。
AgentCore（代理核心框架）：这是一个关键概念，通常指代构建AI代理的基础设施，负责处理LLM的编排、记忆管理和工具调用。
ServiceNow：企业级IT服务管理（ITSM）平台，存储了大量的流程数据。
Agentic Architectures（代理架构）：指多个AI代理协同工作或单个代理处理复杂任务的系统设计模式。

技术原理和实现方式

意图识别与路由：用户（可能是IT运维人员或员工）用自然语言提出请求（例如：“服务器X响应慢”）。Bedrock中的LLM分析意图，判断这是一个性能问题。
动态规划与推理：AgentCore利用LLM的推理能力，将大任务分解为子步骤（例如：查询日志 -> 检查SLA -> 分配给二线支持）。
工具调用：Agent通过API调用ServiceNow的API（如Table API），执行查询、更新字段或创建记录等操作。
上下文感知：Agent能够记住对话历史和系统状态，确保多轮交互的一致性。

技术难点和解决方案

幻觉与数据准确性：
- 难点：LLM可能会编造不存在的工单ID或配置项。
- 方案：通过AgentCore实施**Grounding（接地）**策略，强制LLM在调用工具前验证数据，或者在生成回答前引用ServiceNow中的真实记录。
API权限与安全：
- 难点：AI代理拥有操作系统的权限，存在滥用风险。
- 方案：实施严格的IAM（身份和访问管理）策略和Guardrails（护栏），限制Agent只能执行特定范围内的操作（如只能读取，不能删除关键数据）。
复杂工作流编排：
- 难点：IT流程往往涉及复杂的审批链。
- 方案：将ServiceNow的Flow Designer与Bedrock Agent结合，Agent负责逻辑判断，ServiceNow负责流程流转。

技术创新点分析

利用多代理系统针对不同领域（如事件管理、变更管理、知识库查询）构建专门的Agent。例如，一个Agent专门负责搜索历史故障，另一个Agent负责执行变更操作，它们之间通过一个“ Orchestrator（编排器）”协调。这种模块化设计提高了系统的可维护性和扩展性。

3. 实际应用价值

对实际工作的指导意义

该案例证明了生成式AI在企业后台系统中的巨大潜力。它展示了如何将“对话式界面”转化为“事务性执行”。对于CIO和IT领导者而言，这意味着数字化转型的下一站是**“自主化运营”**。

可以应用到哪些场景

智能客服与L1支持：员工通过聊天界面报修，Agent自动分析并创建工单，甚至自动解决常见问题（如密码重置）。
知识库自动维护：从解决掉的工单中自动提取解决方案，更新到ServiceNow知识库中。
合规性审计：Agent自动扫描配置项，检查是否符合企业安全策略。
变更风险评估：在执行变更前，Agent分析历史数据，预测潜在风险。

需要注意的问题

数据隐私：将敏感的IT运维数据发送给云端LLM需要进行脱敏处理或利用Amazon Bedrock的私有加密功能。
模型选择：不同的任务需要不同的模型（有的需要逻辑强，有的需要成本低），需要灵活的模型路由策略。

实施建议

不要试图一步到位替换整个ITSM流程。建议从低风险、高重复性的场景开始（如工单分类、状态查询），逐步建立对AI代理的信任，再扩展到需要执行操作的场景（如重启服务、修改配置）。

4. 行业影响分析

对行业的启示

公用事业和能源行业通常是保守的，Iberdrola的案例是一个强烈的信号：传统行业正在加速拥抱生成式AI。这表明AI的成熟度已经达到了可以处理关键业务流程的阶段。

可能带来的变革

IT运维的“去中介化”：传统的IT服务台（L1/L2支持）人员数量可能会减少，角色将转变为“AI训练师”和“异常处理专家”。
自愈系统的雏形：结合IoT数据，未来的电网IT系统可能实现故障的自动感知和自动修复。

对行业格局的影响

AWS、Azure、Google Cloud等云厂商的竞争将从算力转向企业级AI应用框架。能够提供最安全、最易用的Agent构建平台的厂商将占据主导地位。

5. 延伸思考

引发的其他思考

人机协作的新模式：当AI能处理90%的常规工单时，人类员工如何处理剩下的10%复杂问题？我们需要什么样的新界面？
成本结构的变化：虽然API调用成本降低了人力成本，但随着业务量增长，Token消耗成本可能变得显著。如何优化Prompt和上下文窗口成为关键。

可以拓展的方向

跨系统代理：不仅限于ServiceNow，还能连接SAP、监控工具、云控制台，实现真正的全栈自动化。
预测性维护：结合Bedrock的分析能力，预测IT硬件的故障时间，而非仅仅是响应故障。

需要进一步研究的问题

Agent在执行失败时的回滚机制如何设计？
如何量化评估Agent引入后的ROI（投资回报率）？

未来发展趋势

多模态Agent：未来的Agent不仅能处理文本，还能直接分析服务器崩溃的截图、听错误警报的音频，进行全方位诊断。

6. 实践建议

如何应用到自己的项目

评估数据现状：检查你的ITSM流程是否数字化（如是否在ServiceNow/Jira中），数据质量是否足够AI理解。
选择试点场景：挑选一个痛点最明显、逻辑最清晰的环节（如“工单自动分类”或“知识库搜索”）。
构建基础架构：在AWS上利用Bedrock和Lambda函数搭建一个简单的PoC（概念验证），连接到你的测试环境。

具体的行动建议

学习Prompt Engineering：掌握如何编写高质量的System Prompt来约束Agent的行为。
建立Guardrails：在开发初期就设立内容过滤和敏感信息屏蔽机制。
小步快跑：先实现“只读”功能的Agent，验证准确性后再开启“写入/修改”权限。

需要补充的知识

LangChain或LlamaIndex：虽然Bedrock是托管服务，但理解开源框架有助于掌握Agent原理。
REST API设计：Agent与业务系统的交互主要通过API，理解API设计至关重要。

实践中的注意事项

避免过度依赖：在初期，必须保留“人在回路”，对Agent的操作进行复核。
处理幻觉：始终告诉Agent“如果你不知道答案，就说不知道，不要编造”。

7. 案例分析

结合实际案例说明

Iberdrola面临的是典型的**“大企业病”**：系统庞大、流程僵化。通过引入Bedrock AgentCore，他们实际上是在ServiceNow这个“旧躯壳”上装了一个“新大脑”。

成功案例分析

目标：优化IT运营。
手段：使用Agentic architectures。
结果（推测）：工单解决时间缩短，因为AI能瞬间理解员工描述的模糊问题（如“网很慢”），并自动转化为技术指标查询，而不是人工反复沟通。

失败案例反思

假设某银行试图模仿此案例但失败了。原因可能是：

权限过大：Agent误操作删除了关键数据库记录。
缺乏上下文：Agent不理解银行特有的黑话，导致工单分类错误。
教训：成功的Agent需要深度的行业定制化微调和严格的权限隔离。

经验教训总结

技术是容易的，流程是困难的。 Iberdrola的成功不仅仅是因为用了AWS的技术，更因为他们理顺了ServiceNow中的流程，使得AI有章可循。

8. 哲学与逻辑：论证地图

中心命题

企业级IT运维的未来将由具备自主推理能力的生成式AI代理主导，而非传统的自动化脚本或人工操作。

支撑理由与

最佳实践

最佳实践指南

实践 1：构建基于知识库的生成式 AI 智能问答系统

说明: 利用 Amazon Bedrock 和 Amazon OpenSearch Service 构建检索增强生成（RAG）架构。Iberdrola 通过将非结构化数据（如 IT 运维手册、事件报告、内部 Wiki）向量化并存储到向量数据库中，使 Agent 能够在生成回答前检索相关上下文。这解决了大语言模型（LLM）可能产生的“幻觉”问题，并确保了 IT 运营信息的准确性和时效性。

实施步骤:

数据清洗与预处理：收集分散在 Confluence、SharePoint 等处的 IT 文档，去除冗余和过时信息。
向量化嵌入：使用 Amazon Bedrock 中的嵌入模型（如 Titan Embeddings）将文档转换为向量并存储在 OpenSearch Service 的向量引擎中。
配置检索链：在 AgentCore 中配置提示词工程，确保 Agent 在回答用户查询前先执行语义搜索以获取相关文档片段。

注意事项: 必须建立严格的数据权限控制，确保敏感的运维数据仅对授权人员可见，并定期更新向量数据库以同步最新的 IT 变更。

实践 2：通过 Agent 编排实现复杂工作流自动化

说明: 将单一的问答交互升级为能够执行多步骤任务的智能 Agent。Iberdrola 利用 Amazon Bedrock 的 Agents for Amazon Bedrock 功能，赋予 AI 调用 API 的能力。通过定义清晰的 API Schema，Agent 可以理解用户意图并按顺序调用第三方 ITSM（如 ServiceNow）或监控工具的 API，从而自动完成工单创建、状态查询或系统重启等操作。

实施步骤:

定义 API Schema：使用 OpenAPI 规范（Swagger）描述后端 IT 系统的 API 接口，包括参数、描述和返回值。
编排逻辑设计：在 Bedrock 中配置 Agent 的提示词，明确告知 Agent 在何种情况下应调用哪个 API 以及调用的先后顺序。
部署与测试：将 Agent 部署到安全环境中，模拟用户请求进行“红队测试”，确保 Agent 不会执行未授权的破坏性操作。

注意事项: API 调用必须通过 IAM 角色进行严格的权限验证，遵循最小权限原则，防止 Agent 被诱导执行敏感操作。

实践 3：实施人工反馈闭环（RLHF）机制

说明: 为了确保 AI 助手在处理 IT 运营问题时的持续改进，建立人工审核和反馈机制至关重要。Iberdrola 的实践表明，允许用户对 Agent 的回答进行评分（点赞/点踩）或修正，并将这些反馈数据用于后续的模型微调或提示词优化，能显著提升系统的准确率和用户满意度。

实施步骤:

集成反馈接口：在用户交互界面（UI）中添加简单的反馈按钮，并收集用户认为错误的回答。
数据标注与分析：定期导出负面反馈数据，由资深 IT 专家进行正确的标注和分析。
迭代优化：根据分析结果调整 Agent 的系统提示词或补充知识库中的缺失内容。

注意事项: 确保反馈数据的存储和处理符合数据隐私法规，且用于微调的数据必须经过脱敏处理，不得包含生产环境的敏感配置。

实践 4：建立严格的护栏与安全合规策略

说明: 在企业级 IT 环境中，防止 AI 泄露敏感信息或提供有害建议是核心要求。利用 Amazon Bedrock Guardrails 建立多层级的安全策略。Iberdrola 通过配置过滤器来阻止 Agent 处理涉及特定敏感词汇、PII（个人身份信息）或非公开财务数据的请求，确保输出内容符合企业合规性要求。

实施步骤:

定义敏感主题：列出企业禁止讨论的敏感话题（如未公开的安全漏洞、特定客户数据）。
配置过滤器：在 Bedrock 中启用 Guardrails，设置拒绝上下文和拒绝输出策略。
PII 识别与掩码：配置自动识别和掩码机制，防止 Agent 在日志或输出中泄露 IP 地址、密钥等敏感信息。

注意事项: 安全护栏应定期审查，以应对不断变化的合规要求和新的安全威胁。

实践 5：选择可扩展的基础模型并优化推理成本

说明: 并非所有 IT 运维任务都需要最大、最昂贵的模型。Iberdrola 根据任务复杂度动态选择模型。例如，对于简单的文档检索和摘要，使用成本较低、速度较快的模型（如 Claude 3 Haiku 或 Titan Text）；而对于复杂的故障排查推理，则使用能力更强的大模型（如 Claude 3 Sonnet 或 Opus），以实现性能与成本的最佳平衡。

实施步骤:

任务分类：将 IT 运营场景分为“简单检索”、“逻辑推理”和“代码生成”等类别。

学习要点

通过 Amazon Bedrock 的 AgentCore 框架构建生成式 AI 智能体，成功实现了 IT 运维中复杂任务的自动化处理，显著提升了运营效率。
利用企业知识库作为上下文基础，确保了 AI 智能体在回答技术问题时能够基于准确的公司内部数据，避免了通用大模型的幻觉问题。
采用了“人机协同”的工作模式，即 AI 负责初步处理与建议，由人类专家进行最终审核，从而在保证安全性的前提下加速了问题解决。
该解决方案展示了如何利用生成式 AI 将非结构化的技术文档转化为可执行的自动化操作，打破了传统自动化工具的局限性。
实施该项目证明了在大型企业中，通过 AI 辅助可以有效降低初级运维人员的认知负荷，并缩短资深员工排查故障的时间。

引用

文章/节目: https://aws.amazon.com/blogs/machine-learning/iberdrola-enhances-it-operations-using-amazon-bedrock-agentcore
RSS 源: https://aws.amazon.com/blogs/machine-learning/feed/

注：文中事实性信息以以上引用为准；观点与推断为 AI Stack 的分析。

站内链接

分类： AI 工程 / 系统与基础设施
标签： Amazon Bedrock / AgentCore / ServiceNow / 智能体架构 / IT 运营 / 对话式 AI / 事件管理 / AWS
场景： AI/ML项目

Iberdrola 利用 Amazon Bedrock 和 AgentCore 优化 ServiceNow 运
Iberdrola 如何利用 Amazon Bedrock 优化 ServiceNow IT 运营
Iberdrola 如何利用 Amazon Bedrock AgentCore 优化 ServiceNow I
Iberdrola enhances IT operations using Amazon Bedrock A
Iberdrola 利用 Amazon Bedrock AgentCore 革新 ServiceNow IT 本文由 AI Stack 自动生成，包含深度分析与方法论思考。

Iberdrola 利用 Amazon Bedrock AgentCore 重塑 IT 运营