New Relic 推出 Agentic Platform:企业 AI Agent 真正卡住的,不是模型,而是可观测性

New Relic 推出 Agentic Platform:企业 AI Agent 真正卡住的,不是模型,而是可观测性

New Relic 推出 Agentic Platform:企业 AI Agent 真正卡住的,不是模型,而是可观测性

先说结论

如果你在公司里推进 AI Agent,真正决定能不能上线规模化的,往往不是模型能力,而是可观测性和治理能力。New Relic 这次把 Agent 平台和 OpenTelemetry(OTel)打通,价值就在这里:先把“能看见、能追责、能回滚”补齐,再谈自动化提效。

这件事的核心问题

过去一年,企业对 Agent 的态度很矛盾:

  • 一边想要自动化效率;
  • 一边怕“黑盒执行”带来生产事故。

典型场景是:Agent 能自动改配置、触发任务、调用内部系统,但一旦出现延迟飙升、错误率上升、调用链断裂,团队不知道是模型输出问题、工具调用问题,还是数据管道问题。

本质上,AI Agent 落地已经从“生成质量竞争”转向“系统可控性竞争”。

关键机制拆解

1) 从“单点 Copilot”升级到“面向结果的 Agent 编排”

New Relic 发布的是一个无代码 Agentic 平台,核心不是做通用聊天,而是围绕可观测性场景做结果导向的自动化:

  • 预置 Agent 快速上线;
  • 管理既有 Bot;
  • 在同一套监控语义里处理告警、诊断、修复建议。

这意味着企业不必从零搭 Agent 工作流,而是先在“故障定位/性能优化/风险预警”这类高 ROI 任务上落地。

2) MCP + 外部数据源连接,解决 Agent “只会说不会做”

平台支持 MCP(Model Context Protocol)后,Agent 不再只看单一日志片段,而能联动外部数据源与内部工具。

如果你做过线上排障就会懂:

  • 只读一个系统的日志,结论往往偏;
  • 能跨指标、跨服务、跨环境关联,结论才可执行。

3) OTel 一体化,补上企业最疼的“数据碎片化”

很多团队的现实是:

  • 监控在 A;
  • Trace 在 B;
  • 指标在 C;
  • Agent 还在 D。

New Relic 把 APM 与 OTel 数据流管理拉到统一入口,本质是降低运维复杂度。对大多数团队来说,这比“再上一个更聪明的模型”更直接。

4) 从“模型焦虑”切到“治理闭环”

企业真正担心的是:

  • 谁批准了 Agent 的动作?
  • 出问题谁追责?
  • 能不能回放与审计?

Agent 平台化的趋势,实质是给企业一个治理框架:权限边界、执行记录、异常回滚、跨团队协作。

两个常见误区

  • 误区 1:Agent 平台=又一个聊天入口。
    不是。企业买单的是稳定性、审计和 MTTR(平均修复时间)下降,不是聊天体验。

  • 误区 2:先上最强模型,再补可观测性。
    顺序反了。没有观测和治理,模型越强,错误动作的影响半径反而更大。

案例/类比

把 Agent 想成“初级 SRE 值班员”:

  • 没有监控面板时,它只能凭感觉猜;
  • 有了统一指标、链路、日志和权限策略,它才能在可控范围内执行。

再直白一点:Agent 不是“更聪明的脚本”,而是“接入生产系统的执行者”。执行者要先纳入治理,再谈提效。

对你的实际影响

  • 个人开发者:从今天开始,做 Agent Demo 时就要带最小监控与回滚,不然很难进团队正式流程。
  • 小团队:优先做“高频故障自动诊断”而不是“大而全自动化”,先拿可量化收益。
  • 企业团队:2026 年的竞争点会从“谁先接入 LLM”转到“谁先形成 Agent 治理标准件”。

可执行建议

  • 先选 1 个高频、低权限风险场景(如告警分诊)做 Agent 试点。
  • 为每个 Agent 定义三层边界:可读数据、可执行动作、需要人工确认的操作。
  • 把 OTel 指标、Trace、日志统一到一处查看,减少跨系统排障时间。
  • 设立“失败预算”:每周允许多少次误触发,超过阈值自动降级到人工。
  • 上线前做一次“故障演练”:模拟错误调用链,验证审计与回滚是否真可用。

风险与不确定性

  • 市场上 Agent 平台同质化严重,长期壁垒取决于生态集成深度,不是功能列表长度。
  • 无代码平台降低门槛的同时,也可能让“治理错觉”扩大:看起来有流程,不等于流程可靠。
  • 不同企业的数据合规要求差异大,跨区域/跨部门场景仍有落地摩擦。

一句话复盘

New Relic 这次的信号很清晰:企业 AI Agent 进入“基础设施阶段”,下一轮胜负手是可观测性 + 治理闭环,而不是再拼一次模型参数。

[[AI Agent治理]] [[OpenTelemetry实践]] [[企业自动化落地]]

Read more

Microsoft 365 E7 上线前夜:企业该关注的不是 ,而是 Agent 365 的治理门槛

Microsoft 365 E7 上线前夜:企业该关注的不是 ,而是 Agent 365 的治理门槛

Microsoft 365 E7 上线前夜:企业该关注的不是 $99,而是 Agent 365 的治理门槛 先说结论 Microsoft 365 E7 的真正变量,不是“贵不贵”,而是它把 Copilot、Agent 365 和安全栈打包后,迫使企业从“买 AI 工具”转向“运营 AI 员工系统”;如果治理能力跟不上,Microsoft 365 E7 会先放大组织混乱,再放大效率。 这件事的核心问题 过去一年,很多团队对 AI 的投入模式很像“插件采购”:先买几个席位,再让员工自己摸索。 但 Microsoft 365 E7 这次的定位变了。根据微软

By One AI
NVIDIA GTC 2026 前瞻:AI 基础设施进入“推理效率战”,团队现在该改哪三件事?

NVIDIA GTC 2026 前瞻:AI 基础设施进入“推理效率战”,团队现在该改哪三件事?

NVIDIA GTC 2026 前瞻:AI 基础设施进入“推理效率战”,团队现在该改哪三件事? 先说结论 GTC 2026 的关键信号不是“又有新 GPU”,而是 AI 基础设施竞争从训练峰值,转向推理效率与系统协同。如果你在做 AI 产品,接下来 6-12 个月最该优化的是:推理延迟、内存带宽利用率、以及 Agent 工作流的可观测性。 这件事的核心问题 过去两年,很多团队把 AI 预算砸在“更大模型+更强训练”。现在业务落地进入第二阶段: * 用户要稳定、低延迟、可预测成本 * 企业要可治理、可审计、可扩展 * 工程团队要在同等预算下跑更多在线请求 GTC 2026(3 月 16-19 日,

By One AI
Zoom 企业级 Agentic AI 平台升级:从会开会到会跑流程,团队该怎么接

Zoom 企业级 Agentic AI 平台升级:从会开会到会跑流程,团队该怎么接

Zoom 企业级 Agentic AI 平台升级:从“会开会”到“会跑流程”,团队该怎么接 先说结论 Zoom 这次的核心,不是再加一个 AI 功能,而是把“企业级 Agentic AI 平台”从会议助手,推进到跨协作、电话和客服场景的流程编排层。对团队来说,价值不在“更聪明的摘要”,而在“能不能把会后动作真正自动执行”。 这件事的核心问题 过去一年,多数企业的 AI 还停在“提效插件”阶段:会写纪要、会改文案、会总结对话,但最后依然要人手动抄到 CRM、工单系统、审批系统。 如果会议洞察不能进入业务系统,AI 就只是“更高级的记事本”。 这次 Zoom 公布的方向是:

By One AI
Synology 获得 ISO 27001 认证后,NAS 用户真正该看的不是“证书”,而是三条落地清单

Synology 获得 ISO 27001 认证后,NAS 用户真正该看的不是“证书”,而是三条落地清单

Synology 获得 ISO 27001 认证后,NAS 用户真正该看的不是“证书”,而是三条落地清单 先说结论 Synology 的 ISO 27001 认证 不是“品牌加分项”这么简单。对中小团队和本地 NAS 用户来说,它真正的价值是:你终于可以把“数据安全”从口号变成一套可审计、可执行、可复盘的运维流程。结论置信度:中高(官方新闻明确,但不同组织落地深度不同)。 这件事的核心问题 很多人买 NAS 时只看容量、CPU、是否支持 Docker。真正上线后才发现,最难的不是“存进去”,而是: * 谁能访问哪些目录? * 出现异常后谁负责、怎么追溯? * 备份真的可恢复吗? * 合规审计来时拿什么证明“我们在管控”? Synology 在

By One AI
Follow @Fuuqius