智能体基础设施与AgentOps-2026上海_SECon全球软件工程技术大会-橙柚科技

专场出品人：李国强

阿里云智能云原生产品负责人资深产品专家

深耕AI 原生领域多年，现负责云原生产品线的产品策略与规划。在阿里云期间，先后主导 Kubernetes 容器服务、Serverless 计算、微服务治理、消息中间件、可观测性、CI/CD 、AI Coding 与 AI Agent 全生命周期管理领域。在云原生架构、分布式应用及智能体平台建设方面具备丰富的实战经验。

专场：智能体基础设施与AgentOps

当智能体从实验原型走向生产级服务，真正的挑战才刚刚开始 —— Agent 如何安全可控地部署运行？运行时如何实现极致弹性与会话级隔离？多智能体之间如何高效协作并统一管控？海量 AI 流量如何统一接入与治理？模型调用工具调用如何可管可控？Agent 的质量与稳定性又该如何持续度量和优化？这些问题的答案，都指向同一个方向：构建成熟的智能体基础设施与 AgentOps 工程体系。

本专场聚焦智能体规模化落地的基础设施层，从 Agent 全生命周期管理平台覆盖开发、部署与运维全链路实践，到 HiClaw 多 Agent 协作管控平台打通人与 Agent、Agent 与 Agent 之间的全向协作与安全治理，从 AI 网关作为智能流量中枢的统一接入与性能优化，到基于 RocketMQ LiteTopic 的百万级会话隔离与全链路异步协作架构，再到以可观测数据驱动的 Agent 自动评估与迭代优化闭环，系统覆盖 Agent Infra 架构设计、智能体部署与弹性伸缩、多 Agent 协作管控、云原生环境下的智能体运维以及 AgentOps 工具链建设等核心议题，为企业构建安全、高效、可演进的智能体工程底座提供完整路径。

李国强

从构建、部署到规模化运行，加速企业 Agent 工程化

阿里云智能云原生产品负责人资深产品专家

深耕AI 原生领域多年，现负责云原生产品线的产品策略与规划。在阿里云期间，先后主导 Kubernetes 容器服务、Serverless 计算、微服务治理、消息中间件、可观测性、CI/CD 、AI Coding 与 AI Agent 全生命周期管理领域。在云原生架构、分布式应用及智能体平台建设方面具备丰富的实战经验。

......

王泉力

HiClaw - 多Agent协作与治理方案

阿里云智能解决方案架构师

HiClaw项目Maintainer，阿里云云原生解决方案架构师，团队负责Higress、Nacos等开源项目。主导负责微服务中间件的解决方案落地，在云原生应用下主要负责API网关、Nacos、服务治理。面相AI时代，主导Agent构建方向的解决方案落地，围绕AI网关、AI可观测、AgentScope开发框架、Nacos、HiMarket以及Agent Sandbox，为客户AI应用转型提供基础服务。主导HiClaw产品能力设计与规划，探究企业级Agent在业务侧和企业内部提效应用的最佳实践。

议题背景：
随着OpenClaw的爆火，企业数字员工逐步进入大家视野，但是企业内部Agent如何做到管控，数字员工架构如何落地成为企业面临问题，数字员工之间到底如何协作？除了内部提效，业务也在使用Claw进行转型，将原有业务能力转换成skills，通过claw输出。
HiClaw的出现解决了多Agent协作及统一管理的问题，从安全管控到端到端业务改造，一起探讨HiClaw落地最佳实践！

内容大纲：
1. HiClaw产品定位及架构
2. HiClaw核心价值点
3. HiClaw vs OpenClaw
4. HiClaw开源架构及产品架构
5. Hiclaw在市场格局中的位置
6. 产品核心能力
7. HiClaw彻底解决xxClaw的企业安全问题
8. HiClaw私有化企业级Skill Hub
9. HiClaw Agent引擎自由组合与替换
10. Sandbox运行环境
11. HiClaw LLM安全统一管理
12. HiClaw Skill/MCP 安全统一管理
13. HiClaw Market
14. HiClaw观测仓
15. 使用形态与应用场景
16. HiClaw助力SaaS企业快速AI转型
17. OPOC和数字员工
18. 云上Agent和云下Agent混合使用

听众受益：
1. 多Agent之间如何协作
2. 人与Agent之间如何协作
3. 数字员工场景
4. 企业Agent转型方向

刘宇

智能化Agent Infra：AgentRun如何让Agent从Demo走向生产

阿里云智能产品专家

阿里云AgentRun产品负责人，阿里云Serverless产品专家，云计算领域博士（主要研究方向为Serverless架构）；畅销书《Serverless架构：从原理、设计到项目实战》《Serverless工程实践：从入门到进阶》《Serverless架构与人工智能最佳实践》等书作者，电子书《架构师特刊：人人都能学会的Serverless实践》（InfoQ出品）《Serverless开发速查手册》（阿里云藏经阁出品）作者；参编《基于服务器无感知架构的工具链技术能力要求》等标准；开源项目/CNCFSandbox项目ServerlessDevs发起人，负责人。

议题背景：

2025年，Agent是AI最火的赛道；2026年，行业开始面对一个共同的现实——大多数Agent仍停留在Demo阶段。"能跑通"和"能上线"之间，存在着巨大的工程化鸿沟。本次分享将从2026年Agent的真实落地现状说起，以"从Demo到生产"为主线，结合标杆客户的实战经验，分享阿里云AgentRun在帮助企业跨越这道鸿沟过程中的关键技术方案与思考：为什么我们认为Agent运行时不应只是被动提供算力，而应该主动理解和增强Agent的行为——从AIInfra进化到智能AIInfra。

内容大纲：
1. 现实：2026年，Agent的工程化鸿沟
1.1 行业现状：80%的Agent仍停留在Demo阶段
1.2 "能跑通"与"能上线"之间，差了什么？
1.3 现有解决路径的局限：框架、平台、全自研的各自天花板
2. 洞察：AIInfra应该从被动提供算力，到主动理解Agent
2.1 传统AIInfra的被动模式：你跑，我支撑
2.2 智能AIInfra的主动模式：我理解你在做什么，我来增强它
2.3 从"Agent的云服务器"进化为"Agent的智能操作系统"
3. 方案：AgentRun跨越工程化鸿沟的关键技术
3.1 极致性能底座：冷启动<100ms与有状态长会话保障
3.2 三层智能体架构：超级Agent×ToolAgent×SandboxAgent
3.3 动态上下文加载：告别有损压缩，实现信息保真
3.4 企业级安全治理：RBAC+Human-in-the-Loop+数据不出域
3.5 全链路可观测：从"黑盒执行"到"决策路径可视"
4. 实战：标杆客户从Demo到生产的真实经验
4.1 案例一：[法律/金融场景]合规壁垒如何被打破
4.2 案例二：[企业数字员工场景]Multi-Agent如何落地复杂业务
4.3 共性规律：成功上线的Agent都做对了哪几件事
5. 展望：智能AIInfra的下一步
5.1 从"单Agent生产化"到"AgentTeams协同"
5.2 数据飞轮：让每次运行都在让Agent变得更好
5.3 开放生态：做Agent世界的底座，而非封闭花园

听众受益：
1. 获得一套判断框架：清晰识别自己的Agent项目处于"Demo阶段"还是"生产就绪"，以及差距究竟在哪几个维度
2. 理解智能AIInfra的核心价值：明白为什么运行时不应只提供算力，掌握"主动增强Agent行为"这一新的架构思维，可直接应用于自身技术选型与方案设计
3. 掌握三层智能体架构的设计思路：了解超级Agent×ToolAgent×SandboxAgent分层架构如何降低Token消耗、提升执行质量，拿走可落地的架构参考
4. 学到动态上下文加载的工程方案：理解为什么摘要压缩是有损的，动态检索加载如何在企业精确场景（法律、代码、审计）中建立不可替代的优势
5. 了解企业级Agent落地的合规路径：从真实客户案例中获取安全治理、权限管控、数据合规的实战经验，减少自己踩坑的成本

夏明

Agent进化论：AgentLoop助力智能体构建进化数据飞轮

阿里云智能高级产品专家

现任AgentLoop—企业级智能体一站式进化平台产品经理，从事可观测领域产品设计与研发近10年。

议题背景：
当企业级智能体从实验原型走向生产环境，真正的挑战才刚刚开始。当前大量Agent处于"裸奔"状态——没有可观测性，没有评估体系，没有优化闭环。这与2010年代微服务爆发初期的困境如出一辙，但Agent的非确定性行为使挑战更加严峻。本次分享将从行业实践出发，深入剖析企业级智能体面临的可观测性、评估体系、优化闭环三大空白，系统阐述"观测→评估→优化"三层进化飞轮的方法论与工程实践，并结合真实案例展示如何通过数据驱动的方式让智能体具备自我感知、自我评估、自我优化的持续进化能力，帮助企业构建从Demo到生产级的Agent工程体系。

内容大纲：
1. 开场：Agent爆发期的"微服务式困境"
1.1 从微服务到Agent：历史正在重演
1.1.1 回顾微服务时代的教训：每个人都在写服务，但可观测性远远没跟上
1.1.2 类比当下：AIAgent面临同样的困境，且因非确定性行为更加严峻
1.2 Agent生产化的四大空白
1.2.1 可观测性空白：传统APM无法理解多步推理链路和Token消耗结构
1.2.2 评估体系空白：质量衡量依赖人工抽检，无法量化
1.2.3 优化闭环空白：Prompt/Skill调优靠试错，缺少数据驱动的实验方法
1.2.4 安全护栏空白：Agent自主决策带来全新安全风险
2. 方法论：构建"观测→评估→调优"三层进化飞轮
2.1 全栈观测——让Agent的每一步行为"可见"
2.1.1 Agent多步推理链路与传统应用调用链的本质差异
2.1.2 全栈数据无侵入采集的工程方法：用户终端-智能体-模型层
2.1.3 实体关系拓扑：自动发现Agent内部的模型、工具、检索器及其调用关系
2.2 系统化评估——从"人工抽检"到"数据驱动的质量工程"
2.2.1 高质量数据集的自动化构建：如何从线上Trace自动转化为可标注数据集
2.2.2 评估器质量工程：为什么单纯的LLM-as-a-Judge还不够，如何迭代调优评估器本身
2.2.3 CI/CD质量门禁：将80%以上的质量退化风险扼杀在测试阶段
2.3 优化闭环——从试错到实验，系统化优化
2.3.1 数据驱动的Prompt/Skill优化方法：高质量评估器+真实运行轨迹+AI辅助优化
2.3.2 上下文工程实践：从Agent运行轨迹中自动提取可复用经验，构建经验知识库
3.工程实践：企业级智能体从Demo到生产级实践
3.1 线上实时评估与质量守护
3.1.1 分钟级识别Agent质量退化，主动触发告警
3.1.2 MTTR缩短50%以上的实践路径
3.2 安全合规与审计的最佳实践
3.2.1 从抽检5%到全量100%覆盖的安全审计思路
3.2.2 输入/输出安全检测与操作审计日志的落地经验
3.3 让Agent自己学会进化
3.3.1 Agent通过API自主触发评估、获取反馈、实现无人值守的自我优化
3.3.2 从"人工运维Agent"到"Agent自运维"的范式转变
4. 总结与展望
4.1 核心方法论回顾：企业构建Agent进化能力的三步走路径
4.2 展望：当Agent具备自进化能力，企业AI的竞争壁垒将从"谁的模型好"转向"谁的进化飞轮转得快"

听众受益：
1. 理解Agent从Demo走向生产级所需的完整工程体系，避免"裸奔上线"的常见陷阱
2. 掌握"观测→评估→调优"三层进化飞轮的方法论，获得可直接落地的实操路径

3. 获得评估器质量工程、数据集自动化构建、CI/CD质量门禁等关键环节的最佳实践
4. 建立"Agent自进化"的思维框架，思考如何让智能体从被动运维走向主动进化

刘嘉鹏

实战案例：阿里云全域智能运维平台STAROps 工程设计实践

阿里云智能技术专家

ApacheSkyWalkingCommitter，AlibabaLoongcollectorCommiter，长期深耕可观测性领域。负责阿里云MetricStore时序引擎核心研发，参与海量时序数据存储与查询引擎的设计与优化，对高性能数据处理、分布式系统架构有深入的工程实践。目前专注于STAROps智能运维平台核心工程建设，致力于构建自主监控、分析、自愈的AIOps产品，通过实时多维数据集、AI友好型运维工具链、领域专家经验库三大核心能力，为客户打造7×24自主运维的智能体团队。作为核心工程负责人，主导了Agent安全操作生产环境的工程设计，解决长周期任务执行、人机协同审批及全链路可观测等关键工程挑战。

议题背景：

AIOps正从工具重塑走向流程重塑，服务端托管的自主运维智能体成为核心产品形态。与本地Copilot不同，STAROps构建的是7×24持续运行的Agent团队——凌晨三点无人值守时依然在巡检、诊断、执行恢复。这带来三个本地Agent不曾面对的工程挑战：
●长周期任务的高可靠执行
●工具调用的安全管控
●代码执行环境的安全隔离
本次演讲将分享阿里云可观测团队如何通过Mission状态机、CheckpointRecovery、Human-in-the-Loop与凭证隔离、容器化沙箱与HTTPProxy拦截等工程设计，让无人值守的Agent值得信赖。

内容大纲：
1. 可观测智能体的机遇与挑战
1.1可观测与传统AI助手的差异：异步诊断、长周期执行、跨系统联动
1.2可观测场景的数据与任务特征：海量异构数据源、多轮诊断推理、变更执行与验证
1.3可观测智能体面临的新问题：7×24无人值守下的任务可靠性、工具调用安全性、执行环境隔离性
2. STAROps：面向长周期任务的Agent架构
2.1Mission执行引擎：三级模型、阶段状态机、Checkpoint断点续跑
2.2工具安全调用：多版本控制、统一网关、三层人机协同拦截、凭证隔离与服务端重签名
2.3沙箱安全隔离：容器化执行环境、双轨调用链、网络代理写请求逐条过审
3. 场景实践
3.1Kubernetes集群巡检：定时触发、多维数据采集、异常自动归因
3.2日志根因分析：从告警到定位的全链路Agent协作

听众受益
1. 建立服务端托管Agent与本地Copilot的工程差异认知，理解7×24无人值守场景下高可靠、安全调用、安全隔离三大挑战的问题本质
2. 获得长周期任务高可靠执行的工程方案：Mission状态机如何编排多阶段任务，CheckpointRecovery如何实现进程重启后的断点续跑
3. 掌握Agent工具安全调用的分层设计：三层HIL拦截如何覆盖从Agent内置工具到沙箱HTTP请求的全链路，凭证隔离如何让Agent永远不持有生产AK/SK
4. 了解容器化沙箱的安全隔离实践：HTTPProxy拦截如何对写请求逐条审批，双轨调用链如何区分远程执行与本地授权
5. 获取从对话式Agent到7×24自主运维智能体的产品演进路径参考，为自身AIOps落地提供架构借鉴

周礼

让 Agent 不再等待：基于 RocketMQ 的异步协作架构实战

阿里云智能高级技术专家

Apache RocketMQ创始团队成员，擅长大型分布式系统、分布式中间件，拥有 10年以上大型互联网系统架构设计与研发经验，专注于高并发、高可用、可扩展的分布式基础设施建设。
长期担任阿里巴巴消息中间件系统负责人，主导核心消息平台的设计、演进与稳定性保障，连续多年支撑“双十一”等超大规模电商大促活动，系统峰值处理能力达亿级TPS，具备丰富的实战经验与技术领导力。目前聚焦于面向 AI 的分布式系统架构研究，致力于解决大模型训练与推理场景下的分布式协同、低延迟通信等核心挑战。积极探索如何将成熟的中间件能力（如消息队列、服务治理、流式计算）与 AI 工作负载深度融合，构建高效、可靠、可扩展的分布式 AI 应用基础设施。

议题背景：

当多智能体系统从 Demo 走向生产，异步通信成为核心架构瓶颈：Agent 任务执行路径高度动态，同一队列内消息可能触发耗时从毫秒到分钟的异构流程，队列头部阻塞（Head-of-Line Blocking）导致吞吐与响应效率下降；多轮推理需要生产者与消费者之间多次异步协同，而非简单的"发布-消费"；长耗时任务使同步调用频繁超时，要求高效的结果回传与基于上下文的动态决策能力。
面向这些 Agent 原生场景的挑战，Apache RocketMQ 推出 LiteTopic 轻量级通信模型——在单个父 Topic 下支撑百万级会话隔离，自动创建/过期回收，提供排他性消费与顺序保证。LiteTopic 推动异步架构从"预设流程"到"动态协作"、从"数据搬运"到"语义驱动"的跃迁，为构建分布式、异步化、可扩展的多智能体系统提供底层支撑。本次演讲将分享 LiteTopic 的设计理念、架构实现，以及在实际生产环境中的落地效果。

内容大纲：
1. AI Agent 驱动的异步化新挑战
1.1 Agent 开始探索异步化解决方案
1.2 AI 应用场景下的事件驱动
1.3 RocketMQ 演进方向：面向 AI Agent
2. LiteTopic：AI 场景的轻量事件载体
2.1 传统订阅模型在 AI 场景下的局限性
2.2 LiteTopic 设计原则：用轻量、差异化、高度隔离的方案支持 AI 应用场景
2.3 LiteTopic 的架构与实现方案
3. 基于 RocketMQ 的异步 Agent 会话网关
3.1 传统的消费模型在异步 Agent 网关中的局限性
3.2 基于 LiteTopic 实现异步会话网关
3.3 全链路异步交互流程：调度、回流、恢复
4. RocketMQ LiteTopic 落地实践
4.1 百炼网关异步事件工作流
4.2 OpenClaw RocketMQ Channel

听众受益：
1. 掌握一套可落地的多智能体异步架构范式：学习如何利用 LiteTopic 构建高吞吐、高可用的多智能体异步协作架构，并可应用到自身 AI 或其他复杂异步系统。
2. 获得解决真实工程难题的具体方案：了解 Agent 场景下解决长耗时任务处理、分布式会话状态管理、精细化流量调度及多轮通信可靠性等问题的具体技术方案与实践经验。
3. 洞悉基础设施的 AI-Native 演进逻辑：理解传统基础设施为适配多智能体应用场景如何进行设计权衡、完成架构演进，为自身系统的技术选型和架构设计提供参考。

SECon组委会是由业界多位资深技术专家发起，负责组织技术指导委员会，并和委员会的专家一起挖掘全球软件工程领域的创新技术，同时依托智盟创课国内领先的人才能力提升服务供应商，组织专业的会务服务团队，全面推进会议的顺利落地，保证参会者体验。

服务总线：400-183-9980

商务合作：151-2264-3988 木子

票务联系：186-0005-0529 张老师

E-mail：speaker@qecon.com.cn

关注SECon公众号

添加SECon小助手，获取

会议最新资讯

免费领取大会两天PPT

点击领取

津ICP备2023002500号