AgentOS与交互设计-2026上海_SECon全球软件工程技术大会-橙柚科技

专场出品人：陈耀

抖音电商搜索大前端负责人

抖音电商搜索大前端负责人。过去在有赞负责大前端中台能力建设，现于抖音电商负责电商搜索相关的大前端业务。长期带领团队在 AI Coding、AIGC、运营智能化等方向深度推进 Agent 技术与大前端体系的融合，持续探索智能体在高复杂度业务场景下的工程化落地路径。

专场：AgentOS与交互设计

当智能体从 "单点工具" 走向 "常驻伙伴"，运行智能体的底座与人机交互的范式正在被重新定义。AgentOS 不只是一个新的运行时，更是一次从 App 到 Agent、从点击到意图、从屏幕到环境的操作系统级重构。本专场聚焦 AgentOS 的架构演进与交互形态的变革，我们既关注 AgentOS 在进程调度、记忆管理、工具调用、权限与安全等方面的工程化挑战，也关注 Agent 如何 "看懂屏幕、理解意图、操作世界"—— 从桌面 / 移动端 GUI Agent，到机器人与具身场景中的感知 — 决策 — 执行闭环。
论坛汇聚 AgentOS 与交互方向的一线实践者与研究者，分享真实落地中的架构取舍、交互设计原则与效果验证方法。希望帮助听众建立一张覆盖 "OS 底座 — 交互层 — 物理世界" 的完整地图，理解 AgentOS 的边界与可能性，并为自身业务找到可行的切入点，共同推动 Agent 从 "能用" 走向 "好用、可规模化、可托付"。

赵庆杰

再造新物种--龙虾个人助手向企业级通用Agent平台的进化

快手高级技术专家

高级技术专家，资深架构师，十年深耕电商领域，主导落地了多项公司级、部门级的技术项目，具备优秀架构设计能力、纵向技术深度和行业影响力，目前聚焦在电商B端业务场景的AI基础架构设计和业务研发。

议题背景：
OpenClaw的爆火让我们看到了一套通用Agent优秀实现范式，然而其单机架构、TS实现、本地工作区、高权限的tool集合、高冗余prompt等等设计，如果直接用于线上服务，每走一步都可能踩在性能、成本、安全的死线上。为了彻底决绝这些问题，我们在保留龙虾 Agent + Skill + Memory 的核心DNA的基础上，在部署模式、安全边界、运维可观测性、成本消耗等多个维度重新设计整体工程架构，打造一个真正适合企业级业务场景的分布式通用Agent平台。

内容大纲：
1. Openclaw很火，但不适合企业线上业务
1.1 技术拆解龙虾爆火的本质
1.2 服务线上业务的局限性
2. 龙虾进化：打造企业级通用 Agent平台
2.1 企业业务和个人助手的差异
2.2 架构设计推演
  2.3 核心技术挑战
  2.4 关键设计分享
      2.4.1 Agent Runtime
      2.4.2 ReActLoop
      2.4.3 Multi Agent
      2.4.4 Client Protocol
3. 业务场景落地情况
4. 未来规划

听众受益：
1. 学习具体业务场景下技术挑战的应对思路
2. 了解一个优秀架构设计背后的思考逻辑
3. 了解到通用AI Agent平台的关键设计

陈波

AI Agent 的最后一公里：构建生产级代操能力

阿里巴巴前端技术专家

阿里巴巴前端技术专家，Alibaba.com 生意助手前端负责人。长期聚焦 AI 与多端工程的交叉领域，主导建设了 AI 代操框架 actum——覆盖浏览器插件、页面 SDK、云端容器三种部署形态，支撑商家业务的智能导航、自动化选品等多个场景。当前主攻 AI Agent 操作能力层的工程化落地与评测体系建设。

议题背景：

当 AI Agent 具备了理解意图和规划任务的能力后，"如何可靠地在浏览器中执行操作"成为落地的最后一公里。本次演讲提出 Agent 操作能力栈的三层共存模型（API / WebMCP / AI代操），并聚焦工程挑战最大的兜底层——AI 代操。基于 Alibaba.com 商家业务的实战经验和自研框架 actum，我们将深入剖析页面感知（DOM 智能简化与上下文工程）、决策稳定性（Schema-enforced CoT）、执行准确性（CDP 原子操作与框架绕过）、规模化（三端复用架构）四大工程挑战及其解法，并分享一套面向代操场景的多维评测体系——告别 vibe-driven 式的Agent 迭代。最后展望Skills/Memory、WebMCP 协同、安全合规三条未来战线。

内容大纲：
1. 交互困境与 Agent 操作能力栈（Why）
1.1 商家业务的交互痛点：从 GUI 到 AUI 的范式跃迁
1.2 Agent 操作能力栈：API / WebMCP / AI 代操三层共存模型（API 覆盖自家业务、WebMCP 覆盖 agent 友好站点、代操覆盖长尾）
1.3 为什么代操是"最后一公里"：四个不可替代的理由
2. 2025-2026：代操格局的一年洗牌（Where）
2.1 关键事件时间轴：Operator 上线到合并下线（2025.01→2025.08）、WebMCP 从概念到 Chrome 146 Canary（2026.02）
2.2 行业两大阵营：Browser Agent vs Tooling for Agents
2.3 三个反直觉事实：
- Operator 合并下线（产品形态败、能力形态胜）
- Browser Use 从 Playwright 迁回 CDP（高层抽象输给底层协议）
- 视觉模型 ≠ 更好的 Agent（结构化 DOM 输入在真实业务页面上准确率反超纯视觉方案）
2.4 WebMCP 进展与法律信号：Amazon 起诉 Perplexity（从 C&D 升级为诉讼，agentic commerce 首次进入司法程序）
2.5 小结：格局变化指向同一个结论——感知/决策/执行/规模化四个工程问题，没有一家能靠单点方案解决
3. 四大工程挑战与解法（How）
3.1 看懂页面：IIFE 注入式 DOM 智能简化 + Full/Diff 双模式上下文工程 + 三套 Prompt Caching
3.2 稳定决策：Forced Function Calling + Schema-enforced CoT + 业务规则注入
3.3 准确执行：
3.3.1 CDP 原子操作（为什么抛弃高层 API）
3.3.2 React 受控组件绕过（框架对抗）
3.3.3 跳转 / iframe / Tab 状态协同（浏览器状态机）
3.4 规模化：三种部署形态（SDK/Extension/Node）统一核心 + Relay 解耦 + Agent/Player 双模式
过渡：能跑起来只是 60 分，能反复跑赢才是生产级——这就引出下一章的评测体系
4. 评测体系：代操的胜负手（Verify）
4.1 多维 Judge 系统：Rule / LLM / Functional / Safety / Composite
4.2 多 Adapter 横向对比：同一任务集跑不同代操框架（含 Berkeley RDI 揭示的 benchmark 注水问题与我们的规避设计）
4.3 Baseline 纵向迭代与统计显著性检验
5. 业务落地与三条新战线（Future）
5.1 业务落地速览与平台化成果
5.2 从一次成功到长期记忆：Skills + Memory
5.3 从破解到协商：与 WebMCP 协同演进（承接 1.2 的三层共存模型——代操不被 WebMCP 取代，而是互补）
5.4 从能跑到可信：安全边界与合规意识（承接 Amazon vs Perplexity 的法律启示）

听众受益：
1. 获得一套完整的 Agent 操作能力分层思维框架（API / WebMCP / 代操三层共存），可直接用于技术选型决策

2. 了解 AI 代操四大工程挑战（感知/决策/执行/规模化）的生产级解法与真实踩坑经验
3. 掌握面向代操场景的评测体系设计方法，告别 vibe-driven 式的 Agent 迭代
4. 获取 2025-2026 代操领域的完整行业格局认知（含 Operator 演进、WebMCP 标准化、Amazon vs Perplexity 诉讼等一手信息）
5.获得 Skills/Memory、WebMCP 协同、安全合规三个方向的前瞻性技术判断

钟楠

从聊天机器人到业务 AgentOS：电商搜索智能运营实践

抖音电商搜索运营平台前端负责人

抖音电商搜索运营平台前端负责人。拥有十年前端研发经验，长期深耕 B/C 侧复杂业务场景，在业务平台建设、交互体验设计与工程效率提升方面有丰富实践。目前主要关注 AI 在业务运营和研发流程中的落地，推动智能运营平台方向的探索与实践。

议题背景：
本次分享将围绕“从聊天机器人到业务 AgentOS”的交互演进展开，讨论智能体如何从被动问答工具变成可持续协作的常驻伙伴。内容将重点介绍如何以意图作为交互入口，通过状态表达、过程反馈、卡片交互和人工确认，让用户理解并掌控 Agent 的执行过程。分享也会结合 Workflow、工具调用、知识与记忆等工程设计，说明交互体验背后的系统支撑。最后将讨论如何通过安全机制与效果评测，让 Agent 从“能用”走向“好用、可规模化、可托付”。

内容大纲：
1. 为什么搜索运营需要 AgentOS
1.1 数据分析和 case 排查慢
1.2 配置链路长
1.3 隐性经验难复用
2. 我们对 AgentOS 的希望
2.1 愿景：从辅助到半自动驾驶。
2.2 衡量指标：操作效率、机会增量。
3. AgentOS 能做什么，不能做什么
3.1 咨询分析：SOP、历史经验、数据分析……
3.2 问题排查：case 诊断、干预建议……
3.3 运营配置：大促、货盘、活动干预的方案生成与协作流。
3.4 明确边界：复杂根因仍需专家确认，策略干预必须人审批。
4. 交互设计原则
4.1 飞书机器人的优势与交互设计理念。
4.2 Web 平台的定位转变和必要性。
5. 系统架构与 workflow
5.1 架构里都有些什么？我们如何考虑选型的？
5.2 一次请求的执行链路。
6. AgentOS 能力层：tool、cli、skill、知识库、memory
6.1 tool、cli：打通外部能力
6.2 知识库、memory：业务知识与个人偏好
6.3 skill：能力与知识的结合
7. 安全与可信：human in the loop
7.1 场景分级：读场景、写场景
7.2 原则：Agent 生成方案，人负责授权，系统按规则执行。
8. 评测体系
8.1 端到端结果评测：结论是否正确、可用。
8.2 轨迹评测：工具选择、执行路径、推理过程是否合理。
8.3 稳定性评测：同一题多次执行是否一致。
8.4 在线评测：用真实场景中采集的数据进行评测，实现数据飞轮。

听众收益：
1. 理解业务 AgentOS 的交互设计方法
2. 获得一套 AgentOS 落地的工程拆解框架

SECon组委会是由业界多位资深技术专家发起，负责组织技术指导委员会，并和委员会的专家一起挖掘全球软件工程领域的创新技术，同时依托智盟创课国内领先的人才能力提升服务供应商，组织专业的会务服务团队，全面推进会议的顺利落地，保证参会者体验。

服务总线：400-183-9980

商务合作：151-2264-3988 木子

票务联系：186-0005-0529 张老师

E-mail：speaker@qecon.com.cn

关注SECon公众号

添加SECon小助手，获取

会议最新资讯

免费领取大会两天PPT

点击领取

津ICP备2023002500号