专场出品人:陈耀 
抖音电商搜索大前端负责人
抖音电商搜索大前端负责人。过去在有赞负责大前端中台能力建设,现于抖音电商负责电商搜索相关的大前端业务。长期带领团队在 AI Coding、AIGC、运营智能化等方向深度推进 Agent 技术与大前端体系的融合,持续探索智能体在高复杂度业务场景下的工程化落地路径。
专场:AgentOS与交互设计   
当智能体从 "单点工具" 走向 "常驻伙伴",运行智能体的底座与人机交互的范式正在被重新定义。AgentOS 不只是一个新的运行时,更是一次从 App 到 Agent、从点击到意图、从屏幕到环境的操作系统级重构。本专场聚焦 AgentOS 的架构演进与交互形态的变革,我们既关注 AgentOS 在进程调度、记忆管理、工具调用、权限与安全等方面的工程化挑战,也关注 Agent 如何 "看懂屏幕、理解意图、操作世界"—— 从桌面 / 移动端 GUI Agent,到机器人与具身场景中的感知 — 决策 — 执行闭环。
论坛汇聚 AgentOS 与交互方向的一线实践者与研究者,分享真实落地中的架构取舍、交互设计原则与效果验证方法。希望帮助听众建立一张覆盖 "OS 底座 — 交互层 — 物理世界" 的完整地图,理解 AgentOS 的边界与可能性,并为自身业务找到可行的切入点,共同推动 Agent 从 "能用" 走向 "好用、可规模化、可托付"。

赵庆杰
再造新物种--龙虾个人助手向企业级通用Agent平台的进化
快手  高级技术专家
高级技术专家,资深架构师,十年深耕电商领域,主导落地了多项公司级、部门级的技术项目,具备优秀架构设计能力、纵向技术深度和行业影响力,目前聚焦在电商B端业务场景的AI基础架构设计和业务研发。
议题背景:
OpenClaw的爆火让我们看到了一套通用Agent优秀实现范式,然而其单机架构、TS实现、本地工作区、高权限的tool集合、高冗余prompt等等设计,如果直接用于线上服务,每走一步都可能踩在性能、成本、安全的死线上。为了彻底决绝这些问题,我们在保留龙虾 Agent + Skill + Memory 的核心DNA的基础上,在部署模式、安全边界、运维可观测性、成本消耗等多个维度重新设计整体工程架构,打造一个真正适合企业级业务场景的分布式通用Agent平台。

内容大纲:
1. Openclaw很火,但不适合企业线上业务
    1.1 技术拆解龙虾爆火的本质
    1.2 服务线上业务的局限性
2. 龙虾进化:打造企业级通用 Agent平台
    2.1 企业业务和个人助手的差异
    2.2 架构设计推演
    2.3 核心技术挑战
    2.4 关键设计分享
          2.4.1 Agent Runtime
          2.4.2 ReActLoop
          2.4.3 Multi Agent
          2.4.4 Client Protocol
3. 业务场景落地情况
4. 未来规划

听众受益:
1. 学习具体业务场景下技术挑战的应对思路
2. 了解一个优秀架构设计背后的思考逻辑
3. 了解到通用AI Agent平台的关键设计

陈波
AI Agent 的最后一公里:构建生产级代操能力
阿里巴巴 前端技术专家
阿里巴巴前端技术专家,Alibaba.com 生意助手前端负责人。长期聚焦 AI 与多端工程的交叉领域,主导建设了 AI 代操框架 actum——覆盖浏览器插件、页面 SDK、云端容器三种部署形态,支撑商家业务的智能导航、自动化选品等多个场景。当前主攻 AI Agent 操作能力层的工程化落地与评测体系建设。
议题背景:
当 AI Agent 具备了理解意图和规划任务的能力后,"如何可靠地在浏览器中执行操作"成为落地的最后一公里。本次演讲提出 Agent 操作能力栈的三层共存模型(API / WebMCP / AI代操),并聚焦工程挑战最大的兜底层——AI 代操。基于 Alibaba.com 商家业务的实战经验和自研框架 actum,我们将深入剖析页面感知(DOM 智能简化与上下文工程)、决策稳定性(Schema-enforced CoT)、执行准确性(CDP 原子操作与框架绕过)、规模化(三端复用架构)四大工程挑战及其解法,并分享一套面向代操场景的多维评测体系——告别 vibe-driven 式的Agent 迭代。最后展望Skills/Memory、WebMCP 协同、安全合规三条未来战线。

内容大纲:
1. 交互困境与 Agent 操作能力栈(Why)
    1.1 商家业务的交互痛点:从 GUI 到 AUI 的范式跃迁
    1.2 Agent 操作能力栈:API / WebMCP / AI 代操 三层共存模型(API 覆盖自家业务、WebMCP 覆盖 agent 友好站点、代操覆盖长尾)
    1.3 为什么代操是"最后一公里":四个不可替代的理由
2. 2025-2026:代操格局的一年洗牌(Where)
    2.1 关键事件时间轴:Operator 上线到合并下线(2025.01→2025.08)、WebMCP 从概念到 Chrome 146 Canary(2026.02)
    2.2 行业两大阵营:Browser Agent vs Tooling for Agents
    2.3 三个反直觉事实:
          - Operator 合并下线(产品形态败、能力形态胜)
          - Browser Use 从 Playwright 迁回 CDP(高层抽象输给底层协议)
           - 视觉模型 ≠ 更好的 Agent(结构化 DOM 输入在真实业务页面上准确率反超纯视觉方案)
    2.4 WebMCP 进展与法律信号:Amazon 起诉 Perplexity(从 C&D 升级为诉讼,agentic commerce 首次进入司法程序)
    2.5 小结:格局变化指向同一个结论——感知/决策/执行/规模化四个工程问题,没有一家能靠单点方案解决
3. 四大工程挑战与解法(How)
    3.1 看懂页面:IIFE 注入式 DOM 智能简化 + Full/Diff 双模式上下文工程 + 三套 Prompt Caching
    3.2 稳定决策:Forced Function Calling + Schema-enforced CoT + 业务规则注入
    3.3 准确执行:
          3.3.1 CDP 原子操作(为什么抛弃高层 API)
          3.3.2 React 受控组件绕过(框架对抗)
         3.3.3 跳转 / iframe / Tab 状态协同(浏览器状态机)
    3.4 规模化:三种部署形态(SDK/Extension/Node)统一核心 + Relay 解耦 + Agent/Player 双模式
          过渡:能跑起来只是 60 分,能反复跑赢才是生产级——这就引出下一章的评测体系
4. 评测体系:代操的胜负手(Verify)
    4.1 多维 Judge 系统:Rule / LLM / Functional / Safety / Composite
    4.2 多 Adapter 横向对比:同一任务集跑不同代操框架(含 Berkeley RDI 揭示的 benchmark 注水问题与我们的规避设计)
    4.3 Baseline 纵向迭代与统计显著性检验
5. 业务落地与三条新战线(Future)
    5.1 业务落地速览与平台化成果
    5.2 从一次成功到长期记忆:Skills + Memory
    5.3 从破解到协商:与 WebMCP 协同演进(承接 1.2 的三层共存模型——代操不被 WebMCP 取代,而是互补)
    5.4 从能跑到可信:安全边界与合规意识(承接 Amazon vs Perplexity 的法律启示)

听众受益:
1. 获得一套完整的 Agent 操作能力分层思维框架(API / WebMCP / 代操 三层共存),可直接用于技术选型决策
2. 了解 AI 代操四大工程挑战(感知/决策/执行/规模化)的生产级解法与真实踩坑经验
3. 掌握面向代操场景的评测体系设计方法,告别 vibe-driven 式的 Agent 迭代
4. 获取 2025-2026 代操领域的完整行业格局认知(含 Operator 演进、WebMCP 标准化、Amazon vs Perplexity 诉讼等一手信息)
5.获得 Skills/Memory、WebMCP 协同、安全合规三个方向的前瞻性技术判断

钟楠
从聊天机器人到业务 AgentOS:电商搜索智能运营实践
抖音电商 搜索运营平台 前端负责人
抖音电商搜索运营平台前端负责人。拥有十年前端研发经验,长期深耕 B/C 侧复杂业务场景,在业务平台建设、交互体验设计与工程效率提升方面有丰富实践。目前主要关注 AI 在业务运营和研发流程中的落地,推动智能运营平台方向的探索与实践。
议题背景:
本次分享将围绕“从聊天机器人到业务 AgentOS”的交互演进展开,讨论智能体如何从被动问答工具变成可持续协作的常驻伙伴。内容将重点介绍如何以意图作为交互入口,通过状态表达、过程反馈、卡片交互和人工确认,让用户理解并掌控 Agent 的执行过程。分享也会结合 Workflow、工具调用、知识与记忆等工程设计,说明交互体验背后的系统支撑。最后将讨论如何通过安全机制与效果评测,让 Agent 从“能用”走向“好用、可规模化、可托付”。

内容大纲:
1. 为什么搜索运营需要 AgentOS
    1.1 数据分析和 case 排查慢
    1.2 配置链路长
    1.3 隐性经验难复用
2. 我们对 AgentOS 的希望
    2.1 愿景:从辅助到半自动驾驶。
    2.2 衡量指标:操作效率、机会增量。
3. AgentOS 能做什么,不能做什么
    3.1 咨询分析:SOP、历史经验、数据分析……
    3.2 问题排查:case 诊断、干预建议……
    3.3 运营配置:大促、货盘、活动干预的方案生成与协作流。
    3.4 明确边界:复杂根因仍需专家确认,策略干预必须人审批。
4. 交互设计原则
    4.1 飞书机器人的优势与交互设计理念。
    4.2 Web 平台的定位转变和必要性。
5. 系统架构与 workflow
    5.1 架构里都有些什么?我们如何考虑选型的?
    5.2 一次请求的执行链路。
6. AgentOS 能力层:tool、cli、skill、知识库、memory
    6.1 tool、cli:打通外部能力
    6.2 知识库、memory:业务知识与个人偏好
    6.3 skill:能力与知识的结合
7. 安全与可信:human in the loop
    7.1 场景分级:读场景、写场景
    7.2 原则:Agent 生成方案,人负责授权,系统按规则执行。
8. 评测体系
    8.1 端到端结果评测:结论是否正确、可用。
    8.2 轨迹评测:工具选择、执行路径、推理过程是否合理。
    8.3 稳定性评测:同一题多次执行是否一致。
    8.4 在线评测:用真实场景中采集的数据进行评测,实现数据飞轮。

听众收益:
1. 理解业务 AgentOS 的交互设计方法
2. 获得一套 AgentOS 落地的工程拆解框架

SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
服务总线:400-183-9980
商务合作:151-2264-3988  木子  
票务联系:186-0005-0529  张老师
E-mail:speaker@qecon.com.cn
关注SECon公众号
添加SECon小助手,获取
会议最新资讯