专场出品人:彭鑫
专场出品人:茹炳晟
复旦大学计算与智能创新学院副院长、教授,CodeWisdom团队负责人
复旦大学CodeWisdom团队首席技术专家  腾讯研究院特约研究员  
国家级高层次人才计划入选者。中国计算机学会(CCF)杰出会员、软件工程专委会副主任、开源发展委员会常务委员,中国汽车工程学会汽车基础软件分会副主任,《Journal of Software: Evolution and Process》联合主编(Co-Editor),《ACM Transactions on Software Engineering and Methodology》、《Empirical Software Engineering》、《Automated Software Engineering》、《软件学报》等期刊编委。2016年获得“NASAC青年软件创新奖”,2023年入选上海市东方英才拔尖项目,2024年获得“中创软件人才奖”。主要研究方向包括软件智能化开发、云原生与智能化运维、泛在计算软件系统、智能网联汽车基础软件等。研究工作多次获得IEEE Transactions on Software Engineering年度最佳论文奖、ICSM最佳论文奖、ACM SIGSOFT杰出论文奖、IEEE TCSE杰出论文奖等奖项。担任2022年与2023年CCF中国软件大会(CCF ChinaSoft)组织委员会主席与程序委员会共同主席,以及ICSE、FSE、ASE、ISSTA、ICSME、SANER等会议程序委员会委员。
中国计算机学会(CCF)TF研发效能SIG主席,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,中国通信标准化协会TC608云计算标准和开源推进委员会云上软件工程工作组副组长,腾讯云架构师技术同盟入会主席,年度IT图书最具影响力作者,多本技术畅销书作者,著作有《软件研发效能提升之美》《现代软件测试技术之美》《测试工程师全栈技术进阶与实践》《多模态大模型技术原理与实战》《高效自动化测试平台:设计与开发实战》《软件研发效能提升实践》《软件研发效能权威指南》《现代软件测试技术权威指南》《高质效交付》《代码之外:软件工程师成长手记》等,译作有《软件设计的哲学》《整洁架构之道》《持续架构实践》《构建Agentic AI系统》《大模型驱动的软件测试:从理论到实践》《平台工程》《企业架构决策:战略框架与实施指南》《AI领导力》《现代软件工程》《计算机科学通识:计算思维培养与多学科问题解决实践》《DevOps实践指南(第2版)》《精益DevOps》《基础设施即代码-模型驱动的DevOps》等,国内外各大技术峰会的联席主席,出品人和Keynote演讲嘉宾。公众号“茹炳晟聊软件研发”主理人。
专场:智能体赋能软件研发的真实战场
联合出品
复旦大学CodeWisdom团队
本专场由复旦大学 CodeWisdom 团队联合出品,聚焦「学术前沿探索 + 企业产业落地」双轮驱动,带来多维度原创研究,直击 AI Agent 在软件研发领域 “概念热闹、落地难产” 的痛点,用硬核研究与真实案例,打通从理论框架到生产级实践的全链路闭环。
核心亮点:
产学研深度融合:既有高校团队的前沿理论与原创方法,又有大厂一线的生产级案例,既讲清 “为什么这么做”,也拆解 “具体怎么做”,实现从底层逻辑到落地细节的完整闭环。
直击研发痛点:聚焦复杂系统开发、AI 辅助开发评测、漏洞治理、人机协同等行业共性难题,提供可落地的解决方案与方法论,帮你避开 “Demo 可行、生产翻车” 的坑。
覆盖全场景需求:无论你是想探索 AI 原生研发架构的技术负责人,还是需要解决真实项目中 AI Agent 落地问题的工程师,都能在这里找到适配的经验与启发。

张刚
Agent时代的演进式设计
上海英慕科技 资深技术专家
软件工程博士,上海英慕软件科技资深架构师,《软件设计:从专业到卓越》作者。25年一线研发和管理经验,长期致力于先进软件工程方法,特别是演进式设计、大模型辅助开发的探索和实践。
议题背景:
AI大幅提升了代码生成的效率,但是如何让它转换为企业的真实业务产出?我总是看到让Agent 7*24小时持续生成代码的案例,究竟能不能做到,有没有必要?本演讲通过若干项目的真实演进历程,揭示软件开发的本质是持续地探索和发现,演进式设计则是深度符合AI时代软件设计的开发模式。

内容大纲:
1. 为什么有人总是宣传它们的编码智能体可以连续运行几十小时,而我总是做不到?
2. 软件开发本质上不是一个建造过程,而是一个持续探索和发现的过程——问题定义、功能边界、交互形态,都无法在最初被完整预见。
3. AI增强了探索和发现的效率,“做中学”是软件开发的常态。
4. 演进路径的规划和工程实践的掌握,是工程师的核心能力。“人类在环”的核心不是写代码,而是判断演进方向。
5. AI能力越强,越需要快速反馈和调整。
6. 在实践中构建支持演进式设计的工程思维和基础设施,控制和管理软件复杂性,最大化软件开发的效率。
 

彭鑫
复杂系统视角下的软件智能化开发机遇与挑战
复旦大学计算与智能创新学院副院长、教授,CodeWisdom团队负责人
国家级高层次人才计划入选者。中国计算机学会(CCF)杰出会员、软件工程专委会副主任、开源发展委员会常务委员,中国汽车工程学会汽车基础软件分会副主任,《Journal of Software: Evolution and Process》联合主编(Co-Editor),《ACM Transactions on Software Engineering and Methodology》、《Empirical Software Engineering》、《Automated Software Engineering》、《软件学报》等期刊编委。2016年获得“NASAC青年软件创新奖”,2023年入选上海市东方英才拔尖项目,2024年获得“中创软件人才奖”。主要研究方向包括软件智能化开发、云原生与智能化运维、泛在计算软件系统、智能网联汽车基础软件等。研究工作多次获得IEEE Transactions on Software Engineering年度最佳论文奖、ICSM最佳论文奖、ACM SIGSOFT杰出论文奖、IEEE TCSE杰出论文奖等奖项。担任2022年与2023年CCF中国软件大会(CCF ChinaSoft)组织委员会主席与程序委员会共同主席,以及ICSE、FSE、ASE、ISSTA、ICSME、SANER等会议程序委员会委员。
大模型及Agent等AI技术的发展助推软件开发进入智能化时代。在过去一年中,氛围编程更是掀起了一波新的热潮。在这种风起云涌的发展浪潮中,我们愈发需要从“系统复杂性”这一第一性原理的视角出发去理解和思考AI技术在软件开发中的作用。本次报告将在分析系统复杂性的含义及其来源的基础上,围绕软件智能化开发面临的机遇和挑战分享我们的一些观点和实践探索。
陈鑫
Qoder新一代SWE Agents系统颠覆传统软件研发模式
阿里巴巴 Qoder IDE负责人
阿里巴巴资深技术专家,通义灵码、Qoder IDE 技术负责人。带领团队积极探索 Coding Agent 能力的上限,在上下文工程、智能体架构、AI Coding企业落地等方面有丰富一线实践经验。
议题背景:
传统软件研发长期面临开发周期长、人力成本高、重复性工作繁重等挑战。开发者将大量时间消耗在代码编写、调试、文档查阅和环境配置上,真正用于创造性工作的精力十分有限。
Qoder新一代SWE Agents系统应运而生。它不是简单的代码编写工具,而是一个具备自主规划、执行和验证能力的智能软件工程体系。系统能够深度理解代码语义和项目上下文,像一个资深软件团队一样进行需求分析、方案设计、代码实现和问题诊断。通过多智能体协作机制,Qoder可并行处理复杂任务,实现从构想到交付的端到端自动化。
这一变革正在重塑人机协作范式:开发者从"编码执行者"转变为"架构决策者",将精力聚焦于业务创新和系统设计。本次演讲将深入解析Qoder的核心技术架构,展示真实场景下的落地实践,并探讨AI驱动的软件研发新范式如何重新定义行业未来。

演讲大纲:
1. 从流程增强走向流程重塑
    1.1 软件研发效能的本质
    1.2 AI Coding的产品与技术演进过程
    1.3 从流程增强走向流程重塑的必然趋势
2. SWE Agents:重新定义软件工程
    2.1 什么是SWE Agents?从被动工具到主动智能体的跃迁
    2.2 自主规划:需求拆解、方案设计、路径决策
    2.3 代码理解:深度语义分析与全局上下文感知
    2.4 执行验证:编码、调试、测试的完整闭环
    2.5 多智能体协作:专业分工,并行处理复杂任务
3. Qoder多智能体架构解析
    3.1 智能体角色设计:规划者、执行者、审查者的协同分工
    3.2 调度引擎:任务编排与智能体动态调度
    3.3 代码知识图谱:项目级语义理解与跨文件推理
    3.4 工具链生态:终端、浏览器、IDE的深度集成
    3.5 安全可控机制:沙箱隔离、权限管控、人机确认
4. 人机协作新范式带来的组织变革
    4.1 角色重构:开发者从"代码生产者"到"工程决策者"
    4.2 团队演进:更小的团队,更大的产出
    4.3 能力升级:未来工程师的核心竞争力是什么?
    4.4 AI赋能而非替代:人机协作的最优解

茹炳晟
玩具题满分,真实项目瘫痪?
- 系统复杂性视角下的AI辅助开发能力“真”评测
复旦大学 CodeWisdom团队首席技术专家  腾讯研究院特约研究员
中国计算机学会(CCF)TF研发效能SIG主席,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,中国通信标准化协会TC608云计算标准和开源推进委员会云上软件工程工作组副组长,腾讯云架构师技术同盟入会主席,年度IT图书最具影响力作者,多本技术畅销书作者,著作有《软件研发效能提升之美》《现代软件测试技术之美》《测试工程师全栈技术进阶与实践》《多模态大模型技术原理与实战》《高效自动化测试平台:设计与开发实战》《软件研发效能提升实践》《软件研发效能权威指南》《现代软件测试技术权威指南》《高质效交付》《代码之外:软件工程师成长手记》等,译作有《软件设计的哲学》《整洁架构之道》《持续架构实践》《构建Agentic AI系统》《大模型驱动的软件测试:从理论到实践》《平台工程》《企业架构决策:战略框架与实施指南》《AI领导力》《现代软件工程》《计算机科学通识:计算思维培养与多学科问题解决实践》《DevOps实践指南(第2版)》《精益DevOps》《基础设施即代码-模型驱动的DevOps》等,国内外各大技术峰会的联席主席,出品人和Keynote演讲嘉宾。公众号“茹炳晟聊软件研发”主理人。
1. LLM评测的行业现状
2. 如何客观看待评测的结果
3. LLM评测 vs Agent评测
4. 结果评测 vs 过程评测
5. 现有评测体系的人为局限性
6. 评测的本质思考和软件工程的本质
7. 有效评测体系建立的基本思路
8. 评测体系建立的工程实践

贝振东
认知边界与范式跃迁:
面向复杂系统的 Agentic SDLC 与人机协同工程实践
汇丰科技  AI 应用技术专家
中国科学院大学博士,现任汇丰科技 AI 应用技术专家。曾任华为、阿里云 AI 算法和大数据系统技术专家。在国际顶级期刊及会议发表论文 10 余篇。目前专注于 AI 智能体驱动的软件研发范式及复杂系统工程落地。  
内容大纲:
1. 范式破局:大模型时代的工业级智能体演进
    1.1 跨国金融架构的 Agentic 演化路径
    1.2 巨型遗留系统的引入挑战与熵增
    1.3 未来软件工程:SDLC 与认知对齐
2. 架构重塑:基于数字孪生与测试驱动的驱动机制
    2.1 严监管场景的确定性编码架构
    2.2 TDD 驱动:生成质量的收敛函数
    2.3 代码数字孪生:溯源与图谱共生
3. 协同动力学:效能涌现与组织溢出效应
    3.1 规模化实验设计与多维效能归因
    3.2 交互演化:人机协同的非线性洞察
    3.3 组织溢出:专家的能力杠杆效应
4. 认知约束:从行为收敛到领域场景对齐
    4.1 领域深水区:典型失效与边界剖析
    4.2 知识断层:逻辑发散与工程脱轨
    4.3 Agent Harness:轨迹纠偏与业务对齐

听众收益:
大规模组织的规模化落地路径
    5.1 工程蓝图: 标准化演进与落地路径
    5.2 管理策略:专家先行与人机结对
    5.3 范式迁移:知识约束型 Agent 框架

郭圆平
领域知识驱动的代码智能体:
毕方AI工程师在鸿蒙应用开发场景中的实践与思考
华为 IDE技术专家 毕方 IDE 智慧化技术负责人
AI领域从业近二十年,曾就职于百度、微软工程院等公司,在自然语言处理、智能搜索引擎、个人智能助手等AI应用领域有丰富经验。加入华为后专注于大模型与智能体在软件工程领域的应用技术、面向代码仓的复杂系统治理、以及人机协同开发新范式探索等研究方向。现主导毕方IDE及毕方AI工程项目,落地于鸿蒙应用开发平台DevEco Studio上,为开发者提供AI原生的开发体验。
议题背景:
当前AI Coding工具在鸿蒙开发场景中存在以下难点和挑战:
1) 鸿蒙系统处于高速增长期,不同时期的鸿蒙代码混入训练数据引发的API版本混乱、滞后、幻觉等问题
2) 鸿蒙设备类型多,通常的自动化测试技术和代码自动修复技术难以彻底解决多设备适配性问题
3) 其他生态向鸿蒙生态进行批量迁移的需求强烈,由此带来的长程任务可控性问题
为此我们构建了一套运用领域知识驱动代码智能体的方法论,将领域知识转化为可验证的领域Spec、可复用的领域Workflow、以及可靠的领域Harness。
另外我们还构建了以CodeBase为代表的一系列基础设施作为支撑。  

宋扬
互联网&游戏领域,AI赋能研发落地的探索与实践
元境生生 技术VP
研究生毕业于复旦软件工程实验室。元境生生Singularity工作室技术负责人,负责AI+游戏项目的研发,同时进行AI辅助开发提效、游戏内容创作相关探索与实践。之前负责阿里巴巴/元境云游戏PaaS平台建设等业务。对业务服务端架构及游戏研发、与美术等职能协作有丰富经验。
议题背景:
1. 团队研发流程中的AI建设,多职能协作提效,例如代码review、知识库、自动化测试等流程建设。
2. AIGC,研发和美术的协作,例如3D模型、动捕、美术资源等
3. 基于软件工程理念对AI coding的思考,未来研发流程AI建设的思考

内容大纲:
1. 先让AI成为队友
    1.1 积极拥抱,但不能盲目乐观
    1.2 AI时代,软件工程的重要性
    1.3  可能的一些误区
2. 个人的一些尝试、思考和建设
     2.1 sdd开发
     2.2  工作流&skills
     2.3 重视对AI的反馈
3. 团队研发流程中的AI建设
    3.1 研发流程提效,知识库、代码review、AI审查、自动化测试
    3.2 存量项目与新项目使用AI提效
4. 基于AIGC,研发和美术的协作
    4.1 2D素材、视频、3D资产
    4.2 AI动捕建设与价值
    4.3 AI给团队角色定位的变化
5. 基于软件工程理念对AI coding的思考,未来研发流程AI建设的思考

孙家正
移动端GUI智能体进展与挑战
复旦大学 CodeWisdom 团队 博士生
复旦大学CodeWisdom博士生,研究方向为Agentic System与GUI Agent
议题背景:
本报告围绕移动端 GUI 智能体技术展开梳理,聚焦多模态大模型驱动下的手机自动化交互能力。报告从“思、忆、看、做”四个维度分析其关键技术路线,包括提示工程、模型微调、多智能体协作、长期记忆构建、屏幕状态表示和操控机制。报告同时揭示了当前技术仍面临执行速度、长期记忆可靠性、页面状态建模、计算成本和长流程上下文管理等挑战。总体来看,移动端 GUI 智能体正在从简单的界面操作工具,演进为能够理解用户意图、积累应用知识并协同完成复杂任务的智能助手,为未来移动应用使用与测试自动化提供了新的技术路径。

内容大纲:
1. 介绍GUI智能体的背景知识
2. 结合论文调研和开源产品,介绍GUI智能体架构设计、模型训练等方面的近期现状(自2024年起至今)
3. 讨论目前的挑战与业界的共性问题,以及对应的可能值得探索的解决方向。

刘俊伟
基于数字孪生思想的特性驱动开发智能体框架
复旦大学CodeWisdom团队 博士生
复旦大学CodeWisdom博士生,研究方向为基于大语言模型智能体的端到端应用开发。
议题背景:
随着大模型与智能体技术的快速发展,端到端自动化应用开发正在成为研究与实践的热点。然而,当前主流开发框架大多仍采用一次性瀑布式流程,缺乏对软件开发过程中不同抽象层(需求、设计、实现)之间,以及层内不同迭代间关系的显式建模。这种模式往往将复杂的软件工程问题,简化为依赖模型能力进行仓库上下文理解与代码修改,缺乏成熟软件工程方法的支撑,从而限制了系统在真实开发场景中的可靠性与可扩展性。本次分享将基于经典的特性驱动开发(Feature-Driven Development, FDD)方法,提出一种面向智能体的端到端应用开发工作流。该方法通过对目标系统进行结构化拆解与依赖建模,构建以“特性地图(Feature Map)”为核心的三层数字孪生视图体系(业务层、设计层、开发层),实现可监督、可溯源、可扩展的有序开发过程,为复杂软件系统的智能化开发提供新的实践路径。

内容大纲:
1. 端到端应用开发中的挑战
    1.1  广泛采用瀑布流,难以应对迭代开发和复杂项目的上下文规模
    1.2  不同视图(需求 / 设计 / 代码)之间缺少关联建模
    1.3  高度依赖模型能力进行依赖上下文进行定位、推理和修改
2. 特性驱动开发与LLM-based agent的适配性
    2.1 FDD 方法论简介
    2.2 FDD 在智能体开发中的优势
          2.2.1 可结构化的中间产物
          2.2.2 总体设计 + 演进式设计的平衡
          2.2.3 天然支持增量式开发
3. 基于多层数字孪生视图的特性驱动应用开发方案
    3.1 需求拆解与总体设计
    3.2 特性拆解与依赖建模
    3.3 三层数字孪生视图体系
    3.4 基于特性依赖的有序开发
4. 展望未来:实现真正可演进的复杂应用开发
    4.1 从新应用开发到支持需求演进
    4.2 从单人开发到团队开发

听众收益:
1. 理解Agent自动化开发的真实挑战
2. 了解将软工工程的经典思想赋能智能体时代的软件开发的实践流程
3. 理解多层数字孪生在软件开发中的价值
4. 探讨未来智能化应用开发的发展方向

俞凯
设计约束视角下的 Issue 修复智能体评估方法
复旦大学 CodeWisdom 团队技术专家
复旦大学CodeWisdom硕士生,研究方向为软件工程隐式知识挖掘与智能体可信评估。
议题背景:
当前,基于大语言模型的 Issue 修复智能体评估主要依赖于“测试通过率”。然而,我们在研究中发现,现有评估基准脱离了真实的软件工程实践。在真实项目中,代码不仅要跑通测试,还必须严格遵守项目特有的“设计约束”(如架构规范、错误处理策略等),而这些约束很少被硬编码在测试用例中 。为了揭示并量化这一缺陷,我们构建了全新的基准测试集 SWE-SHIELD。基于该数据集的大规模实证研究表明:当前的测试通过率提供了一种“虚假的繁荣”,很多通过测试的案例都埋下了技术债务。并且,即便给予最先进的智能体显式提示,它们依然面临的“设计不遵从”的情况。

内容大纲:
1. 自动化 Issue 修复评估的隐患与反思
    1.1 广泛采用的“测试通过率”指标,难以全面反映真实工程质量
    1.2 案例引入:高度依赖单元测试导致“高通过率、高技术债”的盲区陷阱
2. 从隐式经验到结构化基准:SWE-SHIELD 构建简述
    2.1 设计知识在 PR 讨论与代码审查中的混杂与散布的特性
    2.2 SWE-SHIELD 数据集概览
3. 实证研究发现:智能体面对“设计约束”的真实表现
    3.1 尽管测试通过率较高,但设计满足率普遍不足一半,存在显著违规风险。
    3.2 功能正确性与设计满足率几乎无相关性,独立的评测维度  
    3.3 即便提供显式设计指南,违规率仍超过 30%,说明其难以内化设计约束。
4. 展望未来:迈向符合真实软件工程规范的智能体
   4.1 智能体架构演进:从代码生成,走向支持复杂架构依赖与上下文的推理
   4.2 探索基于显式约束引导的可控智能体工作流

听众收益:
1. 理解当前 AI 辅助 Issue 修复领域主流评测体系的真实风险与挑战
2. 理解“设计约束”在模型评估与代码生成中的价值
3. 探讨未来构建更加严谨、可维护的智能软件工程应用的发展方向
曹毅恒
大模型赋能漏洞治理
复旦大学CodeWisdom团队 博士生
复旦大学CodeWisdom博士生,研究方向为软件供应链安全。
议题背景:
漏洞治理始终是软件安全领域的一大核心问题。大模型为该问题提供了一把极具威力的“新武器”。然而,如何真正发挥这把武器的威力,使其从简单的提示词工程进化为可靠的治理工具,仍极具挑战。本报告将介绍团队在大模型赋能漏洞治理方面的探索与思考,主要包括大模型赋能的软件漏洞检测、漏洞补丁精简,以及漏洞补丁迁移等。

内容大纲:
1. 软件漏洞检测
传统基于静态分析的漏洞检测工具误报率高,而现有基于大模型的检测工具因程序特征建模不精确,导致输入上下文存在偏差,使得模型推理缺乏依据,同样易产生误判。本报告将介绍一种融合静态分析与大模型的漏洞检测技术,将静态分析的确定性规则与大模型的语义推理能力深度结合,构建出完整的程序语义图,再从该程序语义图中抽取完整的上下文,为大模型提供依据,实现更加精准的漏洞检测。

2. 漏洞补丁精简
漏洞补丁往往并非“纯净”。开发人员常在修复漏洞时顺带进行代码重构或功能更新,这些“补丁噪音”严重影响了下游的漏洞验证与迁移等任务。本报告将介绍一种基于大模型的“过滤-恢复”两阶段的漏洞补丁精简技术,在函数级与语句级分别过滤非关键变更,并逐步恢复被遗漏的关键变更,最终精准识别出修复漏洞所必需的最小关键变更语句集。

3. 漏洞补丁迁移
在多分支协同开发或具有上下游依赖的软件生态中,漏洞补丁的跨分支与跨项目移植往往是一项极具挑战的任务。本报告将介绍一种结合语义切片与语法补全的智能化漏洞补丁迁移技术,通过抽取补丁的核心语义签名来重建准确的上下文,随后利用经过任务对齐微调的大模型生成目标修复代码,并通过多维一致性校验与迭代精修保障补丁迁移的正确性。

谢森煜
AI原生应用架构与Benchmark实现
复旦大学CodeWisdom团队 博士生
复旦大学CodeWisdom博士生,研究方向为AI原生系统。
议题背景:
随着LLM等AI技术的发展,AI原生应用逐渐成为了新一代的软件形态。我们通过开展调研访谈和分析开源产品,总结了当前AI原生应用的实践现状,并提出了存在的问题。为了向学术界和业界提供一个开放的试验场,我们发布了一个AI原生基准系统,并在github上开源。我们希望该开源项目能为学术界和工业界提供一个研究智能化软件系统的开放基础,支撑研究者在真实业务拓扑和动态系统环境中开展研究,推动对Agentic AI与复杂业务系统深度融合后的体系结构、评测、调试与治理等问题的持续探索。

内容提纲:
1. 介绍云原生和AI原生应用的背景知识
2. 结合调研访谈和开源产品,介绍AI原生应用的实践现状
3. AI原生基准系统的设计
    3.1 AI原生基准系统的动机:我们为什么需要这样一个Benchmark系统?
    3.2 系统的整体业务和架构设计:系统是如何探索在业务系统中将Agentic AI融入用户交互、业务编排、资源处理等环节。
    3.3 端到端案例展示:将具体的案例与背后的调用链结合分析,展示该Benchmark的设计细节和运行情况。
    3.4 开发引发的对Agent架构设计的思考:在开发过程中不断地迭代和演化,从Plan&Execute模式到完全单Agent架构,到最后按照Main Agent+领域SubAgent的方式落地。同时也启发我们思考如何通过Ontology来更好地实现AI原生应用中的神经符号融合。

钟艺
从像素级 UI 还原到 Harness 工程:码灵 AI 的企业级端到端研发实践
快手 主站技术部 前端智能应用负责人
快手技术专家。2019 年加入快手,长期从事前端工程化与研发效能建设,在前端工程化体系建设、AI 驱动的软件工程方向拥有丰富实践经验。曾负责快手前端静态部署托管服务,建设其成为快手公司级前端部署标准方案,并从 0 到 1 建设快手主站大前端应用框架等多项研发基建。目前主要负责快手主站码灵项目,探索从 AI Coding 到端到端 AI 研发流程的落地实践,推动研发模式向 AI 驱动的智能化演进。
议题背景:
当前 AI Coding 工具在 Demo 场景中表现亮眼,但在真实企业研发环境中仍面临诸多挑战:视觉还原精度不足、功能生成不可控、生成代码难以满足生产级质量标准,使 AI 很难真正参与端到端的软件研发流程。
在企业级实践中,我们构建了一套端到端 harness 研发范式。从 UI 生成切入,通过视觉结构解析与多模态融合实现稳定的像素级还原;在功能生成阶段,我们进一步引入 Spec 驱动机制,通过多Agent x Skills 协同完成页面骨架、数据层、组件逻辑与业务规则生成,从而有效控制复杂工程场景下的生成稳定性与可维护性;在质量保障方面,通过出码—视觉校准—评测的闭环机制,使生成代码能够在执行反馈中持续修正与收敛。
本次分享将重点介绍这套端到端 Harness 的整体架构设计与关键技术实现,探索 AI 在企业级软件工程中的落地路径。


内容大纲:
1. 企业级落地端到端研发流程的挑战
2. 整体方案: 构建企业级端到端 Harness 流程
3. 视觉稳定性: 如何做到像素级还原?
4. 功能稳定性: 基于多 Agent的 SDD 流程实践
5. 质量稳定性: 构建可自校正的交付级 Ralphloop
6. 面向未来: AI驱动的研发范式变化

听众收益:
1. 理解企业级 AI Coding 落地面临的关键挑战:了解在企业级真实研发环境中 AI Coding 在视觉理解、代码生成稳定性和质量保障方面面临的核心问题。
2. 了解使用AI 实现高精度 UI 还原的方法:掌握如何通过视觉结构解析与多模态信息融合提升 UI 还原精度,在复杂设计稿场景中实现接近像素级的生成效果。
3. 掌握构建生成代码自校正闭环的工程实践:理解如何通过执行反馈、视觉评测与自动修复机制,让 AI 生成系统逐步收敛到可交付结果。

周亚平
eBay Risk 基于 Agent 的三层闭环建设 
—— 从研发提效到业务进化的体系化实践
eBay 支付风控 模型工程负责人
毕业于上海交通大学,先后供职于京东、eBay支付风控部门。参与和负责eBay风控数据工程、模型工程、风控智能体以及自动化工作流调度平台的研发。
议题背景:
本议题聚焦企业内部 Agent 如何从单点提效走向体系化建设,形成由工具层、流程层、业务层共同驱动的三层闭环。
核心不在于叠加更多单点 Agent,而在于围绕研发与业务链路,逐步完成:
    • 工具层:能力组件化
    • 流程层:Agent Workflow 自动化
    • 业务层:Agent Skill Knowledge 沉淀与应用
最终推动系统从“局部提效”走向“持续进化”。

内容大纲:
1. 工具层:构建可复用的 Agent capabilities
    围绕研发与分析链路中的高频动作,沉淀关键能力组件,包括:
        • 需求理解,UI 原型生成与验证
        • 后端工程协同
        • 测试生成与 Code Review
        • Agent Team 协同开发
    亮点:
将分散的高频动作沉淀为可复用、可组合的 Agent capabilities,为后续自动化提供统一能力基础。
2. 流程层:以 Agent Workflow 承接标准任务
    通过自研 Agent Workflow 平台,承接流程化、零碎、高频及紧急任务,实现:
        • 事件触发
        • 任务编排
        • 自动推进
        • 可治理执行
    亮点:让原本依赖人工串联的工作进入可自动运行、可持续响应的 Workflow 闭环。
3. 业务层:以 Agent Skill Knowledge 支撑复杂判断
    将风险分析中的历史案例、业务规则、领域术语、调查路径和专家经验,沉淀为 Agent Skill Knowledge,并通过 Business Skill 编排调用 Tool Skills,支撑:
        • 自动化调查
        • 分析与报告生成
        • 辅助判断与经验回流
    亮点:不只是自动执行任务,更让业务知识能够被系统理解、调用和持续复用。

代表性案例:
1. 基于 Agent Workflow 的 model image 自动升级与部署闭环
        • 自动订阅漏洞修复 JIRA ticket
        • 自动提取 image 与 model service 信息
        • 自动触发修复、部署与验证
        • 实现流程化工程任务的自动推进与及时响应
2. 基于 Agent Skill Knowledge 的 risk 数据自动分析闭环
        • 自动拉取上下文与数据源
        • 基于规则与经验生成分析路径
        • 自动生成 SQL、执行分析与输出报告
        •  实现经验沉淀、辅助判断与能力回流

核心价值:
本议题关注的重点,不是单个 Agent 或单条流程的优化,而是企业如何围绕工具层、流程层、业务层构建一套可持续沉淀、可稳定运行、可治理演进的 Agent 智能体系。其价值在于:
        • 让高频动作沉淀为能力组件
        • 让标准任务进入 Agent Workflow
        • 让业务知识沉淀为 Agent Skill Knowledge
        • 让系统持续积累、持续反馈、持续进化
这也是企业内部 Agent 建设从“应用尝试”走向“组织级能力基础设施”的关键路径。

SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
服务总线:400-183-9980
商务合作:151-2264-3988  木子  
票务联系:186-0005-0529  张老师
E-mail:speaker@qecon.com.cn
关注SECon公众号
添加SECon小助手,获取
会议最新资讯