专场出品人:陈鑫
阿里云 通义灵码产品技术负责人
致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。
专场:AI应用新范式与探索
随着大模型技术的成熟以及其在代码生成领域的优秀表现,我们看到,一个以智能化为核心驱动力的软件研发 3.0 时代即将到来——这一时代将围绕大模型来构建新一代软件研发智能化工具,最终创造出“AI 研发应用范式”,让研发效能发生质变。
基于大语言模型的研发工具将会发展到什么阶段?如何进一步挖掘大语言模型的强大推理能力、理解能力和分析能力,给研发乃至非研发提供更强的辅助?AI程序员的到来将对研发带来哪些颠覆性影响?
张昕东
从编码助手到AI程序员,AI开发范式的颠覆与创新
阿里云 通义灵码技术专家
毕业于美国哥伦比亚大学,现任职于阿里云,长期从事软件工程智能化领域研究和实践,包括代码生成,代码搜索,缺陷定位,修复推荐,测试生成等方面,在ICSE、FSE Industry track有数篇论文发表。现专注于通义灵码产品插件端、服务端开发和模型数据处理与效果调优等,致力于为广大开发者提质提效,提高研发幸福感。
软件应用的开发范式正在发生改变,用户只需定义问题、提出需求,分钟级完成一个应用开发将成为常态。通过“人+AI研发工具”,每个人类程序员都将成为超级个体。
AIGC时代为软件研发团队提供新的生产力,为企业软件研发降本增效。本次分享,将深度解析全球AI研发工具的发展,从软件研发全流程出发,详细介绍AI的出现将如何改变现有的研发模式,并进一步解析智能编码产品与AI程序员背后的产品能力和技术上的突破进展,帮助开发者完成软件研发活动中的各类任务。

内容大纲
1. AI大模型对软件工程的影响
    1.1 过去一年AI辅助编程工具法扎
    1.2 开发模式变化:Developer+Tool 模式
    1.3 Developer+Copilot 模式  
    1.4 AI Pilot+Navigator 模式
2. 如何构建优秀的AI编码助手
    2.1 代码生成补全是刚需场景
    2.2 代码生成补全面临挑战
    2.3 如何正确评价代码生成补全能力
3. 企业落地AI编码助手的挑战与解决方案
    3.1 落地阻碍与挑战
    3.2 不断突破能力上线的思路
    3.3 全工程理解:解决准确度问题
    3.4 多场景下表现突出:又快又准
    3.5 企业级检索增强,解决个性化问题
    3.6 自定义扩展,解决能力宽度问题
4. 从工具到方案,研发流程的改变
    4.1 DAO模块代码自动生成
    4.2 辅助命名,注释翻译
    4.3 API开发文档自动生成
    4.4 自定义规范代码检查
5. 从企业级到工程级,全面覆盖各类研发场景
    5.1 智能体:突破代码助手上限
    5.2 AI程序员的发布与变革
    5.3 AI 程序员应用场景
    5.4 全自动修复 Bugfix Agents
    5.5 全自动测试生成 UnitTest Agents

听众收益
1. 了解AI编码助手和AI程序员的发展趋势和分类
2. 了解企业在AI编码落地场景上如何进行方案选择
3. 通过企业实践案例启发自身的企业需求
4. 分享对于软件开发领域的洞察与趋势
祝海林
大模型的第一个杀手级应用场景:auto-coder.chat 将AI辅助编程带到新高度
Auto-Coder/Byzer-SQL 作者 Kyligence技术合伙人
目前致力于使用AI赋能数据和编程:
1. 开发了 AI 辅助编程工具 auto-coder.chat,创新性和功能完备度在全球都处于较为领先的阶段。
2. 首推全球第二代架构 RAG产品, 纯llm-native 设计的 auto-coder.rag ,相比市场主流至少有20%到60%的效果提升。
3. 探索性端到端 NL2SQl 引擎 Super-Analysis 项目,该项目不仅实现了准确的将自然语言到SQL的转化以及,还实现了对SQL对非结构化数据以及结构化数据的联合分析。
其中开源作品 Byzer-SQL 获得22年中国开源创新大赛二等奖,23年浦东新区人工智能创新大赛一等奖。个人入选中国22年开源先锋33人,荣获23年全球人工智能开发者先锋大会「开发者先锋」称号。
1.  为什么AI辅助编程是大模型的第一个杀手级应用
2.  AI辅助编程的本质是什么
3.  AI辅助编程的当前的主流派别
4.  auto-coder.chat 简介
5.  AI辅助编程的核心竞争力是什么:上下文管理
6.  auto-coder.chat 构建的壁垒
7.  番外篇: AI编程中的“设计师”功能

听众收益
1. 了解当前AI辅助编程的现状,行业发展趋势
2. 快速国产AI辅助编程的提升效率
3. 对大模型应用的理解更加深刻
周阳
AI大模型赋能的全流程研发效能平台建设
美的集团 研发效能部长        
美的集团研发效能部部长,从0到1主导建设了美的集团一站式研发效能平台,有10余年从事研发效能领域相关工作经验,对数字化转型,研发效能平台建设、研发效能提升等有丰富的经验。
在当前AI技术迅猛发展的背景下,研发效能工具正经历全面变革。美的集团通过AI大模型赋能的全流程研发效能平台建设,显著提升了研发效率和质量。
此次演讲将围绕以下两个核心问题展开:
1. 一站式研发效能平台的建设:详细讲解美的集团一站式研发效能平台的构建过程。平台的核心功能和架构,包括需求管理、开发平台、自动化测试、度量。      
2. AI驱动的变革:介绍AI大模型在研发效能平台中的具体应用,如智能代码生成、自动化测试、项目管理优化等。通过实际案例展示AI如何提升研发效率和质量。    
通过阐述这两个问题,本次演讲将为大家提供一个基于AI大模型实现研发效能提升的思路范式,助力企业把握AI技术红利,加速研发智能化变革。

内容大纲

1. 企业建设研发效能的平台的困境
2. 美的研发效能平台整体架构
3. 各平台建设
    3.1 需求管理平台
    3.2 CICD平台
    3.3 自动化测试平台
    3.4 度量平台
    3.5  midea workspace

听众受益
1. 制造业如何构建一站式研发效能平台过程的经验
2. 了解AI大模型在研发效能提升中的具体应用和实际效果
3. 获得将AI技术与研发流程深度融合的创新思路和方法
4. 
通过具体案例,直观感受AI驱动的研发效能提升效果
廖子寒
生成式大语言模型在搜索领域的突破与应用
蚂蚁集团 算法工程师
目前是华东师范大学计算机科学与技术博士在读生,主要研究方向为自然语言处理、大语言模型以及推荐系统。我在顶级学术会议和期刊上发表了多篇论文,包括ACL、TKDE、PAKDD等,研究课题涵盖语义搜索、长上下文建模、代码检索和推荐系统去偏等多个领域。我的研究工作致力于推动大语言模型在实际应用中的表现,解决模型精度和效率的问题。我曾在蚂蚁集团担任研究型实习生,负责优化大语言模型在语义搜索和代码检索中的应用。实习期间,我参与了大语言模型的设计和调优,推动了多项技术落地应用,并成功将相关模型提升至行业领先水平。
本次演讲将围绕D2LLM和Codefuse-CGE模型的创新研究展开,主要聚焦于大语言模型在语义搜索和代码搜索领域的应用。D2LLM方法通过构建教师-学生模型,在对称和非对称搜索任务中实现高效的语义理解和查询优化。该方法结合LLM与bi-encoder架构,通过引入特征和排序模仿损失,大幅提升模型在复杂语义任务中的准确性和效率。在代码搜索方面,Codefuse-CGE模型利用PMA聚合机制和轻量化处理方案,有效降低了存储压力并提升嵌入性能,成功在多种代码检索任务中超越传统代码嵌入模型和闭源模型。实验结果表明,Codefuse-CGE的各个大小及各个维度版本在精度和效率上均达到SOTA水平,进一步推动了大模型在实际应用中的可行性和可扩展性。

内容大纲
1. 引言
    1.1 研究背景与动机
          1.1.1 大规模语言模型在语义搜索和代码检索中的应用需求
          1.1.2 当前方法的局限性:BERT类双编码器与LLM交叉编码器的性能瓶颈
    1.2 目标与贡献
          1.2.1 提出D2LLM和CGE模型,优化语义搜索和代码嵌入的效率与效果
2. D2LLM模型设计与优化
    2.1模型概述
          2.1.1 D2LLM的基本架构与功能
          2.1.2 语义搜索模型在对称与非对称搜索任务中的应用
    2.2 现有方法对比
          2.2.1 BERT双编码器
          2.2.2 LLM交叉编码器
    2.3 教师-学生模型架构
          2.3.1 教师模型的激发LLM理解能力
          2.3.2 学生模型的高效编码结构
    2.4 训练目标与损失函数
          2.4.1 对比模仿:教师模型句子关系的对比学习
          2.4.2 排序模仿:正负样本的排序学习
          2.4.3 特征模仿:特征信息的迁移
    2.5 实验结果
          2.5.1 与SOTA方法的性能对比:准确性与计算效率的提升
          2.5.2 实际运行速度分析
3. CGE模型在代码嵌入中的应用
    3.1 代码嵌入任务的挑战
          3.1.1 代码与自然语言的表达差异
          3.1.2 精度与存储压缩的平衡
    3.2 现有方法的不足
          3.2.1 BERT类代码嵌入模型
          3.2.2 LLM类代码嵌入方法的存储压力过大
    3.3 CGE模型架构设计
          3.3.1 基于CodeQwen1.5-7B-Chat微调,提升代码理解能力
          3.3.2 采用PMA模块进行句子级语义聚合,保证嵌入质量
          3.3.3 魔改PMA实现多维度存储压缩
    3.4 训练策略与目标
          3.4.1使用多种方法挖掘难负样本
          3.4.2 对比学习强化模型效果
          3.4.3 embedding还原,确保代码语义的高效保留
    3.5 实验结果分析
          3.5.1 多种数据集上的准确率和效率表现
          3.5.2 开源及行业应用前景
4. 总结与未来展望
    4.1 未来工作
          4.1.1 在语义搜索和代码检索任务中进一步优化
          4.1.2 探索其他大规模语言模型在实际应用中的潜力

听众受益
  1. 1. 深入了解大语言模型在语义搜索和代码检索中的应用
    听众将学习到如何有效利用大语言模型优化语义搜索和代码嵌入任务的性能和准确性,提升其对复杂查询的处理能力。
  1. 2. 掌握D2LLM和CGE模型的架构和创新点
    通过了解教师-学生模型架构、PMA聚合机制等新颖设计,听众将获得有关构建高效、低资源消耗的语义和代码检索模型的实用知识。
  1. 3. 学习训练目标和损失函数的应用技巧
    您将分享在语义搜索和代码检索中如何设计对比学习和特征模仿损失,使听众掌握提升模型表现的方法,适用于不同检索任务中的模型优化。
  1. 4. 了解模型性能优化与实际应用的平衡
    通过实验结果和对比分析,听众可以学到如何在精度和计算资源之间取得平衡,使大模型能够在实际业务场景中高效应用。
潘碧玲
构建高效企业Agent:从单体到编排的智能升级
阿里云 公共云事业部高级技术专家
阿里云公共云事业部高级技术专家,目前主要负责阿里云大模型应用实施相关工作,帮助客户基于大模型需求设计、产品实施、基础模型效果优化和应用集成等工程化手段落地企业大模型应用。客户和场景覆盖交通物流行业、零售和汽车制造、互联网等行业的智能问答、智能创作、智能执行和智能办公等场景方向。在企业大数据应用、数据治理等大数据应用领域也有丰富经验,负责了大量阿里云大数据相关项目的设计工作和阿里云DCMM乙方5级认证等相关工作。
随着大模型技术的飞速发展,人工智能应用成为当下最热的话题之一。这两年越来越多的企业开始探索和尝试构建一些简单的智能体应用,服务于日常工作的效率提升等相关企业目标,例如常见的包含知识检索、智能写作等。随着企业大模型应用的持续的深入探索,我们发现传统的单一智能体(单个大模型节点构建的应用)虽然在某些简单场景下表现良好,但是无法很好满足企业多样化的复杂业务需求,尤其是流程链路较长、多模态融合等大模型应用需求。为了更好的支持企业复杂场景的大模型应用需求,很多企业都开始尝试构建包含多个大模型节点的工作流应用、智能体编排应用等,通过多个大模型节点/智能体的编排和协同工作,更好地适应复杂的业务环境,提高应用的灵活性和可扩展性。

本次演讲将主要是介绍单体智能体、工作流agent、智能体编排应用的概念,讨论通过场景划分选择合适的智能体构建方案,支持企业在不同业务场景下的智能Agent落地实践。通过实践案例分享在构建智能体的过程中核心会面对的相关落地痛点,包含知识的准备、数据和内容安全、多轮对话、多节点的记忆携带、拟人化等相关问题。

内容大纲
1. 智能体应用的发展和建设分类
    1.1 自我介绍
    1.2 大模型发展和智能体的概念解释和澄清
    1.3 智能体构建的方案演进和现状整理
2. 介绍3类智能体的构建方案
    2.1 单体智能体的介绍、工程实践和应用场景案例
    2.2 工作流agent的介绍、工程实践和应用场景案例
    2.3 智能体编排的agent的介绍、工程实践和应用场景案例
3. 企业智能构建场景的问题和核心关注点探讨
    整体的交付流程介绍和核心关注节点介绍
    3.1 场景选择和方案设计
    3.2 知识准备和治理
    3.3 多轮对话和记忆
    3.4 拟人化尝试
    3.5 性能的考虑
    3.6 数据安全和敏感词控制
    3.7 用户运营和持续迭代
4. 阿里云大模型服务平台介绍
    简单介绍基于阿里云大模型服务平台的智能体构建能力,如何通过配置话的方式构建单体智能体、工作流agent和智能体编排的agent。

听众收益

1. 了解智能体应用的发展趋势和分类
2. 初步了解不同的智能体构建方案的区别和在场景落地上如何进行方案选择
3. 通过企业实践案例启发自身的企业需求
SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
商务合作:木子  15122643988
票务联系:马静  18513067287
E-mail:speaker@secon.com.cn 
关注SECon公众号
添加SECon小助手,获取
会议最新资讯