专场出品人:吕睿韬
喜马拉雅珠峰AI产品负责人
花名秀才,现任喜马拉雅珠峰AI产品负责人,主导音频视频多模态大模型和AIGC应用开发。前依图科技产品总监,负责cv和speech to B产品体系构建和GTM。
专场:Agent 与大模型技术应用:探索、实践与创新 
基于大模型的Agent技术也迎来了前所未有的快速发展阶段,Agent = LLM + 规划 + 记忆 +工具使用的结构也在不断演进和迭代,产生了很多新的“变形”;同时Agent也已广泛被开发者应用在各个服务场景,有较多的优秀案例可以分享。本专题也关注 AI Agent 的创新创业机会,展示它在存量市场和增量市场下更多的实际应用与落地场景。
李乔
钉钉 AI 自适应拟人操作
阿里巴巴钉钉 高级技术专家
负责钉钉容器与开放技术,AI 自适应技术。其余时间是一名土味音乐 DJ,一个脱离了高级趣味的人。
如何让 AI Agent 能具备更全面的感知能力与行动能力,是一个重要的命题。本文将介绍一种思路以及对应的实践方案,通过让 AI Agent 具备“拟人化”的感知系统与行动系统,可以观察并操作目前各种面向“真人”用户的业务系统,进而让 AI Agent 可以具备更多的可能性。

内容大纲

1. 在当前 AI Agent 体系下, Agent 感知系统与行动系统面临的挑战
2. 什么是 AI 自适应拟人操作
3. 为什么需要“拟人”
4. AI 自适应拟人操作的技术体系
5. 一些拟人操作有趣的应用

听众收益
在 AI Agent 体系下,AI 自适应拟人操作技术面临的挑战与思考。
赵光程
音频创作Agent探索与实践
喜马拉雅 珠峰AI算法工程负责人
喜马珠峰AI算法工程负责人,10年+研发经验,拥有丰富的AI工程化和数据工程实践经历,擅长音视频处理与高并发系统的架构设计与实现。推动珠峰AI平台从0到1的搭建工作,主导整体框架设计、数据管线搭建与应用开发以及系统稳定性与监控防灾等方面的工作。
在大模型时代下,音频行业正经历着前所未有的变革和机遇。随着技术的飞速发展,音频内容生态日益丰富多样,涵盖了音乐、播客、有声书等多个领域。本次演讲将深入探讨当前音频内容生态的现状,分析其在创作、传播和消费环节所面临的挑战与机遇。同时,我们还将思考如何利用大模型的强大能力来革新音频创作流程,提高效率,降低成本,并为创作者提供更多灵感和可能性,从而推动音频行业的持续发展和创新。

内容大纲
1.喜马拉雅珠峰AI
2.音频内容生态现状
3.音频创作的挑战
4.大模型带来的变革机遇
5.音视频智能创作
尹顺顺
Soul的AI社交实践,探索人和AI共存的新社交网络
Soul  AI技术负责人
北京航空航天大学计算机科学与技术硕士,15年~19年搜狗担任资深算法工程师,推出了搜索荔枝问答、一站到底汪仔机器人等,19年1月加入Soul,负责内容理解、安全风控、搜素等业务,现任Soul AI技术负责人,推出了SoulX大模型,并落地 AI苟蛋、异世界回想、AI狼人杀、虚拟伴侣、语音通话等业务。
本讲座会介绍AI在Soul社交中的探索实践,围绕社交供给不足、社交效率低下、社交流量失衡这三个社交痛点,详细介绍Soul如何利用AI去解决这些痛点;同时会介绍Soul最新的AI技术和AI业务进展,包括但不限于狼人杀Agent,异世界回响、AI虚拟人体系等,欢迎大家莅临指导
张海立
从 LangGraph、llama-agents 看开源 Agent 框架的发展和竞争
LangChain Ambassador 《LangChain实战》作者
中国信息通信研究院“汽车云”工作组首批专家,目前专注的领域是无人驾驶运营运维平台的标准化和智能化研究。同时作为开源爱好者和布道师,长期关注和致力于云原生和前沿互联网技术的推广,现担任 KubeSphere 用户委员会上海站站长和 CNCF OpenFunction 项目管委会成员。
在开源大模型重塑 AI 开发生态的背景下,AutoGen、LangGraph 和 llama-agents 等开源 Agent 框架迅速崛起,各自以独特的设计理念展开错位竞争。本次分享将深入探讨这三大框架如何在开源生态中定位,以及它们在架构设计和功能特性上的差异。通过一些场景案例,我们将对比这些框架在多 Agent 协作、模型集成和可扩展性方面的优劣。我们还将分析这些框架在开源社区的发展趋势,探讨它们如何推动 AI 应用生态的繁荣。

内容大纲
1. 开源 Agent 框架概览
    1.1 AutoGen、CrewAI、LangGraph 和 llama-agents 的核心理念
    1.2 各框架的技术架构和设计思路的对比
    1.3 快速原型开发和高度流程控制的选择
2. LangGraph:图式工作流的创新应用
    2.1 基于状态图的工作流设计及其优势
    2.2 状态管理机制的创新与应用
3. llama-agents:分布式体系的融合实践
    3.1 异步优先设计理念及其在多 Agent 系统中的优势
    3.2 基于微服务的独立 Agent 架构
4. 总结与展望
    4.1 与其他 AI 工具和平台的集成前景
    4.2 未来可能的发展方向和创新点

听众收益
1. 深入洞察开源 Agent 框架的技术差异与应用优势: 通过本次演讲,听众将获得对 AutoGen、LangGraph 和 llama-agents 三大开源 Agent 框架的深度理解。他们将能够明确识别每个框架的技术特点、架构设计和适用场景,这对于在实际项目中选择最合适的 Agent 框架至关重要。这种洞察力将帮助资深技术人员在设计复杂 AI 系统时做出更加明智的技术决策。
2. 掌握多 Agent 系统的前沿设计模式与最佳实践: 演讲将深入探讨多 Agent 协作、图式工作流和分布式架构等先进概念在这些框架中的具体实现。听众将学习到如何利用这些设计模式来构建更加灵活、可扩展的AI应用。这些知识将帮助他们在自己的项目中实现更高效的Agent系统,提升系统的整体性能和可维护性。
田浩炜
基于Ray的eBay大模型高效微调平台实践
eBay 架构师
2014年硕士毕业于浙江大学计算机系。曾在蜻蜓FM、一条网络科技任职,负责搜索、推荐系统的算法及机器学习平台的系统架构的研发工作,在AI领域有十年的研发经历,在eBay先后参与了特征工程管理平台、统一推理平台,模型训练平台的研发。目前,主要致力于构建 eBay 内部基于 Ray 的新一代机器学习平台,同时负责eBay内部大模型的训练基建及推理平台的相关工作。
随着AIGC技术的兴起,eBay各业务部门积极采纳这一技术。为了跟上AI领域的快速发展,eBay的机器学习平台团队对基础设施进行了重要升级,基于Ray构建了新一代机器学习平台。
在本次演讲中,我们将详细探讨我们如何与生成式 AI 团队合作,在 Ray 平台上开发的大模型微调流水线。这个流水线覆盖了模型的微调、评估和部署的整个生命周期,显著提高了业务团队的工作效率,并大幅缩短了产品上市时间。我们还将分享微调流水线的设计理念,讨论在集成开源框架过程中遇到的挑战,以及我们为确保模型高效部署采取的策略。

内容大纲

1. Background: Emerging LLM Adoptions
   1.1 LLM Applications
   1.2 LLM Challenges
2. AI Sandbox & Ray Overview
   2.1 AI Sandbox for Idea Journey
   2.2 Ray: A Leading Solution in Generative AI
3. Athena: LLM Fine tuning as a Service
   3.1 Athena Project Overview
   3.2 Practical Insights of LLM Fine-Tuning on Ray
   3.3 Fast Applications Model deployment
4. LLM Solution Build & Evaluation
   4.1 LLM Solution on Ray
   4.2 LLM Evaluation Studio
5. Next Steps

听众收益

平台设计 / LLM高效微调实践 / LLM解决方案开发 / Ray与开源框架的集成工程实践。
SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
商务合作:木子  15122643988
票务联系:马静  18513067287
E-mail:speaker@secon.com.cn 
关注SECon公众号
添加SECon小助手,获取
会议最新资讯