专场出品人:柴思远 
智谱企业商业技术中心总经理,大数据算法技术专家
组建智谱解决方案团队,支持过美团、360、金山、小米等重点大模型项目落地;曾历任大搜车数据中台负责人、妙计旅行联合创始人、搜狗搜索 NLP 研究员等。
专场:RAG与生成式AI行业应用
RAG(RAG, Retrieval-Augmented Generation)做为AGI的重要技术之一,正在被广泛应用于问答系统、对话系统等领域,显示了其在理解和生成自然语言方面的有效性。尤其适用于需要访问实施信息、私域知识的场景,实现了更高效、精确、智能的信息管理与信息利用。本专场聚焦RAG与生成式AI在各领域的应用,涵盖从理论到实践的最新进展。参会者将了解技术前沿、成功案例和未来趋势。专场适合研究人员、企业开发者、行业专家,助力他们更好地理解和应用这些技术。
张颖峰
走向多模态RAG时代
英飞流 InfiniFlow 联合创始人/CEO
英飞流 InfiniFlow 联合创始人,连续创业者,先后负责多年搜索引擎,数据库内核,云基础架构和大数据架构,以及人工智能核心算法研发,包括广告推荐引擎,计算机视觉和自然语言处理。先后主导并参与多家大型企业数字化转型,支撑日活千万,日均两亿动态搜索请求的互联网电商业务。自InfiniFlow创业一年以来,已孵化了2个开源AI项目,一个是开源半年多就获得2万github星标的RAG引擎RAGFlow,一个是专用于RAG场景的AI原生数据库Infinity,后者服务前者,共同解决LLM落地的普遍痛点。
随着大模型多模态能力的增强,RAG是否也需要走入多模态时代?从企业场景上来讲,多模态RAG并不限于对日常图片,音视频的检索增强,还应该涵盖当下占据大部分的非结构化文档,发掘出这些数据的商业价值。本演讲将从多模态RAG的两条技术实现路径切入,带领开发者理解当下多模态RAG领域的发展情况和技术前沿,以及未来如何迭代和演进的趋势。

内容大纲
1. 多模态RAG介绍
    1.1 什么是多模态RAG
    1.2 技术发展的现状
2. 基于语义Chunking的多模态RAG
    2.1 “雕花”和语义Chunking
    2.2 “雕花”的两种技术手段
3. 基于VLM的多模态RAG
    3.1 VLM的进展
    3.2 为什么延迟交互如此重要
4. 如何解决基于VLM的技术挑战
    4.1 实现复杂度
    4.2 Infra上需要做好哪些支撑
    4.3 如何提升VLM效果
5. 总结和展望
    5.1 雕花还是VLM
    5.2 未来发展

听众受益
1. 充分理解当下多模态RAG的发展情况
2. 了解多模态RAG的价值和实现路径
3. 了解多模态RAG的未来发展
Julie Cheng is Sr Director of Ads Engineering at eBay with 20+ years in the advertising industry.
Started in engineering and went on to lead product management teams at Yahoo! and Apple.
Made a personal decision to switch back to engineering at Apple and Google. She holds a Computer Science degree from University of California Berkeley and a MBA from Kellogg School of Management from Northwestern University.
Julie Cheng
Binbin Li
eBay Advertising Management and Optimization via LLMs
基于LLMs的eBay广告系统管理与优化
Sr Director of Ads Engineering at eBay  
the Director of Engineering at eBay Advertising
Binbin Li is currently the Director of Engineering at eBay Advertising, leading the applied research and engineering teams for Ads Sell Side Guidance. He has spent the last decade working in online advertising for companies such as Facebook Ads and Disney Ads. His past tenure also includes KPMG, SAS, and Goldman Sachs. He holds a Ph.D. from Boston University, Boston, USA and a B.Sc. from Tsinghua University, Beijing, China.
The recent advancement of Large Language Models (LLMs) and Generative Artificial Intelligence (GenAI) has rocked the world through its superb capabilities. Grounded on the right use cases, LLMs / GenAI could bring multifold technological improvement and significantly
accelerate the development of performant and sticky products that customers love. In this talk, we will share some battle-tested learnings in leveraging LLMs / GenAI to improve existing capabilities and/or build new products in eBay Advertising, such as improving targeting efficiency, identifying buyer behaviors, automating customer journey etc.
冷延鹏
硅谷小模型技术实践及开源社区思考 (Future towards Opensource 
On-device AI)
Nexa AI  总经理
多年空间智能与AI Agent产品经验。在NEXA AI负责从0-1搭建小参数量大模型的开源社区 - NEXA AI Model Hub,期间和Hugging face联合举办了硅谷超级人工智能体大赛,孵化多个开源的AI Agent项目。冷先生从清华本科毕业后前往哈佛大学深造,就读期间承办了哈佛第二届人工智能x虚拟现实大会,全美有400多位相关顶尖创作者、硅谷创业者与投资人前来参加。曾带领来自哈佛,麻省理工和卡耐基梅隆的顶尖团队开发人工智能体项目获得MIT加速器Top2。
本次演讲将从Octopus-V2模型切入,带领开发者理解当前硅谷以及全世界终端AI的发展情况和独特优势,激发终端模型部署的潜力,共创终端开源新时代。

内容大纲

1. 背景与困境
     1.1 硅谷小模型生态
     1.2 小模型推理优势
     1.3 开源小模型趋势
2. 新思路 - Octopus 系列模型
    2.1 功能令牌 - Functional Tokens
    2.2 自研模型整体架构
          2.2.1 Octopus V2  
          2.2.2 Octo-net     
          2.2.3 Octo-Planner
          2.2.4 Octopus V3
3. 端侧开源模型社区的实践
    3.1 如何找到适合自己终端的AI? - NEXA Model Hub
    3.2 如何部署终端开源模型? - Coral SDK
    3.3 开发者应用Demo展示
4. 总结与展望

听众收益

1. 充分理解当下终端模型的发展情况
2. 了解适用于终端部署的模型与框架
3. 终端模型开源社区的发展特点与未来趋势
谢宇
基于VectorDB的AI实践
腾讯云 数据库技术专家
从事数据库领域开发16年,深入理解多种数据库的技术和客户最佳实践,熟悉国内外云服务和数据产品,擅长数据库生态建设。现负责腾讯云向量数据库技术,致力于在AI时代打造非结构化数据、半结构化数据、结构化数据的数据枢纽,帮助客户挖掘更多的数据价值以取得业务成功。
随着AI应用的快速发展,向量数据库逐步脱颖而出,越来越多的企业正在或考虑使用向量数据库在企业中业务场景中落地,以发挥更大的数据价值,最终为企业起到降本增效的作用。腾讯云向量数据库团队积累了大量的客户最佳实践,在综合效果、性能、成本等方面有深刻的理解,并致力于打造最好用的向量数据库,在AI时代帮助更多的企业挖掘出更多的数据价值。

内容大纲
  • 1. VectorDB应用场景
  • 2. 基于VectorDB的AI效果提升实践
  • 3. VectorDB的技术与应用实践

Tomasz Lelek
Mistakes and Trade-offs when optimizing the hot-path: when premature 
optimization becomes early optimization
权衡与取舍——优化热路径:将过早优化变成提前优化
海外资深架构师《软件开发中的决策--权衡与取舍》原书作者
When building systems, performance requirements are essential. With SLA data, we can design performance tests that help us assess systems before production. Observing the Pareto principle, we find that the code delivering the most business value often comprises a small part of the codebase. This insight allows us to identify and optimize the “hot path”—code executed for most user requests—yielding significant performance gains by focusing on a small subset. This presentation will demonstrate a process, supported by the Pareto principle, SLA, and performance tests, to analyze and optimize the hot path, with data validating each optimization step.
在构建系统时,性能需求至关重要。通过SLA(服务水平协议)数据,我们可以设计性能测试,在生产前评估系统。遵循帕累托原则,我们发现,提供最多业务价值的代码通常只占代码库的一小部分。这个洞察使我们能够识别并优化“热点路径”——即大多数用户请求执行的代码,从而通过关注少量代码实现显著的性能提升。此次演讲将展示一个基于帕累托原则、SLA和性能测试的流程,分析并优化热点路径,并通过数据验证每个优化步骤的效果。
SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
商务合作:木子  15122643988
票务联系:马静  18513067287
E-mail:speaker@secon.com.cn 
关注SECon公众号
添加SECon小助手,获取
会议最新资讯