DeepSeek技术前瞻与应用实践-2025深圳站_SECon全球软件工程技术大会-橙柚科技

专场出品人：刘广

智源人工智能研究院数据研究组的负责人

主导FlagAI开源项目、悟道天鹰（Aquila）系列语言大模型以及CCI3.0系列、Infinity-Instruct/-MM千万指令数据集系列等重要项目，目前正专注于基于大模型的数据合成技术的研究与应用，致力于推动该领域的技术进步和创新。

专场：DeepSeek技术前瞻与应用实践

聚焦 DeepSeek 核心技术演进与产业级工程化落地，围绕 “超越 DeepSeek” 的技术突围路径与 “驾驭 DeepSeek” 的工程实践双主线。希望本专场汇聚如下主题：
1. 技术突破：数据与架构的创新融合
数据合成革命：基于大模型Agent系统的万亿级高质量数据合成技术，实现通用领域数据的定向增强与知识密度跃升。
系统级优化：针对集群通信、存储和混合专家架构（MoE）的硬件协同优化，榨干硬件性能，极致降低训练和推理成本。
模型蒸馏实战：7B小模型的无损压缩方案（精度损失 < 1%），支持端侧部署与低资源场景应用。
2. 工程化实践：从研发到部署的全链路攻坚
私有化部署体系：国产化硬件适配方案、敏感数据零出域的混合云架构设计、千卡集群的弹性训练调度策略。
RAG 增强范式：行业知识库与 DeepSeek 的联合微调框架，实现 “检索 - 生成 - 校验” 闭环。
软工协同创新：代码生成场景的精准调优、智能测试用例生成与缺陷根因定位的工程集成方案。

刘广

OpenSeek项目的CoT数据合成和验证

智源人工智能研究院数据研究组的负责人

主导FlagAI开源项目、悟道天鹰（Aquila）系列语言大模型以及CCI3.0系列、Infinity-Instruct/-MM千万指令数据集系列等重要项目，目前正专注于基于大模型的数据合成技术的研究与应用，致力于推动该领域的技术进步和创新。

OpenSeek是由北京智源人工智能研究院（BAAI）发起的开源项目，旨在联合全球开源社区，推动算法、数据和系统的协同创新，开发出超越DeepSeek的下一代模型。在项目中针对模型推理能力提升，构建并开源了大规模CoT数据集CCI-4.0-CoT。从预训练和强化学习等多个阶段分析和验证了数据对推理能力提升的效果。欢迎关注和加入开源共建大模型。

内容大纲
1. OpenSeek介绍
2. DeepSeek推理能力分析
3. 推理能力对数据提出的挑战
4. 如何构建大规模推理数据
5. 如何验证推理能力提升
6. 实验和分析
7. 总结

听众收益
1. 如何提升模型推理能力
2. 如何大规模构建CoT数据集
3. 如何验证推理能力提升

黄佳

DeepSeek 驱动的企业级 RAG 及 MCP和A2A时代开发新范式

新加坡科研局 Lead Research Engineer

AI研究员，新加坡科技研究局Lead Research Engineer，曾主导政府、金融、医疗、电商和能源等领域的大型项目。近年以咖哥为笔名创作了《RAG实战课》《动手做AI Agent》《GPT图解大模型是怎样构建的》《零基础学机器学习》等多部风趣幽默并兼具技术内涵的作品，在大模型时代的AI技术领域产生了广泛影响力。

本次演讲以DeepSeek 大模型驱动企业落地 RAG（Retrieval-Augmented Generation）为切入点，系统梳理整个实施流程中的十大关键组件，剖析常见的RAG架构设计与开发难点，分享基于真实项目的最佳实践与优化策略。同时介绍MCP和A2A时代的RAG和LLM开发新范式和进化方向。

内容大纲
1. DeepSeek大模型驱动的RAG技术
1.1 DeepSeek的核心创新
1.2 DeepSeek为RAG落地带来了哪些改变
1.3 RAG在企业落地实施中的难点
1.4 RAG十大组件拆解
2. 行业RAG案例剖析
2.1 Text2SQL落地方案比较
2.2 医疗术语标准化系统
2.3 企业文档合规性检索与审计
2.4 GraphRAG 与知识图谱
3. 复杂RAG范式初探
3.1 Contectual Retrieval
3.2 Agentic RAG
3.3 Modular RAG
3.4 Multl-modal RAG
4. MCP和A2A时代的RAG新范式
4.1 RAG在Agent架构中的演进
4.2 RAG在Agent记忆系统中的双重角色
4.3 RAG作为Agent协作间的公共语言

听众收益
1. DeepSeek 如何支撑企业级 RAG 全链路
2. 理解从数据接入到生成评估的关键技术与优化思路
3. 金融、医疗等行业的实战落地经验
4. 把握 Agentic RAG、多模态 RAG 等前沿动态与升级路径

黄晓洁

腾讯TRMT赋能Deepseek通信优化

腾讯星脉网络通信库架构师

腾讯星脉网络拥塞控制算法负责人，深度参与新一代数据中心网络传输体系的技术演进。作为腾讯自研通信协议TiTa的核心设计者，在TiTa1.0阶段创新性实现动态自适应拥塞控制算法，在TiTa2.0阶段主导通信协议向主动式拥塞控制架构演进，并成功在腾讯自研算力网卡CNIC上实现落地部署。同时作为腾讯星脉网络高性能通信底座TRMT架构师，主导了以GPU为中心的通信加速方案，成功突破通信带宽瓶颈，支撑腾讯数据中心智算集群达成90%+通信效率。

1. 前瞻：从TCCL到TRMT
1.1 TCCL的特点与不足
1.2 TRMT：内存语义、GPU为中心的高性能通信底座
2. 实践：TRMT助力DeepEP实现性能突破
2.1 动机：原生DeepEP基于IB网络网卡单上行架构设计
2.2 TRMT适配网卡双端口，充分利用网卡带宽
2.3 TRMT构建以GPU为中心的通信方式，提高有效带宽
3. 思考：小消息高并发类通信
3.1 背景：PD分离、大EP带来的小消息通信需求
3.2 小消息通信的性能瓶颈，时延or带宽？
3.3 DeepEP-Alltoall的实践

SECon组委会是由业界多位资深技术专家发起，负责组织技术指导委员会，并和委员会的专家一起挖掘全球软件工程领域的创新技术，同时依托智盟创课国内领先的人才能力提升服务供应商，组织专业的会务服务团队，全面推进会议的顺利落地，保证参会者体验。

服务总线：400-183-9980

商务合作：151-2264-3988 木子

票务联系：18600050529 张老师

E-mail：speaker@secon.com.cn

关注SECon公众号

添加SECon小助手，获取

会议最新资讯

免费领取大会两天PPT

点击领取

津ICP备2023002500号-3