专场出品人:曹立成 
淘天集团 1688 终端架构负责人
曾就职于美团等互联网公司,负责过早期 React Native 技术体系的探索落地;作为核心成员参与 Logan 大前端日志系统的研发工作并推动开源。研究领域包括动态化容器、基础中间件、性能优化等。QCon 全球软件开发大会明星讲师、优秀出品人。
专场:终端AI的创新与应用 
AI 正从云端中心化计算加速向终端侧延伸。在用户体验、响应时延、数据隐私与云服务成本等多重因素驱动下,终端AI(On-Device AI)已成为产业演进的重要方向。无论是轻量高效的小模型,还是能力持续突破的端侧大模型(如1B~3B参数级),在算法压缩、推理优化与硬件协同的共同推动下,正以前所未有的速度实现在手机、PC、IoT设备、车载系统等多元终端的规模化落地。
本专题聚焦终端AI的技术创新与产业实践,深入探讨以下核心议题:
面向终端部署的大小模型轻量化与蒸馏技术
异构计算环境下模型推理的性能优化与能效提升
端侧大模型与小模型的协同架构与应用场景
终端产品通过AI化重构带来的体验升级与商业新空间
终端AI的未来趋势:个性化、持续学习与边缘智能生态
专题将结合系统优化、模型研发与应用落地的多维视角,呈现终端AI从技术突破到价值转化的完整图景。
专题受众:终端应用开发者、AI算法工程师、大模型研究人员、边缘计算从业者及AI产品经理
通过本专题,听众将全面了解终端AI的技术演进路径、典型应用案例与商业化潜力,洞察AI在“最后智能一公里”中的创新机遇与未来发展方向。
郝男(本名:杨春)
下一代分发体系:支付宝首页架构升级与AI 融合实践
支付宝 高级技术专家
目前负责支付宝首页、消息页、我的页面等核心 TAB,解决流量分发问题,追求人与货的精准匹配。曾作为支付宝五福主架构师参与过 8 年集五福项目,解决过千万并发、几十亿资金安全、新技术引入等问题,拥有丰富的大促经验。
「支付宝首页」作为支付宝产品的“第一窗口”,用户体验至关重要,它直接决定了用户的留存与活跃。打开速度、推荐精准度、服务可用性,始终是技术团队追求的核心目标。
在实现这些目标的过程中,我们面临着诸多挑战:
1. 渲染性能:首页从最初的静态图文发展到如今的复杂动效,如何在秒级完成渲染,保障丝滑体验?
2. 多样化终端环境:面对不同设备的性能差异,如何确保核心功能在各种场景下都能顺畅可用?
3. 服务可用性:海量用户与复杂功能并存,如何做到端到端稳定,服务可用率接近 100%?
4. 智能推荐:首页内容的相关性决定体验,我们如何实现从“人找服务”到“服务找人”的跃迁?
在本次分享中,我将深入解析这些核心问题,并介绍我们探索与实践的最新进展。

内容大纲
1. 支付宝分发的演进路径
    1.1 从静态文本与图片到动态动效,首页渲染能力的迭代
    1.2 终端环境多元化,分发体系面临更复杂的适配挑战
    1.3 用户规模与诉求持续增长,体验要求不断提升
    1.4 AI 时代的到来,为分发效率与精准度带来新机遇
2. 传统架构的挑战与冲击
    2.1 功能普惠:如何让不同终端环境下的用户都能体验核心功能
    2.2 高可用保障:在复杂场景中实现流畅、稳定的交互体验
    2.3 AI 融合:如何将智能技术融入推荐体系,实现体验与效果的双重提升
3. 架构突破与应对策略
    3.1 多技术突破与机制升级,提升用户覆盖率与一致性体验
    3.2 构建端到端的稳定性保障体系,确保服务高可用
    3.3 工程链路的极致优化,以及对“人、货、场”的新理解,驱动分发模式升级
4. 未来展望
    4.1 AI时代的进一步探索
    4.2 持续演进中的用户体验提升路径  
张明昆
打造面向操作系统的 AI 底座,支撑终端大模型落地
淘天集团 终端工程师
淘天集团 1688 终端工程师,负责终端架构设计与性能优化。2021 年加入阿里巴巴,2022 年加入 1688 终端架构团队,参与并推动 App 架构升级,专注终端性能、功耗与稳定性治理。当前聚焦终端 AI 能力与厂商硬件及系统底层的深度融合与优化。
近年来,终端形态正加速迈向多元化,未来将不再局限于 Android、iOS、HarmonyOS 等系统,随着以 AI 眼镜为代表的智能硬件快速崛起,多样化的设备类型和操作系统生态并存将成为常态。AI 底座必须具备强大的跨平台兼容能力,有效抹平不同操作系统之间的差异。边缘计算的核心在于如何更好地利用终端设备的硬件性能,而深度融合厂商/系统底层 AI 能力所带来的性能提升是质变性的。极致的性能优化,旨在应对大模型入端时在算力、功耗和内存等方面带来的严峻挑战。要让模型高效运行于设备的硬件(GPU/NPU)之上,需综合平衡多种因素,包括模型架构、内存限制、量化技术及部署配置等。本次演讲将介绍 1688 终端架构团队在推动 AI 能力落地过程中的思考与实践,结合主流厂商/系统硬件特性进行深度适配的经验,并通过典型业务场景展示其实际应用方式。

内容大纲
1. 背景
2. 跨平台高性能推理框架
    2.1 架构设计
    2.2 模型推理运行机制
3. 大模型入端关键技术
    3.1 模型架构优化
    3.2 内存优化
    3.3 优化效果
4.  应用场景
5.总结与展望

听众收益
1. 了解终端部署模型性能、功耗、体积等诸多方面存在的问题
2. 了解终端推理引擎如何与厂商/系统结合
3. 大模型在端侧推理的优化方案与落地场景

袁昊
端智能在抖音电商的应用实践
字节跳动 终端开发工程师
大前端行业多年从业经历,负责终端架构设计与性能优化,专注于终端性能、功耗与稳定性治理。当前聚焦终端 AI 能力与业务的深度融合与优化。
这是一场面向产品、研发与数据同学的“端侧 AI”实践分享:用真实案例与可复制的方法,帮助团队把端侧模型从概念推到业务现场。聚焦“如何真正落地”,而非技术炫技。
本次分享将聚焦“端智能”在真实业务中的落地:先拆解端智能的开发工作流。然后以电商直播“自动进房”为例,讲清模型选型、特征与打标、训练与上线的关键环节;如何将模型决策转为稳定动作,兼顾低负反馈与业务收益。最后总结端智能选题与特征设计的经验,并给出可扩展的通用端智能探索思路。

内容大纲
1. 端智能的挑战与开发工作流 
    1.1 端智能通用技术框架:主流框架和技术难点
    1.2 上手端智能:从基础指标开始了解端模型
    1.3 围绕“从需求到上线”的闭环:需求界定 → 数据与特征 → 标签与采集 → 训练与发布 → 监控与迭代。
2. 端智能的落地实践:让自动化更像自然的引导
    2.1 自动进房的动机与价值:让进入直播间的转换更自然,降低“被打扰”的感受。
    2.2 端模型选型:保证端云一致性、端侧资源与功耗在可接受范围内。
    2.3 特征中的关键设计:如何把“最优时机”的复杂判断拆解为“轻量高频”的稳定判断,降低落地难度。
    2.4 模型训练与调试:怎么调参才能更好的配合业务。
3. 端智能的经验复用:帮助团队判断“该不该做”“怎么做得稳”。
    3.1 选题三问:
          3.1.1 场景是否过度复杂、跨多个阶段?
          3.1.2 打标规则是否清晰?
          3.1.3 样本是否足够与均衡?
    3.2 业务 insights:特征设计、端侧与云侧的职责边界与协同原则。
    3.3 端云协同实践:端侧只做近场判断,不替代云侧全局优化;通过灰度、兜底与可观测打通研发到运营的闭环。
    3.4 扩展方向:在电商搜索、内容推荐等场景,以端侧“微决策”配合云侧“策略优化”复制落地路径。

SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
服务总线:400-183-9980
商务合作:151-2264-3988  木子  
票务联系:185-1306-7287  马静  
E-mail:speaker@secon.com.cn 
关注SECon公众号
添加SECon小助手,获取
会议最新资讯