专场出品人:向宇
ProtonBase 技术副总裁
曾就职于星网锐捷、百度和阿里巴巴,拥有丰富的嵌入式语音网关、支付系统、搜索引擎及大数据领域经验。
2010年加入阿里巴巴,作为阿里云实时数仓产品 Hologres 的创始团队成员,亲历了 Hologres 从零到一的创新过程,主要负责 Hologres 存储模块及底层基础设施的设计与优化工作。
专注于底层系统软件、大数据技术、性能优化、调试与系统架构等方面,具备深厚的技术功底和解决复杂技术问题的能力。
专场:AI时代数据架构的演进 
随着人工智能技术的飞速发展,企业数据架构正面临前所未有的挑战与机遇。传统的数据管理模式已难以应对AI对数据处理速度、存储容量、计算能力及智能化应用的高要求。
本专场将聚焦AI时代下数据架构的创新趋势与实践案例,探讨如何构建灵活、高效且高度可扩展的数据架构,以应对海量数据处理、实时分析和智能决策的需求。议题将涵盖实时数据湖与数据仓库的融合、多模数据管理与向量检索技术、智能数据分析平台的建设等前沿话题。通过本专场的深入探讨,与会者将获得构建高性能数据架构的关键洞察,助力企业在AI时代提升业务效率、加速创新进程,并实现更精准的数据价值挖掘。

孙旭锋
AI重塑数据生态:从元数据治理到智能决策的架构演进
曹操出行 数据仓库团队负责人 数仓架构师
曹操出行数据仓库架构负责人,曾就职于用友、京东、菜鸟、虾皮等公司,持续深耕大数据。主导公司PB级湖仓一体化架构设计与落地,擅长通过数据架构优化支撑出行业务场景,曾推动数据查询效率提升300%,成本下降40%。
随着生成式AI与LLM技术的爆发式发展,大数据架构正在经历从“被动响应”到“主动智能”的范式转变。本演讲聚焦大模型技术如何赋能数据架构的核心场景。

演讲提纲
1. 元数据管理的标准化落地:AI驱动的数据治理革命
2. 智能诊断:从故障排查到预测性运维
3. 指标异动的快速感知与归因:大模型的实时决策引擎
4. 未来展望:未来的数据架构将是“会思考的智能中枢”,从被动执行指令转向主动预判业务需求,驱动企业从数据驱动迈向AI驱动

王森林
AI 时代的数据架构变革:构建灵活、高效、智能的数据底座
ProtonBase 资深技术专家
毕业于浙江大学计算机系,获硕士学位,具有丰富的核心系统设计和研发经验。2013年加入阿里巴巴,曾任高级技术专家,负责搜索引擎,交互式引擎Hologres等系统的底层设计和研发。现专注于数据库的底层存储和高可用等方面的设计和研发工作。
随着人工智能技术的飞速发展,企业数据架构正面临前所未有的挑战与机遇。传统的数据管理模式已难以应对AI对数据处理速度、存储容量、计算能力及智能化应用的高要求。本次演讲将深入探讨AI时代下数据架构的创新趋势与实践案例,聚焦如何构建灵活、高效且高度可扩展的数据架构,以应对海量数据处理、实时分析和智能决策的需求。

内容大纲
1. 从湖仓一体到实时 AI 湖仓
    1.1 湖仓一体架构的演进
    1.2 传统数据湖与数据仓库的局限性
    1.3 如何解决数据孤岛问题,实现数据的高效管理与分析
    1.4 AI 时代的湖仓架构需求
    1.5 实时数据处理:AI 应用对实时数据流的需求,如实时推荐系统、实时定价等
    1.6 大规模并行计算:支持生成式 AI 和大模型的训练与推理
    1.7 数据流动性:如何在数据湖仓中实现高效的数据流动,支持实时特征工程
2. AI 数据架构的基础:在线特征库的关键作用
    2.1 机器学习与传统 AI:离线特征库的角色
    2.2 传统 AI 系统中,离线特征库的作用及其局限性
    2.3 离线特征库在批处理场景中的应用,如邮件营销、用户画像等
    2.4 生成式 AI 和大模型的崛起对特征工程带来的冲击
    2.5 实时特征工程:生成式 AI 和大模型对实时特征提取的需求
    2.6 在线特征库:如何通过在线特征库支持实时推理和实时决策
    2.7 特征新鲜度:从分钟级到亚秒级的特征更新需求
3. 实时 AI 湖仓的架构特点
    3.1 实时特征工程的要求与在线特征库的技术挑战
    3.2 低延迟数据处理:如何在亚秒级内完成特征提取和更新
    3.3 高吞吐量:支持大规模并发的实时数据处理
    3.4 一致性保证:在分布式环境下如何保证数据的一致性和可靠性
4. AI 时代的数据架构变革意义
    4.1 灵活性:支持多样化的数据处理需求,从批处理到实时处理
    4.2 高效性:通过分布式计算和向量化执行提升数据处理性能
    4.3 智能化:通过在线特征库和实时特征工程支持生成式 AI 和大模型的广泛应用

听众收益
通过本次演讲,与会者将获得构建高性能数据架构的关键洞察,助力企业在AI时代提升业务效率、加速创新进程,并实现更精准的数据价值挖掘。
韩雨轩
玩转AI数据资产:多模态体系建设、数据合成方法到Agent应用
阿里国际 数据科学技术专家
......
AI技术的迅猛发展正不断冲击传统数据架构的边界,结构化数据的局限性在多模态时代愈发凸显。此次分享将深度剖析企业如何从零构建适应AI需求的数据资产体系:首先需重构数据处理流程,融合文本、图像等多源异构数据的清洗与标注技术;其次通过数据合成方法扩充稀缺场景样本,解决训练数据枯竭问题;同时搭建智能检索平台实现数据的高效流转与应用。在质效平衡方面,强调从“数据规模竞赛”转向精细化质量管理,建立覆盖从模型训练、业务效果评测到持续迭代的全生命周期数据闭环。最后以Web Agent开发为例,展示AI数据平台如何缩短智能体训练周期,验证“数据即生产资料”的核心价值,为行业提供可复用的落地路径。

演讲内容
1. AI时代下传统数据架构面临的挑战
2. 从结构化数据到多模态数据:如何从0到1构建AI数据资产?
    2.1 数据处理体系、数据合成方法、数据检索平台
3. 数据资产作为AI应用的生产材料
    3.1  从"大数据"到"精数据"的范式迁移
    3.2 数据在训练-部署-迭代闭环中的价值流转
4. 用例分享:基于AI数据平台搭建Web Agent

敬请期待
敬请期待
......
......
......
SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
服务总线:400-183-9980
商务合作:151-2264-3988  木子  
票务联系:186-0005-0529  丽媛  
E-mail:speaker@secon.com.cn 
关注SECon公众号
添加SECon小助手,获取
会议最新资讯