随着人工智能技术的快速发展,eBay内部越来越多的业务应用机器学习来最大化其商业价值。机器学习的核心是训练出有效的模型并应用到业务场景中进行预测,这就需要一个能处理不同场景需求的高可用,可扩展的推理平台。本议题通过介绍eBay 机器学习平台在推理上的演化之路,来阐述eBay在推理上的架构思考, 包括模型生命周期管理,统一模型推理服务架构,模型优化,模型反馈回路以及模型特征监控等。
1. 机器学习生命周期和模型推理
1.1 机器学习生命周期
1.2 模型推理平台及核心功能
2. 模型推理在eBay 的架构演化
2.1 CPU 推理架构
2.2 GPU 推理架构
3. eBay 统一机器学习推理平台
3.1 统一推理平台架构
3.2 模型生命周期管理
3.3 模型部署和推理
3.4 模型feedback loop
3.5 模型特征监控和分析
4. 模型优化实践
3.1 服务优化
3.2 GPU 利用率优化
5. 未来展望
2011 年硕士毕业于西安交通大学计算机系,先后就职于摩根士丹利、蚂蚁金服、Intel 和 eBay,从事业务系统、框架和平台研发工作。在 AI 领域有近七年的研发经历。先后从事过开源深度学习框架项目研发,基于编译优化的 AI 训练及推理加速项目,以及机器学习平台项目。在eBay 先后参与了模型训练平台的研发,新一代特征工程管理平台的架构研发以及统一模型推理平台的架构。目前负责eBay机器学习推理平台的技术工作。