专场出品人:熊刚
快手 基础平台系统软件负责人
互联网从业13+年,擅长海量服务、高稳定高性能服务架构、系统软件技术。
2019年加入快手,参与央视春晚项目(A1),负责应用启动、过载保护、核心配置系统设计和落地,死保中的死保,0事故。
2021~2023年之间,从0到1建立系统软件领域,包括操作系统、JVM、编译构建、系统诊断、系统观测、性能优化等子领域。
硕士毕业后就职腾讯,先后深度参与或主导 QQ 后台几次架构升级、腾讯视频云质量优化,以及 CV 技术B端落地。
专场:快手云原生
云原生混部技术将在线(实时)业务和离线(非实时)业务共同部署在同一台物理机器上,通过智能调度和资源隔离手段,提高资源利用率,同时确保服务的稳定性和业务的连续性。这种技术在处理具有明显潮汐特性的在线业务时尤为重要,它可以在业务低峰期利用闲置资源运行离线任务,从而提升整体的资源使用效率,节省资源成本。本论坛探讨快手超大规模在离线混部的关键技术,例如内核隔离、GPU虚拟化/混部、系统可观测、智能/亲和调度、资源合池与统一调度、Java云原生演进技术等。
辛文
快手 容器云技术中心 容器混部技术专家
20年初加入快手,快手容器混部技术专家,负责公司内部在离线混部生态建设,致力于通过在离线混部技术,在保障服务稳定性的前提下,充分利用物理机器资源,实现CPU、GPU资源利用率提升,助力公司降本增效。硕士毕业后就职于百度INF,8+年的云原生落地实践经验。
降本增效利器:快手 CPU&GPU 超大规模在离线混部落地实践
随着快手业务不断发展,服务器数量不断攀升,IT基础设施成本与资源利用率不高的的问题日益严峻,同时给公司带来了成本、收益多方面挑战。

在离线混部作为降本增效的一大利器,充分挖掘机器资源提升资源供给的同时提升利用率,快手厂内针对不同痛点制定针对性的措施:CPU&GPU混部、潮汐混部、套餐标准化等,实现公司级的降本增效。本分享侧重介绍在快手落地的CPU & GPU在离线混部场景的最佳实践。

内容大纲
1. 资源利用率现状及痛点
2. 在离线混部建设历程及挑战
3. 利用率提升最佳实践CPU混部篇
4. 利用率提升最佳实践GPU混部篇
5. 未来演进规划与展望

听众收益
1. 了解在离线混部多方位解决方案
2. 了解CPU、GPU场景下在离线隔离方案
3. 了解快手在离线混部系统落地实践
熊刚
快手基础平台系统软件负责人
互联网从业13+年,擅长海量服务、高稳定高性能服务架构、系统软件技术。
2019年加入快手,参与央视春晚项目(A1),负责应用启动、过载保护、核心配置系统设计和落地,死保中的死保,0事故。
2021~2023年之间,从0到1建立系统软件领域,包括操作系统、JVM、编译构建、系统诊断、系统观测、性能优化等子领域。
硕士毕业后就职腾讯,先后深度参与或主导 QQ 后台几次架构升级、腾讯视频云质量优化,以及 CV 技术B端落地。
快手混部关键技术介绍
介绍快手超大规模混部的关键技术。在离线共享物理资源导致的干扰问题是大规模混部以及利用率提升的关键卡点,快手研发了CPU、内存、IO、网络4大子系统15种内核隔离技术,在容器之间做好资源隔离彻底解决干扰问题,支撑大规模混部以及利用率水位顺利推进。

快手针对云原生场景做了一序列性能优化,比如JVM、CPU亲和、大页、编译优化技术提升应用运行性能,应用上云之后,不仅能比物理机跑得更满(利用率更高),还能跑得更快(性能更高)。

另外快手针对 GPU 应用,研发了内核级的GPU化技术支撑GPU业务在离混部,提升GPU利用率。
殷芳玺
快手 系统软件技术专家
2019年加入快手,担任程序语言运行时/基础库团队负责人,负责公司内部JVM、基础库等相关产品的研发,致力于提升Java/C++服务的性能和稳定性。曾在阿里巴巴、DynaTrace等公司任职。

在十多年的工作经历中,一直专注于JVM、性能优化、APM、分布式系统领域的研发,主导了一系列性能优化产品的开发,涉及JVM优化、微架构优化、基础库优化、性能监控分析平台产品等诸多方向,在相关领域具有丰富的研发经验。热爱知识分享,旧金山CodeOne演讲嘉宾,ICSE等多篇学术论文一作。
Java透明协程:同步编程,异步运行
异步化能够显著提升Java服务的吞吐量,被业务架构师寄予厚望。然而异步化编程门槛非常高,基于现有的异步化框架,开发人员往往会陷入回调地狱,承受大量的心智负担。因此异步化架构并没有得到普遍广泛的使用。

然而,基于Dragonwell社区的Wisp透明协程技术,我们能够透明得将服务转换成异步模式,实现同步编程,异步运行的效果,从而显著提升系统容量,是企业的降本增效的有力武器。然而协程技术的落地复杂度较高,需要深入JVM处理很多复杂的技术场景,尤其是在Java17上,面临着一些亟待解决的难题,比如调度器低负载工况优化、IO模型优化等。

本次演讲,嘉宾将介绍快手如何和Dragonwell社区合作落地Java透明协程,并详细阐述快手Java17协程技术的演进历程,并给出一些关键问题的解决方法。

内容大纲
1. 什么是协程
    1.1 协程基本概念
    1.2 协程优化来源
2. 协程的发展历史
3. 协程在快手的技术演进
    1.1 Java17移植
    1.2 调度器优化
    1.3 IO模型优化
4. 协程落地效果

听众收益
1. 了解JVM的协程实现原理。
2. 收获协程落地过程中的一些具体问题的解决方法,为听众的实践过程提供帮助。
3. 了解快手运行时&基础库团队的工作方式。
SECon组委会是由业界多位资深技术专家发起,负责组织技术指导委员会,并和委员会的专家一起挖掘全球软件工程领域的创新技术,同时依托智盟创课国内领先的人才能力提升服务供应商,组织专业的会务服务团队,全面推进会议的顺利落地,保证参会者体验。
商务合作:木子  15122643988
票务联系:丽媛  18600050529
E-mail:speaker@secon.com.cn 
关注SECon公众号
添加SECon小助手,获取
会议最新资讯