在新一轮通用人工智能时代,广义的机器人将会是最大的商业赛道,而具身智能无疑是该赛道的基石之一。具身智能通常是指智能体依托自身的身体形态,通过感知、运动和与环境的交互来获得和展现智能的能力。它强调智能并非仅仅源于大脑或算法,而是产生于“身体-环境”之间的交互过程,实现从感知、认知到决策、执行的完整闭环。本专场将深入探讨多模态感知与语义理解、多模态深度推理、物理世界建模与世界模型(World Model),并重点关注 Vision-Language-Action (VLA) 框架在具身智能中的发展。同时,我们将聚焦强化学习与模仿学习等训练范式如何推动具身智能在复杂环境中的自主性与泛化能力。专场将汇聚国内外具身智能与 VLA 领域的专家学者与产业先锋,分享其在工业自动化、服务机器人、智能制造、智能家居、虚拟/增强现实等场景的最新突破与实践经验,共同探讨规模化落地的挑战与机遇,并展望具身智能的未来发展图景。