5月26日,小米技术官方宣布推出XiaomiAutoWorldModel全新框架,这一框架为辅助驾驶世界模型提供了新的发展方向,推动行业从“场景感知”向“认知推演、场景进化”的高阶形态转变。XiaomiAutoWorldModel是小米首次将三维重建与视频生成深度耦合的一体化架构,采用“重建锚定几何、生成填补想象”的新范式,打破了行业长期采用的重建、生成独立拆分路线。
XiaomiAutoWorldModel通过深度耦合重建模块与生成模块,实现了高稳定性、高一致性和高真实性。重建模块提供3D几何作为结构化锚点,约束生成过程的稳定性;生成模块则将预测能力延伸到观测之外,弥补重建的边界。这一整合框架在Waymo、nuScenes等主流基准测试中全面取得SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大核心场景完成业务落地。
目前,XiaomiAutoWorldModel已在小米汽车三大实际场景中落地应用,包括合成数据生成、仿真测试和辅助驾驶学堂。在合成数据生成方面,已交付超过10万clips高质量合成数据,直接用于感知模型训练,提升车辆在危险场景下的识别能力。在仿真测试方面,构建闭环仿真环境,优化测试效率,完备测试规范,可在仿真中复现真实事故进行定向优化。辅助驾驶学堂则利用世界模型动态生成第一人称驾驶教学视频,帮助用户在面对复杂路况时,系统以生成式视频展示正确操作。

