12月1日,可灵AI宣布全球首个统一多模态视频模型——可灵视频O1模型正式全量上线。这一模型通过构建全新的生成式底座,实现了功能的整合,引入了MVL(多模态视觉语言)交互架构,能够在单一输入框内无缝融合多种任务。结合Chain-of-thought技术,O1模型展现出强大的常识推理与事件推演能力,官方表示,其深层语义理解力使得每一张照片、每一个视频、每一段文字都能被视为指令。
同时,可灵AI推出了全新的创作界面,用户可以通过简单的对话轻松使用各种素材,精准生成每一处细节。O1模型支持多视角构建主体,确保无论镜头如何流转,主体特征都能稳定如一,保证画面的精准和连贯性。此外,该模型还支持自由组合多个主体,为用户提供了更多的创作自由度。


