12月16日,字节跳动Seed发布了新一代音视频创作模型Seedance1.5pro,该模型支持音视频联合生成,能够执行从文本到音视频的合成以及图像引导的音视频生成等多种任务。与1.0版本相比,Seedance1.5pro不仅支持音频同步生成,还致力于提升视觉冲击力和运动效果,通过大胆的技术方案,在视听协同、视觉张力和叙事协调性等方面实现突破。
Seedance1.5pro在音画同步与多语言、方言支持方面表现出色,模型在生成中实现了较高的视听一致性,提升了角色的口型、语调与表演节奏的拟合精度。此外,模型原生支持多语种和特色方言口音,能够捕捉其独有的语音韵律与情感张力。在运镜控制与动态张力方面,模型具备自发的镜头调度能力,可执行长镜头跟随、希区柯克变焦等高难度运镜,同时还能实现电影级的画面衔接与专业影调,提升了视频的动态张力。
Seedance1.5pro通过增强语义理解,实现了对叙事语境的较好解析,提升了音视频段落的整体叙事协调性,为专业级内容创作提供支撑。字节跳动Seed表示,在综合评测中,Seedance1.5pro各项关键能力处于“业界前列”。目前,Seedance1.5pro已上线即梦AI和豆包平台。


