字节跳动开源3B参数多模态模型Lance,图像视频一网打尽
创始人
2026-05-22 14:23:07
0

5月22日,字节跳动宣布推出开源多模态模型Lance,该模型激活参数量为3B,是一款原生统一的图像、视频多模态模型。Lance的独特之处在于,它将图像理解、视频理解、图像生成、视频生成和跨模态编辑集成到同一体系中,旨在通过单一模型处理X2T、X2I、X2V三种输出任务。与常见的将“理解”和“生成”拆分成多个模块再拼接的方案不同,Lance从训练阶段就兼顾和平衡了高层语义特征和低层连续表示的需求。

Lance采用共享上下文和能力解耦并行的设计,所有文本、图像、视频输入先转换为统一交错序列,再由双流专家架构分别负责理解与生成。文本标记来自Qwen2.5-VL嵌入层,而视觉输入则由Qwen2.5-VL的ViT编码器和Wan2.2的3D因果VAE编码成连续潜在表示。模型在完整上下文上使用广义3D因果注意力,文本采用因果注意力,视觉标记采用双向注意力。此外,Lance引入了MaPE技术,即模态感知旋转位置编码,通过给不同模态组添加固定时间偏移,解决了多类视觉标记边界混淆的问题。

在训练方面,Lance分为四个阶段:预训练、持续训练、监督微调和强化学习。预训练阶段使用了约1B图文对和140M视频文本对,总计1.5T标记。持续训练阶段引入编辑、主体驱动生成和多模态理解数据,规模约300B标记。监督微调阶段使用72B标记提升指令遵循和身份一致性。强化学习阶段采用组相对策略优化,并借助PaddleOCR作为奖励模型提升文字渲染与图文对齐。全部训练预算控制在最多128张GPU内。基准测试显示,Lance在统一模型中表现突出,尤其在图像生成和视频生成任务上,得分高于其他模型。Lance采用Apache2.0许可,权重已在HuggingFace提供,推理环境要求Python3.10以上、CUDA12.4以上和至少40GB显存。

相关内容

雷电5AI加速器亮相!OW...
美国当地时间5月21日,OtherWorldComputing(O...
2026-05-22 15:29:11
字节跳动开源3B参数多模态...
5月22日,字节跳动宣布推出开源多模态模型Lance,该模型激活参...
2026-05-22 14:23:07
日系车全球利润暴跌,新能源...
近日,日本汽车工业面临严峻挑战。《日经亚洲评论》报道指出,日本七大...
2026-05-22 14:12:21
【图解】民营经济促进法施行...
资料来源:经济日报、证券日报、人民日报、经济参考报、央视网文案/设...
2026-05-22 12:19:05
“2026·中欧人权研讨会...
新华社巴黎5月21日电(记者乔本孝)“2026·中欧人权研讨会”2...
2026-05-22 12:18:43
(粤港澳大湾区)港珠澳大桥...
中新社广州5月21日电 (记者 程景伟)拱北海关副关长褚碧波21日...
2026-05-22 12:16:22
文脉赓续 奏响文化强国的时...
放眼神州,红色文旅地标遍布全国各地。文化在润物无声中激扬逐梦复兴的...
2026-05-22 12:14:41
鸿华先进新纯电SUV发布:...
5月22日,鸿海-裕隆合资电动车企鸿华先进宣布,继收购裕隆旗下纳智...
2026-05-22 12:14:20
广州国家版本馆特色藏品“登...
5月21日,第二十二届中国(深圳)国际文化产业博览交易会(以下简称...
2026-05-22 12:12:49

热门资讯

雷电5AI加速器亮相!OWCS... 美国当地时间5月21日,OtherWorldComputing(OWC)宣布推出一款名为OWCSta...
字节跳动开源3B参数多模态模型... 5月22日,字节跳动宣布推出开源多模态模型Lance,该模型激活参数量为3B,是一款原生统一的图像、...
日系车全球利润暴跌,新能源时代... 近日,日本汽车工业面临严峻挑战。《日经亚洲评论》报道指出,日本七大核心车企——丰田、本田、日产、铃木...
【图解】民营经济促进法施行一年... 资料来源:经济日报、证券日报、人民日报、经济参考报、央视网文案/设计:景远策划:刘江校对:石兰审核:...
“2026·中欧人权研讨会”在... 新华社巴黎5月21日电(记者乔本孝)“2026·中欧人权研讨会”21日在法国巴黎举行。会议由中国人权...
(粤港澳大湾区)港珠澳大桥呈现... 中新社广州5月21日电 (记者 程景伟)拱北海关副关长褚碧波21日在广州称,今年前4个月,港珠澳大桥...
文脉赓续 奏响文化强国的时代强... 放眼神州,红色文旅地标遍布全国各地。文化在润物无声中激扬逐梦复兴的精神动能。在创造性转化、创新性发展...
鸿华先进新纯电SUV发布:续航... 5月22日,鸿海-裕隆合资电动车企鸿华先进宣布,继收购裕隆旗下纳智捷全部股权后,正式进入toC赛道。...
广州国家版本馆特色藏品“登陆”... 5月21日,第二十二届中国(深圳)国际文化产业博览交易会(以下简称“深圳文博会”)在深圳国际会展中心...
广东两展览入选“十大优秀项目” 文/图 羊城晚报全媒体记者 李娇娇 周欣怡 朱绍杰日前,文化和旅游部办公厅公布2025年全国美术馆馆...