1月14日,智谱宣布联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas800TA2设备和昇思MindSpore AI框架完成从数据到训练的全流程,成为首个在国产芯片上完成全程训练的SOTA多模态模型。开源不到24小时,GLM-Image即登顶全球AI开源社区HuggingFace Trending榜第一,标志着完全依托国产芯片训练的国产模型首次在国际舞台上取得榜首位置。
GLM-Image项目旨在全流程创新,是GLM团队面向新一代“认知型生成”技术范式的探索。从架构上看,GLM-Image采用了“自回归+扩散解码器”混合架构,并在基本对齐主流方案的基础上验证了新架构在知识密集型场景下生成的优越性。从训练基础上看,GLM-Image实现了基于昇腾Atlas800TA2设备和昇思MindSpore AI框架的全流程训练及推理适配,实际训练性能达到相应计算设备的汇报性能上限,验证了在国产算力上训练出SOTA模型的可行性。
从性能表现上看,GLM-Image在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单获得开源第一,能够读懂指令,写对文字,尤其擅长汉字生成任务,可广泛应用于海报、PPT、科普图等知识密集型场景。
