4月8日,智谱科技发布了其新一代旗舰模型GLM-5.1,并宣布该模型“Day0”版本正式上线华为云。智谱GLM-5.1在昇腾算力上实现了Layer级MOE绝对均衡,通过框架能力优化让专家均衡产出Token,同时结合昇腾Attention算子特征,通过推理框架和硬件协同的定向优化,提升了算力均衡和HBM访存均衡能力。华为云通过系统级优化,实现了推理加速,整体吞吐提升了30%。
华为云MaaS模型即服务平台为开发者提供了免部署、一键调用智谱GLM-5.1 API的Tokens服务,支持在线体验。企业还可以通过华为云魔坊(ModelArts)模型训推平台,一键完成推理服务部署上线,支持公共池和专属池两种资源部署方式,满足独占和非独占算力的使用需求。智谱GLM-5.1被官方宣称为目前全球最强的开源模型,是唯一达到8小时级持续工作的开源模型,并在SWE-benchPro基准测试中,实现了国产模型首次超越Opus4.6。

