今日,谷歌宣布推出Gemma4大模型,这是谷歌迄今为止最智能的开源模型,专为高级推理与智能体工作流设计。Gemma4实现了“单位参数智能水平”,推出了四种规格的通用模型,包括20亿参数版(E2B)、40亿参数版(E4B)、260亿混合专家模型(MoE)和310亿稠密模型(31B)。这些模型超越了简单对话场景,能够处理复杂逻辑和智能体工作流,其中31B模型在全球开源模型中排名第三,26B模型排名第六。
Gemma4模型系列的核心优势包括高级推理能力,支持多步规划与深度逻辑,以及智能体工作流的原生支持,包括函数调用和结构化JSON输出。此外,Gemma4还支持代码生成,视觉与音频处理,以及处理长文本内容。模型支持超过140种语言,助力开发者打造全球用户的应用。26B和31B模型优化了通用硬件上的顶尖推理能力,非量化bfloat16权重适配英伟达H100GPU,而量化版本可在消费级GPU上运行,适用于集成开发环境和智能体工作流。
E2B和E4B模型追求极致的算力与内存效率,与谷歌Pixel团队、高通、联发科等合作,使多模态模型能在手机等端侧设备上离线、近零延迟运行。安卓开发者现在可以在AICore开发者预览版中搭建智能体流程,实现与GeminiNano4的向前兼容。


