今日,阿里千问大模型宣布推出Qwen3.7-Plus模型,这是Qwen3.7的多模态升级版,旨在打造视觉与语言统一的智能体基座。Qwen3.7-Plus不仅保留了文本、编码、工具使用和生产力工作流的能力,还特别强化了视觉理解、视觉推理和跨模态任务处理。该模型已通过阿里云百炼提供服务,并可在QwenStudio体验。它支持图像、视频、屏幕、网页和文本输入,能够应对复杂的软件与办公流程,并在GUI、CLI和工具环境中执行任务。
Qwen3.7-Plus在模型表现上取得了显著成绩,尤其在VisionArena中的表现帮助阿里进入全球前5、中国第1。在纯文本测试中,该模型接近Max级别模型,在编码智能体、通用智能体、推理、指令遵循和多语言任务上保持了强劲的表现。多模态测试显示,Qwen3.7-Plus在视觉推理、工具调用和任务执行链路方面得到了加强。在BabyVision、MathVision、ScreenSpotPro、OSWorld-Verified、AndroidWorld等评测中,该模型的表现提升明显。


