今日,MiniMax稀宇科技发布了新一代Agent旗舰大模型M2.7,标志着模型自我进化路径的首次展示。M2.7通过AgentHarness体系,使得模型能够深度参与自身的训练与优化流程。在研发场景中,M2.7能够承担约30%—50%的工作量,并在内部评测集上实现约30%的效果提升。在SWE-Pro测试中,M2.7以56.22%的正确率追平GPT-5.3-Codex;在VIBE-Pro基准测试中,得分55.6%,几乎与Opus4.6持平。
M2.7在软件工程领域表现出色,包括端到端的完整项目交付、分析日志排查Bug、代码安全、机器学习等。它还能自行构建复杂AgentHarness,并基于AgentTeams、复杂Skills、ToolSearchtool等能力,完成高度复杂的生产力任务。在专业办公领域,M2.7提升了模型在各领域的专业知识和任务交付能力,在GDPval-AA的ELO得分是1495,为开源最高。M2.7对Office三件套Excel/PPT/Word的复杂编辑能力显著提升,能更好地完成多轮修改和高保真的编辑。
此外,M2.7具备与复杂环境交互的能力,在40个复杂skills(>2000Token)的case上,仍能保持97%的skills遵循率。在OpenClaw的使用中,M2.7相比于M2.5也有了显著的提升,在MM-Claw的评测中接近Sonnet4.6。M2.7具备优秀的身份保持能力和情商,为互动娱乐场景的创新也准备了空间,加速向AINative组织的进化。


