4月7日消息,小米MiMo大模型负责人罗福莉昨日在社交平台发文,针对AI大模型行业近期爆发的TOKEN价格战发表系统性观点。她以Anthropic切断Claude订阅用户对第三方框架OpenClaw的接入为例,指出单纯以极低价格销售token并放任第三方框架接入是一种“陷阱”,小米MiMo已于数日前推出按量计费的Token Plan作为替代路径。
罗福莉分析称,若大模型公司未厘清成本结构就卷入价格战,平台为弥补亏损可能被迫降配模型、限流或降低推理稳定性,形成恶性循环。她以OpenClaw为例说明第三方框架的低效问题:单次用户查询会触发多轮低价值工具调用,每轮均作为独立API请求并携带超过10万token的上下文窗口,实际API请求次数是原生框架的数倍,折算成本可达订阅价格的数十倍。Anthropic切断订阅通道后,第三方框架用户短期内将面临数十倍的成本跳涨,但这种痛感会倒逼框架开发者改进上下文管理、提高prompt缓存命中率、削减无效token消耗。
小米MiMo选择的Token Plan以Credit为单位销售token额度,明确支持第三方框架接入,每个被浪费的token均直接扣除用户额度,使用量与成本的关系重新透明化。罗福莉强调,其目标是长期稳定地交付高质量的模型和服务,而非让用户冲动付费后弃船。她给出宏观判断:全球算力供给增速已落后于Agent场景下的token需求增速,真正的出路不在于更便宜的token,而在于更高token效率的Agent框架与更强大、更高效的模型之间的协同进化。Agent时代不属于消耗最多算力的人,而属于最懂得如何高效利用算力的人。Anthropic的举措可能无意中推动了开源、闭源生态的发展。

