降价生效

小米 MiMo-V2.5 系列 API 今天起永久降价。北京时间 5 月 27 日 00:00 生效,价格单位为 ¥/百万 tokens。

两个模型都降了,幅度不小。MiMo-V2.5-Pro 的输出从原来的 ¥21-42/M 降到 ¥6/M,MiMo-V2.5 的输出从 ¥14-28/M 降到 ¥2/M。降幅最大的是缓存命中场景,Pro 模型降了 98-99%,标准版降了 96-98%。

MiMo-V2.5-Pro 价格明细

项目新价 (¥/M)新价 ($/M)对比 <256k 降幅对比 256k-1M 降幅
输入(缓存命中)0.0250.004↓98%↓99%
输入(缓存未命中)3.0000.441↓57%↓79%
输出6.0000.882↓71%↓86%

MiMo-V2.5-Pro 是小米的旗舰推理模型,HuggingFace 模型权重约 963GB,在多个第三方综合评测中表现接近 Claude Opus 4.6。这个价格已经比 GPT-5.5 的输入价($2.50/M)还低。

MiMo-V2.5 价格明细

项目新价 (¥/M)新价 ($/M)对比 <256k 降幅对比 256k-1M 降幅
输入(缓存命中)0.0200.003↓96%↓98%
输入(缓存未命中)1.0000.147↓64%↓82%
输出2.0000.294↓86%↓93%

MiMo-V2.5 模型权重约 295GB,定位轻量推理。输出 ¥2/M 的价格,在国内大模型 API 中属于最低档。

(美元价格按 $1 = ¥6.80 换算)

其他产品

MiMo-V2.5-TTS 系列语音合成模型继续限时免费接入,暂时不收费。MiMo-V2-Pro 和 MiMo-V2-Omni 两个旧版模型的 API 价格不变。

这次降价意味着什么

今年上半年国内大模型 API 价格战已经打得很激烈。DeepSeek V4 系列、GLM-5.1、Kimi K2.6 相继发布,各家都在抢开发者。小米这次降价的幅度相当激进,特别是缓存命中的场景——¥0.025/M 和 ¥0.020/M 的价格基本等于白送。

对开发者来说,如果你的应用场景涉及高频调用(比如智能体循环、代码补全、实时对话),MiMo-V2.5 系列现在的性价比确实很高。缓存命中的价格意味着重复调用几乎不花钱。

小米从 2023 年开始投入大模型研发,走的是全栈自研路线。成本能压到这个水平,说明他们在推理优化上下了不少功夫。