小米MiMo-v2.5系列API永久降价高达99%

2026-05-26 1 阅读 gainsurier
MiMo-V2.5系列价格调整公告| 100万亿Token创造者激励计划落下帷幕 过去几个月,我们通过MiMo Orbit、Quadrillion Token创造者激励计划等活动,让更多人体验MiMo,解决实际问题,这是MiMo走向规模化应用的第一步。现在,随着底层技术的不断完善,我们终于可以做更彻底的事情了——永久改造整个模型定价体系。本次公告核心速览: MiMo-V2.5 系列 API 永久降价 Token Plan 计费系统优化,使用量提升至原四万亿造物主激励计划的 5-8 倍 圆满结束 当前有效 Token Plan 用户额度全面重置 生效时间:北京时间 2026 年 5 月 27 日 0:00 MiMo-V2.5 系列 API 永久降价 与原 API 定价相比,新定价可最大减少高达99%,并且不再根据输入长度进行区分。本次价格调整于北京时间5月27日0点正式生效,全球同步。我们诚挚邀请各位开发者前来集成体验。 TokenPlan计费系统优化 量不加价,使用量提升至原来的5-8倍,为您释放更丰富的生产力 计费规则调整得更清晰、更易懂,所见即所得。万亿币创作者激励计划圆满结束 “万亿币创作者激励计划”自4月28日上线以来,受到全球用户的热烈追捧和广泛关注。截至北京时间5月26日16点08分,全部100T Token已提前全部发放完毕,活动提前圆满结束。感谢所有开发者的热情参与!注:Apache软件基金会会员专属福利活动长期有效,可继续申请,不受本次最终确定的影响。惊喜:所有现有 TokenPlan 用户配额已全面重置 无论当前套餐使用情况如何,所有订阅 Token Plan 且仍在有效期内的用户(包括参与 Quadrillion Token Creator 激励计划并获得 Token Plan 的用户,涵盖 Apache 软件基金会专享福利的用户)的 Credits 配额将于北京时间 5 月 27 日 0:00 全面重置,并按照新的计费规则执行。还有一件事:对于Token Plan已过期的历史付费用户,我们还准备了惊喜礼物,将在下周内公布。请继续关注。推理技术优化说明 此次调价的背后,是小米技术团队对推理系统的不断优化。我们全面支持基于SGLang HiCache的SWA(Sliding Window Attention),将KV Cache在GPU内存、CPU内存、SSD等多级存储之间的数据传输量减少到优化前的近1/7,将可缓存的token数量增加到优化前的近5倍,显着提高缓存命中率和推理效率。同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步增强集群的输入吞吐能力,从而在保证服务质量的同时不断降低每个token的服务成本。结论 技术的价值最终在于其使用的广度。依托持续的技术创新,我们希望通过提供低成本与顶尖能力相结合的模型服务,撬动真实、可持续、大规模的推理需求,从而推动完整的人工智能基础设施链的建设。让更多人使用更好的模型——这是MiMo坚定不移的使命。更新时间2026年5月27日快速接入小米MiMo-V2.5系列开源&Orbit 100万亿代币计划启动