数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

小米MiMo大模型API价格大跳水:最高降99%,国产大模型开启规模化使用新篇章

2026-05-28来源:快讯编辑:瑞雪

国内大模型市场近日迎来新一轮价格风暴。小米科技宣布对其MiMo-V2.5系列大模型API实施永久性降价,最高降幅达99%,同时取消上下文长度区分机制。这一举措紧随DeepSeek上周将V4-Pro价格降至原价25%之后,标志着国产大模型正式进入"成本战"阶段。

根据最新定价体系,MiMo-V2.5-Pro的百万tokens输入价格分为两种场景:缓存命中时仅需0.025元,未命中时为3元,输出价格则统一为6元。更引人注目的是Token Plan的升级方案——在Agent和Code开发场景下,用户可获得的免费Token数量将提升至原有水平的5-8倍。小米特别强调,新计价规则采用"所见即所得"模式,彻底消除了此前因单位换算带来的复杂计算问题。

与海外竞争对手相比,国产模型的价格优势愈发明显。OpenAI的GPT-4o输入价格为每百万tokens 2.5美元(约合人民币18元),输出达10美元(约72元);Claude Sonnet 4.6的输入输出价格则分别为3美元(21.6元)和15美元(108元)。即便考虑汇率因素,国内模型的价格仍不足国际主流产品的1/3。

小米技术团队透露,此次降价并非简单让利,而是源于底层架构的突破性优化。通过SGLang HiCache技术对滑动窗口注意力机制(SWA)的完整支持,KV Cache在GPU显存、CPU内存和SSD之间的数据搬运量减少至原来的1/7,可缓存token数量则提升近5倍。配合专家模型优化和输入长度分桶策略,集群输入吞吐能力得到显著提升。这种技术路线与DeepSeek的降本逻辑高度契合,均通过工程化创新实现单位服务成本的结构性下降。

行业观察人士指出,本轮降价潮折射出大模型应用场景的深刻变迁。随着技术从对话交互向任务执行延伸,开发者和企业用户更关注Agent在多轮推理、API调用和自动化工作流中的持续消耗。当百万tokens价格被压缩至分厘级别,模型竞争的焦点正从单纯的参数规模转向推理效率、算力调度和生态建设等综合实力。

对于开发者社区而言,成本下降将直接催生应用爆发。更低的使用门槛意味着更多Agent、智能助手等创新产品有望涌现,形成"降价-应用增长-生态完善"的良性循环。而对模型厂商来说,低价策略既是技术实力的证明,也是构建长期竞争力的战略选择——只有具备更高推理效率、更强算力调度能力的企业,才能在持续的价格战中占据主动。

具身智能奠基人苏昊入职复旦首讲:AI迈向人机共存需突破物理智能
苏昊说,即使是目前最先进的AI面对同样的场景还是做不到,它可以识别出纸箱,却无法知道拿起来是什么感觉,“物理理解的本质不是看到了什么,而是给定一个动作,预测它将带来的物理后果。”这和物理智能的方法论有一种天然…

2026-05-28

台北国际电脑展将至 纬颖钻石复合材料服务器冷板等新品亮相引期待
IT之家 5 月 27 日消息,纬创 (Wistron) 旗下数据中心基础设施供应商纬颖 (Wiwynn) 昨日宣布,将在 COMPUTEX2026 台北国际电脑展秀出钻石复合材料冷却技术。 纬颖将导热性能…

2026-05-28

vivo S60系列5月29日震撼登场:7200mAh超薄电池+骁龙8s Gen3,影像实力再升级
vivo新机已预热,锁定在5月29日登场,机型为vivo S60系列,定位与上一代相同,倾向于影像方面,配置位于中高端水平。 新机多方面预热,比如全新外观+材质、超薄蓝海电池、影像+实况功能、3D超声波指纹…

2026-05-28

联想拯救者Y70新机来袭:2K高刷屏搭配旗舰芯,6月9日开售游戏党福音
新机定位在游戏手机市场,性能自然达到旗舰级别,而且多方面配置大升级。 新机亮点,比如2K高刷屏、乾坤散热、第五代骁龙8、AI战场感知系统、星环电池、电竞通信等方面,整体亮点围绕着游戏性能提升。屏幕功耗,已采用…

2026-05-28

Bigme新机来袭:天玑8300加持大双屏,LCD与墨水屏组合引期待
除了大双屏和芯片以外,目前官方并未公布更多的配置和参数,同时也包括发布和开售时间等等。如果你想兼顾性能和LCD屏幕,这款手机还是挺值得期待的,不过从该品牌其他机型的售价来看,这款大双屏手机的起售价应该会在3…

2026-05-28

华为nova 16系列来袭!时代少年团代言,十周年力作颜值续航双在线
快科技5月26日消息,有博主发布视频,时代少年团队长马嘉祺在录制节目时展示了自己正在使用的新手机,正是还没发布的华为nova 16系列。据此前披露的信息,华为nova 16系列由人气组合时代少年团担任品牌代…

2026-05-27

苹果iOS 27 Siri大升级:变身“AI秘书” 推出独立应用集成Gemini模型
此外,苹果还在测试全新的系统级搜索入口,用户从屏幕顶部中央下滑即可呼出“搜索或提问”栏,实现文字与语音的双重输入。这意味着,新版 Siri的底层推理能力将由 Gemini 提供支持,从而在复杂任务处理、上下…

2026-05-27