小米这波价格战卷爆了。

昨天深夜,小米技术官方号发微博宣布了一则消息:小米旗下MiMo-V2.5系列大模型API宣布永久性降价,最高降幅达到了惊人的99%,并且不再区分上下文窗口长度。在优化了Token计费体系后,同等价格下的用量直接提升到了原来的5至8倍。


00750fiJly1idjav6n475j30kc0zkgoc.jpg


小米在Token涨价潮中逆势打AI价,让很多人看不懂。在我们看来,AI于小米而言不是目的,而是手段,大模型API降价背后,雷军有更深层次的考量。


很多人以为AI价格战单纯是在烧钱补贴,但实际上,大模型拼到最后拼的是极限的推理效率。小米这次敢把API价格打到近乎骨折,底气来源于其推理系统的硬核优化——团队通过在系统中完整支持SWA(滑动窗口注意力机制),将KV Cache在GPU显存、CPU内存等各级存储间的数据搬运量砍掉了近七成,并将可缓存的Token数量提升了近5倍。


image.png


在整个行业由于算力成本高昂而不得不涨价时,小米反其道而行之。雷军很清楚,大模型时代赚钱的关键指标不是参数跑分,而是应用生态。降幅99%、取消上下文窗口计费差异,本质上就是在对全球的AI开发者喊话,吸引他们加入。


说到底,小米的终极目的,依然是人车家全生态。


小米刚刚发布了Q1财报,表示今年要在AI领域砸下至少160亿的重金。小米营收和利润的增长,以及充足的现金流,是它能在AI领域加大投入的基础。


image.png


如果把目光放长远,MiMo大模型的API降价只是第一步,当海量开发者因为极低的算力成本涌入,基于小米模型开发出无数丰富的智能应用时,最终小米生态都会从中受益。


到时候,用户手中的手机、PC、车机以及智能家电家居,都将拥有低价且全面的AI调度能力。


总而言之,小米这波99%的降价,表面上是云端AI的肉搏,实质上是一场不对称的打法,以软硬件生态作为后盾。大模型的残酷淘汰赛,现在才算正式拉开帷幕。