MiniMax闫俊杰：不甘落后，豪赌新架构能否重夺AI舞台C位？-手机电脑-游戏世界

在AI领域的激烈竞争中，曾经的“AI六小龙”格局已悄然生变。随着零一万物放弃追逐AGI、百川智能专注于医疗赛道，智谱AI、MiniMax、月之暗面和阶跃星辰四家公司成为了新的焦点，但它们也面临着前所未有的挑战，被戏称为“AI四小强”。

在这四家公司中，MiniMax一度以其前瞻性的布局和技术实力脱颖而出。2023年下半年，当国内大部分大模型厂商仍在迭代稠密模型时，MiniMax创始人闫俊杰却大胆地将80%以上的研发和算力资源投入到MoE（Mixture of Experts混合专家模型）这一不确定的领域。这一冒险之举最终在2024年1月得到了回报，MiniMax推出的abab6成为国内首个MoE大模型，MoE架构也由此成为大模型领域技术迭代的新方向。

然而，在DeepSeek R1掀起的新一轮推理模型浪潮中，MiniMax却未能抢占先机。面对腾讯等玩家纷纷接入DeepSeek赚取用户关注的局面，MiniMax选择了折中方案：国内C端应用坚持不接入DeepSeek，仅在海外AI应用上选择接入。这一策略让人联想到同样选择等待自研推理模型上线的字节。

如今，随着自家推理模型的即将上线，闫俊杰迎来了证明MiniMax技术底色的机会。然而，缺失推理模型所带来的影响已悄然显现。外界对MiniMax高估值和后续融资可持续性的质疑声此起彼伏。尽管在2024年3月拿下6亿美元A轮融资后，MiniMax投后估值达到25亿美元，但迟迟未上推理模型让资本市场开始重新评估其估值体系。

技术迭代优化过程中的挑战也是MiniMax推理模型未能更早上线的原因之一。据MiniMax前员工透露，公司去年中就已开启推理模型的研发工作，但直到目前，乐观情况下也要到6月中旬左右才能上线。这一延迟不仅影响了MiniMax在应用侧吸引和聚拢用户的能力，还可能导致B端客户将更多模型调用需求推向对手。

拖累MiniMax推理模型更早上线的另一大原因是闫俊杰更大的赌性。当DeepSeek、Kimi等竞争对手着手研发推理模型时，MiniMax却将重心放在了架构创新上。早于DeepSeek R1发布近一周，MiniMax发布了MiniMax-01并正式开源，在新模型中首次尝试使用线性注意力架构Linear Attention。这一冒险之举再次展现了闫俊杰的赌性。

然而，R1的发布给了MiniMax一个措手不及。为了追赶行业新态势，MiniMax模型研发团队春节期间都在赶工，以图加快推理模型上线。闫俊杰甚至决定再次冒险，试图赶在DeepSeek前面推出一个原生多模态深度推理模型。然而，这一模型的最终形态和上线时间仍留有悬念。

除了因冒险押注新架构带来的资源分散之外，MiniMax在应用上的豪赌布局也分散了其追求模型迭代的精力。AI六小龙中，MiniMax布局最广：既做To C又做to B；既做国内又做海外。这一庞大的业务策略带来的代价之一是产品和模型团队之间的冲突和矛盾。

豪赌一年后，闫俊杰为公司设立的2024年收入过亿美元和产品日活过千万两大目标均未能实现。这一结果成为公司后续人员变动和组织架构调整的新导火索。商业化合伙人兼副总裁魏伟离职，产品负责人张前川淡出公司事务。在应用侧，MiniMax也改变了策略，将旗下AI应用“海螺AI”拆分为“MiniMax”和“海螺AI”两个品牌。

几次豪赌过后，闫俊杰吸取到的最大教训之一是对技术品牌没有很深的认知。他意识到更好的模型可以导向更好的应用，但更好的应用和更多用户并不会导向更好的模型。基于这一新的判断，闫俊杰重新做了取舍，不再将用户规模和商业化视作重点，而是重新将技术迭代确立为MiniMax的最重要目标。

然而，新的挑战接踵而至。当下大模型赛道正进入淘汰赛阶段，资金持续承压已成为行业现实。魏伟的离职原因之一便是因为融资KPI考核未达标。在融资放缓、收入压力和战略调整的新阶段，外界对大模型公司的考核标准正从交付MaaS变成交付结果。竞争焦点也从过去比参数大小、多模态能力偏向现在比谁能真正解决用户问题。

对于想要继续留在牌桌上的闫俊杰而言，MiniMax正寄望于用新的原生多模态推理模型重回舞台中央。然而，在这一领域，字节、阿里、腾讯等竞争对手已经提前一步上线了图像推理模型。延期后的MiniMax推理模型即将直面DeepSeek R2和GPT-5的竞争。这一场AI大模型的竞争还远未到尽头。