

出品 | 虎嗅科技组
作家 | 王欣
剪辑 | 苗正卿
头图 | 电影《赌神》
MiniMax 有点"变味儿"了?
此前,凭借海螺 AI 等 C 端居品在国外爆火的大模子厂商 MiniMax,近期打出了一张"技能牌"。
1 月 15 日,他们发布并开源新一代 01 系列模子(基础谈话大模子 MiniMax-Text-01 和视觉多模态大模子 MiniMax-VL-01)。值得防卫的是,收成于改换性地大范畴引入线性防卫力机制,01 系列模子维持最多 400 万个 token 的高下文输入。这是 MiniMax 在基于 MoE 架构的 abab 系列文本模子上的再度改换。
亮出底牌,似乎也回话了当下对大模子公司们的"灵魂拷问"——究竟作念不作念预测验?还追不追求 AGI?
"这个模子的结构是独到、改换的,只但是靠我方预测验来的。" MiniMax 这么对虎嗅暗意。换言之,MiniMax 现在依然坚握预测验的进入。
MiniMax 向虎嗅骄横,改日他们的技能迭代标的为:"短期来看,把复杂 coding 的基础材干逐步完善;历久来说,咱们把包含多模态的 agent 材干作念好。"
而回到 MiniMax 登程的原点,在 2021 年 9 月 MiniMax 诞生前的白板前,创举东谈主闫俊杰就贯通地列下了改日的愿景:下一代 AI、接近图灵测试的智能体、智能创造极致体验。为了让职工有更具像化的感受,他还在就地与《底特律 · 变东谈主》、"贾维斯"等经典 IP 算作对比。
即便三年后,Scaling Law 撞墙、AGI 信仰濒临重构,但闫俊杰敬佩 MiniMax 会一直在波澜中,并把技能迭代算作最紧迫的方针。。
显豁的技能派
本色上,诚然源头凭借 Glow、星野等 C 端居品出圈,但 MiniMax 团队素来以为我方的的技能底色油腻。
此前虎嗅与 MiniMax 调换时,对方就强调"对咱们公司来讲,咱们详情是先作念技能上的东西。技能模子偶而提供什么样的材干,咱们再看我方的居品可弗成以治愈。淌若真是治愈不了,那有可能会有新的 APP 出来。"
而更紧迫的是,他们以为"通用基础大模子才是这一波大模子波澜的王谈。"
因此不难长入,在其他友商摄取追求施行主义道路、转投新赛谈时,MiniMax 却摄取不绝重投基础模子架构的改换。
也曾,AI 学术界束缚迭代升级的技能道路就像勉力赛,每隔一年或半年总会有更好的模子露出。1998 年,杨立昆残忍了多层 CNN 卷积神经收罗;2016 年,最流行的是 RNN 轮回神经收罗的变种—— LSTM;半年后,与其对标的 Transformer 横空出世。关联词,东谈主们料念念的偶而颠覆 Transformer 架构的新模子并莫得出现。
而 Transformer 架构的局限性也得志不了一些哄骗场景的条款——举例,在生成长文本时,传统 Transformer 架构可能会丧失高下文的连贯性,尤其是当输入文本较长且模子只关爱局部高下文时。生成的文本可能难堪一致性,或者前后内容有显豁的脱节,无法得志一些对文本连贯性条款较高的哄骗场景,比如对长高下文材干涉多模态处理材干条款较高的 Agent 场景。
因此,MiniMax 引入了线性防卫力机制,这有意于处分传统 Transformer 架构下长文本计较复杂度高、高下文长入受限、内存破费大的问题。通过这一架构改换,他们已毕了 400 万 token 的高下文处理材干。算作对比,此前 GPT-4o、Claude-3.5-Sonnet 的沟通材干简略在 100k 水平傍边。
受益于 Linear Attention 层面的架构改换、算力层面的优化,以及集群上的训推一体的接洽,使得 01 系列模子订价也被团队视为竞争力之一——圭表订价是输入 token 1 元 / 百万 token,输出 token 8 元 / 百万 token。这里咱们不错以 Deepseek v3 的订价对比,Deepseek v3 API 事业订价为,输入 2 元 / 百万 token,输出 8 元 / 百万 token。
相对而言,DeepSeek 的新架构裁汰资本上发达卓越,何况主要面向大集群测验、部署事业,用云提供用户事业的极致优化。而 MiniMax 的新架构,在超长文本输入方面发达优异,在 400 万的大海捞针任务(测试超长文本的任务)发达中获得全绿着力。
MiniMax 不雅察到,"改日一年潜在 Agent 沟通哄骗行将爆发,而 Agent 需要越来越长的 context ",因此 MiniMax 在 Github 上开源了 Text-01 模子和 VL-01 模子的完好意思权重,在国外受到了硅谷征询员、从业者的关爱。他们以为这将招引无数的拓荒者和征询东谈主员进行二次拓荒和改换,进一步拓展模子的哄骗场景和功能。
Intelligence with Everyone
MiniMax 的 slogan 是与用户共创智能。
诚然 MiniMax 以为"不是用户越多,模子材干就提高越快",但据 MiniMax 先容"他们是国内日处理量、交互时长最高的大模子公司。"跟着居品矩阵的完善,早在旧年 8 月时,MiniMax 大模子逐日与专家用户的交互次数达到了 30 亿次。
技能运行,以模子技能材干范畴治愈居品标的的道路,集合 MiniMax 的永恒。
这里不错以 MiniMax 的居品更替为例,MiniMax 每代居品和功能的推出背后,王人吻合了其时的模子材干范畴。
彼时,大模子开阔濒临幻觉严重的问题,在这一瓶颈下,AI 社区类 APP 无疑是其时 AI to C 居品炙手可热的标的。据 Sensor Tower 数据骄横,自觉布以来,国外版星野 Talkie 一直位居专家 AI 哄骗下载量的前 3 名。
跟着模子材干提高,使得 AI 分娩力成为可能,MiniMax 推出了器具类居品海螺 AI,并将其算作公司重心发力的居品。
MiniMax 也早早押注了多模态赛谈。2024 年 8 月份,MiniMax 发布了视频模子 abab-video-1、音乐模子 abab-music-1,同期在海螺 AI 上线。据 MiniMax 先容,视频模子上线后五周,海螺 AI 网页版探访量增速超 800%。
除 C 端哄骗外,MiniMax 也在探索 B 端哄骗,面向企业客户提供大模子哄骗处分决议。MiniMax 通达平台主要提供 API 事业,维持的行业场景涵盖了办公合营、智能制造、数字经济、医疗、客服、智能网联。他们在算力层的部署达到了万卡级算力池。据 MiniMax 先容,通达平台在国内领有超 40000 家企业与拓荒者用户,并在国外 20 余个国度已毕业务落地。
而最新推出的 01 系列模子,也还是哄骗于海螺 AI,MiniMax 也不雅察到,在模子哄骗于海螺 AI 后,"赋予了海螺 AI 更强的通用材干,包括长文的长入和创作等。"
除此以外,MiniMax-01 也在通达平台也同步上线,便捷拓荒者和企业集成到我方的系统中。
(Tips:我是虎嗅科技医疗组的王欣,关爱 AI 及创投领域,行业东谈主士调换可加微信:13206438539开云kaiyun,请注明身份。)