降维打击!群体智能半价打平Fable 5,同款API已上线
【导读】当Fable、Mythos因禁令下线,当OpenRouter Fusion、Fugu、Hermes MoA集体登场,行业共识已成:未来竞争力不在于单一模型有多强,而在于AI组织力。浪潮信息元脑企智EPAI的多模融合API,正带着这份群体智能的降维打击,走向更广阔的企业战场。
今年6月12日,全球最强的Fable 5与Mythos 5,因一纸禁令对所有人下线。
6月13日,OpenRouter放出Fusion,自称「市场上最智能的复合模型」,半价对标Fable。
6月22日,Sakana AI放出Fugu,官方说法是Ultra版比肩Fable 5与Mythos Preview。
紧接着,Hermes官方也上线了Mixture of Agents功能(MoA)。
在智能体基准测试HermesBench上,基于Opus 4.8 + GPT 5.5的MoA得分比 Opus 高出 8%,比GPT高出11%。

他们补位的方式出奇地一致:不是再造一个更大的单一模型,而是把一群现成的模型组织起来,用「群体智能」击败更大参数的单体模型。
Sakana说得最直白:「超越更大模型:编排模型是下一个前沿领域」。
但这件事上,还漏了一家。
在OpenRouter推出Fusion API之前,国内已有企业有类似的想法,最近也推出了相关服务。
不过,他们为什么不卷单模参数,却不约而同选择了这一条路?
AI的下一站
真正的问题是什么?
要理解多模融合的价值,得先承认一件事:「选出最强模型」是个伪命题。
因为真实业务里的复杂任务,都不是单点能力的博弈。
举个例子,一份「竞品技术方案分析」,里面同时藏着
事实检索:对方用了什么技术;
逻辑推理:这套架构的瓶颈在哪;
专业判断:值不值得跟进;
内容表达:写成一份能给老板看的报告。
这四种能力,几乎不可能由同一个模型在每一个环节都保持最佳状态。
AI的能力边界并不是一条平滑的曲线,而是一道布满深渊的断崖。
这一残酷真相叫做:「锯齿状前沿」(Jagged Frontier)。

OpenAI奥特曼曾低估了AI会有多参差不齐,直言:「在有些事上AI做得极其出色,但在那种长期的复杂任务监督方面却完全不行。」
在哈佛商学院与BCG的一项实地实验中,研究者发现:一旦任务跨出模型能力前沿,使用AI的人类顾问反而更容易给出错误答案。

最危险的地方在于:AI会把错误包装得更像正确答案。

传送门:https://www.hbs.edu/ris/Publication%20Files/dell-acqua-et-al-2026-navigating-the-jagged-technological-frontier_5c589c8c-fbb5-458f-b285-c944746cd717.pdf
也就是说,单一AI不是「越难越强、越简单越稳」。
这似乎也是通往真正AGI(通用人工智能)智能的最后几个前沿问题之一。
更糟糕的是,企业级应用依赖单一API,本质上是在刀尖上行走。
如果企业陷入「测试—调整—再测试」的单模型选型死循环,那其实用农业「挑种子」思维,应对数字时代的「工业化协作」。
所以行业的重心,正在悄然变化:从「接入更多模型」,转向「如何根据任务,组织和使用多个模型」。
AI的下一战开始了。
元脑企智EPAI的降维打击
群体智能
浪潮信息元脑企智EPAI的逻辑非常犀利:企业级AI的下半场,比的是谁能让不同模型的长处,在同一个任务里自动「补位」。
最近,元脑企智EPAI上线了多模融合API。

目前,该多模融合API已在积算科技Token服务平台正式上线,并面向开发者和企业用户开放内测申请。
试用申请链接:https://www.icompify.com/api_request/index.html
他们坚信:群体智能超越单模上限。
很多人认为多模融合就是简单的「1+1」,但元脑企智EPAI告诉我们,这是一场关于「AI组织力」的革命。
它的多模融合API,本质上是给企业配了一个「AI首席执行官」。
它的玩法分为三步:
众模并行(候选生成):把同一个任务丢给一池子模型,让它们各显神通。
智能评审(评审分析):请一个高阶模型坐在首席,识别不同答案里的共识、分歧和遗漏。
深度融合(最终输出):挑出最优解,拼出一张最完整的拼图。

关键在于,这一整套流程,开发者只需要一次API调用。
不用自己搭多模型调度系统,不用手写评审逻辑,不用做结果整合。
在OpenClaw、Hermes、OpenCode这些主流智能体框架里,把多模融合API当成一个普通的模型服务配置进去就行,原有的对话、推理、工具调用能力照常用,应用一行都不用重构。
效果有多硬核?
在内部实测中,元脑企智EPAI的多模融合API在DRACO(深度研究)基准测试中拿到了53.9%的成绩,远超单一模型。

甚至数学在AIME 2026和研究生级问答基准GPQA Diamond这些硬核推理榜单上,也跑赢了候选池里的所有单一模型。


说了这么多,多模融合落地到底能干什么?
答案,藏在那些「一个模型搞不定」的复杂场景里。
比如,方案对比:

财务分析:

游戏编程:
游戏任务是生成一个「陨石防御」HTML网页游戏,对两类模型接入OpenCode使用同样的提示词,交付任务后不再干预。

单个大参数模型生成效果不错,流畅度还可以
而多模融合方案的生成效果,整体运行更加流畅,动效更丰富、画面更精致。

为什么效果这么好?
这套机制听起来合理,但它凭什么真能出效果?
答案,藏在一个比大模型古老得多的道理里——群体智能。
早在1785 年,法国数学家孔多塞就证明过一件事:
如果每个陪审员的判断都比瞎猜略强一点,而且各自独立投票,那么人越多,多数意见判对的概率就越高,趋近于百分之百。

但这里有条铁律:群体要变聪明,得同时满足三个前提,缺一个就翻车。
一是多样性。一百个想法一致的人,等于一个人。
二是独立性。不能互相抄袭或共谋,否则会形成「羊群效应」,要么全对,要么全错。
三是聚合要有章法。简单平均或随意投票,只会抹煞真正的分歧与洞见。必须有人能分辨:谁说到点上,谁漏了关键。
看出来了吗?元脑企智EPAI 的「候选生成—评审分析—融合输出」,几乎是照着这三条前提设计的。
这也顺带解释了一件很多人想不通的事:为什么把模型堆大,堆不出多模融合的效果?
因为AI的盲区,刻在它的训练数据和参数里。

你把它做得再大,那个系统性偏差还在——它不知道的,做大了还是不知道。
而多样性能补的,恰恰是这种盲区:A模型漏掉的,B模型正好知道。
智者千虑,必有一失;愚者千虑,必有一得。规模解决不了的问题,多样性能解决。
元脑企智EPAI的多模融合API,用一组便宜模型,替下一个昂贵模型。
另外,它还把已经买下的算力盘活。
企业早投了钱建算力集群、部署模型,可很多算力和模型平时利用率并不高。
多模融合给这些「闲置产能」派了活——它们成了候选模型,跑在你已经付过钱的基础设施上。
这不是让你多买算力,而是把手里算力的利用率提上去。
这套机制还白送了企业一个很看重的东西:答案不再是黑箱。

评审这一步本身就要展示参与模型、贡献内容、采纳理由等。
在金融、医疗、政务这些强监管、要留痕的场景里,这几乎是刚需。
未来,元脑企智EPAI先迈出去了
不过,这里要给一句难得的清醒话。
多模融合,并不是用来替代所有单模型调用的。
官方自己也说得很明白:
简单问答、格式转换、低复杂度的内容生成,单模型在成本和响应速度上通常更划算。
算力「按需分配」,别再杀鸡用牛刀。
这正是 EPAI 计划要做的事:根据任务复杂度、效果要求、成本和时延,自动决定要不要触发融合、调哪些模型、上多大规模。
简单任务,一个轻量模型解决,不浪费;复杂任务,才动用多模融合。
算力花在刀刃上,而不是要么长期「配置不足」(单模便宜但常出错)、要么一律「配置过剩」。
此外,未来还可能出现多模态融合:文本模型与视觉、语音、音频模型融合,用户无需手动选择模态。
未来,真正的竞争力或许不再是模型有多强,而是你能不能把已有的算力、模型和业务任务,组织成一套可管理、可评审、可持续优化的协同系统。
从「选择模型」,到「组织模型」。这一步,元脑企智EPAI先迈出去了。
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!
AI 中文社