降维打击！群体智能半价打平Fable 5，同款API已上线

2026-07-04 发布浏览20次点赞0次收藏0次

【导读】当Fable、Mythos因禁令下线，当OpenRouter Fusion、Fugu、Hermes MoA集体登场，行业共识已成：未来竞争力不在于单一模型有多强，而在于AI组织力。浪潮信息元脑企智EPAI的多模融合API，正带着这份群体智能的降维打击，走向更广阔的企业战场。

今年6月12日，全球最强的Fable 5与Mythos 5，因一纸禁令对所有人下线。

6月13日，OpenRouter放出Fusion，自称「市场上最智能的复合模型」，半价对标Fable。

6月22日，Sakana AI放出Fugu，官方说法是Ultra版比肩Fable 5与Mythos Preview。

紧接着，Hermes官方也上线了Mixture of Agents功能（MoA）。

在智能体基准测试HermesBench上，基于Opus 4.8 + GPT 5.5的MoA得分比 Opus 高出 8%，比GPT高出11%。

他们补位的方式出奇地一致：不是再造一个更大的单一模型，而是把一群现成的模型组织起来，用「群体智能」击败更大参数的单体模型。

Sakana说得最直白：「超越更大模型：编排模型是下一个前沿领域」。

但这件事上，还漏了一家。

在OpenRouter推出Fusion API之前，国内已有企业有类似的想法，最近也推出了相关服务。

不过，他们为什么不卷单模参数，却不约而同选择了这一条路？

AI的下一站

真正的问题是什么？

要理解多模融合的价值，得先承认一件事：「选出最强模型」是个伪命题。

因为真实业务里的复杂任务，都不是单点能力的博弈。

举个例子，一份「竞品技术方案分析」，里面同时藏着

事实检索：对方用了什么技术；
逻辑推理：这套架构的瓶颈在哪；
专业判断：值不值得跟进；
内容表达：写成一份能给老板看的报告。

这四种能力，几乎不可能由同一个模型在每一个环节都保持最佳状态。

AI的能力边界并不是一条平滑的曲线，而是一道布满深渊的断崖。

这一残酷真相叫做：「锯齿状前沿」（Jagged Frontier）。

OpenAI奥特曼曾低估了AI会有多参差不齐，直言：「在有些事上AI做得极其出色，但在那种长期的复杂任务监督方面却完全不行。」

在哈佛商学院与BCG的一项实地实验中，研究者发现：一旦任务跨出模型能力前沿，使用AI的人类顾问反而更容易给出错误答案。

最危险的地方在于：AI会把错误包装得更像正确答案。

传送门：https://www.hbs.edu/ris/Publication%20Files/dell-acqua-et-al-2026-navigating-the-jagged-technological-frontier_5c589c8c-fbb5-458f-b285-c944746cd717.pdf

也就是说，单一AI不是「越难越强、越简单越稳」。

这似乎也是通往真正AGI（通用人工智能）智能的最后几个前沿问题之一。

更糟糕的是，企业级应用依赖单一API，本质上是在刀尖上行走。

如果企业陷入「测试—调整—再测试」的单模型选型死循环，那其实用农业「挑种子」思维，应对数字时代的「工业化协作」。

所以行业的重心，正在悄然变化：从「接入更多模型」，转向「如何根据任务，组织和使用多个模型」。

AI的下一战开始了。

元脑企智EPAI的降维打击

群体智能

浪潮信息元脑企智EPAI的逻辑非常犀利：企业级AI的下半场，比的是谁能让不同模型的长处，在同一个任务里自动「补位」。

最近，元脑企智EPAI上线了多模融合API。

目前，该多模融合API已在积算科技Token服务平台正式上线，并面向开发者和企业用户开放内测申请。

试用申请链接：https://www.icompify.com/api_request/index.html

他们坚信：群体智能超越单模上限。

很多人认为多模融合就是简单的「1+1」，但元脑企智EPAI告诉我们，这是一场关于「AI组织力」的革命。

它的多模融合API，本质上是给企业配了一个「AI首席执行官」。

它的玩法分为三步：

众模并行（候选生成）：把同一个任务丢给一池子模型，让它们各显神通。
智能评审（评审分析）：请一个高阶模型坐在首席，识别不同答案里的共识、分歧和遗漏。
深度融合（最终输出）：挑出最优解，拼出一张最完整的拼图。

关键在于，这一整套流程，开发者只需要一次API调用。

不用自己搭多模型调度系统，不用手写评审逻辑，不用做结果整合。

在OpenClaw、Hermes、OpenCode这些主流智能体框架里，把多模融合API当成一个普通的模型服务配置进去就行，原有的对话、推理、工具调用能力照常用，应用一行都不用重构。

效果有多硬核？

在内部实测中，元脑企智EPAI的多模融合API在DRACO（深度研究）基准测试中拿到了53.9%的成绩，远超单一模型。

甚至数学在AIME 2026和研究生级问答基准GPQA Diamond这些硬核推理榜单上，也跑赢了候选池里的所有单一模型。

说了这么多，多模融合落地到底能干什么？

答案，藏在那些「一个模型搞不定」的复杂场景里。

比如，方案对比：

财务分析：

游戏编程：

游戏任务是生成一个「陨石防御」HTML网页游戏，对两类模型接入OpenCode使用同样的提示词，交付任务后不再干预。

单个大参数模型生成效果不错，流畅度还可以

而多模融合方案的生成效果，整体运行更加流畅，动效更丰富、画面更精致。

为什么效果这么好？

这套机制听起来合理，但它凭什么真能出效果？

答案，藏在一个比大模型古老得多的道理里——群体智能。

早在1785 年，法国数学家孔多塞就证明过一件事：

如果每个陪审员的判断都比瞎猜略强一点，而且各自独立投票，那么人越多，多数意见判对的概率就越高，趋近于百分之百。

但这里有条铁律：群体要变聪明，得同时满足三个前提，缺一个就翻车。

一是多样性。一百个想法一致的人，等于一个人。

二是独立性。不能互相抄袭或共谋，否则会形成「羊群效应」，要么全对，要么全错。

三是聚合要有章法。简单平均或随意投票，只会抹煞真正的分歧与洞见。必须有人能分辨：谁说到点上，谁漏了关键。

看出来了吗？元脑企智EPAI 的「候选生成—评审分析—融合输出」，几乎是照着这三条前提设计的。

这也顺带解释了一件很多人想不通的事：为什么把模型堆大，堆不出多模融合的效果？

因为AI的盲区，刻在它的训练数据和参数里。

你把它做得再大，那个系统性偏差还在——它不知道的，做大了还是不知道。

而多样性能补的，恰恰是这种盲区：A模型漏掉的，B模型正好知道。

智者千虑，必有一失；愚者千虑，必有一得。规模解决不了的问题，多样性能解决。

元脑企智EPAI的多模融合API，用一组便宜模型，替下一个昂贵模型。

另外，它还把已经买下的算力盘活。

企业早投了钱建算力集群、部署模型，可很多算力和模型平时利用率并不高。

多模融合给这些「闲置产能」派了活——它们成了候选模型，跑在你已经付过钱的基础设施上。

这不是让你多买算力，而是把手里算力的利用率提上去。

这套机制还白送了企业一个很看重的东西：答案不再是黑箱。

评审这一步本身就要展示参与模型、贡献内容、采纳理由等。

在金融、医疗、政务这些强监管、要留痕的场景里，这几乎是刚需。

未来，元脑企智EPAI先迈出去了

不过，这里要给一句难得的清醒话。

多模融合，并不是用来替代所有单模型调用的。

官方自己也说得很明白：

简单问答、格式转换、低复杂度的内容生成，单模型在成本和响应速度上通常更划算。

算力「按需分配」，别再杀鸡用牛刀。

这正是 EPAI 计划要做的事：根据任务复杂度、效果要求、成本和时延，自动决定要不要触发融合、调哪些模型、上多大规模。

简单任务，一个轻量模型解决，不浪费；复杂任务，才动用多模融合。

算力花在刀刃上，而不是要么长期「配置不足」（单模便宜但常出错）、要么一律「配置过剩」。

此外，未来还可能出现多模态融合：文本模型与视觉、语音、音频模型融合，用户无需手动选择模态。

未来，真正的竞争力或许不再是模型有多强，而是你能不能把已有的算力、模型和业务任务，组织成一套可管理、可评审、可持续优化的协同系统。

从「选择模型」，到「组织模型」。这一步，元脑企智EPAI先迈出去了。

AGI C 试用算力大模型 GPT 测试 Agent OpenClaw 性能 AI 人工智能 OpenAI 框架

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

降维打击！群体智能半价打平Fable 5，同款API已上线

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。