GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

2025-08-02 发布浏览432次点赞0次收藏0次

GPT-5，曾经差点难产？这条诞生路，简直是烈火炼真金。一边是人才出走、小扎截胡、团队内部陷入混乱，另一边，推理模型魔咒让研究者苦恼不已，项目甚至一度停摆。外媒曝出这期 GPT-5 诞生内幕，可谓亮点满满，干货十足。

就在刚刚，外媒 The Information 曝出了关于 GPT-5 的一大波最新内幕，众多猛料来了！

比如，GPT-5 并未取得技术突破，不存在 GPT-3 到 GPT-4 这种级别的跃升。

比如，OpenAI 正面临着严重的数据瓶颈和技术难题。

还有一个劲爆大瓜，OpenAI 大波核心研究者一下子被小扎撬走，直接导致了 OpenAI 内部的组织架构混乱！

为此，研究副总裁 Jerry Tworek 在 Slack 上公开向研究主管 Mark Chen 抱怨，许多同事都看到了。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

不过，就在这么一篇唱衰的文章发布之际，OpenAI 同时又有好消息了。

近日，OpenAI 又获得了一笔巨额融资。据悉，OpenAI 已提前数月筹集了 83 亿美元资金，这就导致它的估值直接达到 3000 亿美元，这是今年 400 亿美元融资计划的一部分。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

参与此轮融资的，有一大波全新投资者，其中 Dragoneer 投资集团以 28 亿美元领投本轮，Blackstone、TPG、Fidelity、Founders Fund、红杉资本等跟投。

不过，虽说 Dragoneer 是本轮融资的最大出资方，但软银仍是整个 400 亿融资计划的牵头者。

GPT-5 还没发布，各方势力都下场了，这不免让人把期待值拉满，屏息等待下周的盛况了。

Orion 陨落真相：GPT-5 没做出来，降级成 4.5 了

去年万众瞩目的 Orion，大家应该都还记得。

The Information 爆料说，2024 年下半年的大部分时间里，OpenAI 都在全力开发 Orion 模型，它被寄予了厚望，原计划作为 GPT-5 推出。

跟 5 月发布的旗舰模型 GPT-4o 相比，Orion 本该有巨大飞跃。

结果它的性能令人*失所望，最终只能被降级成 GPT-4.5，在今年 2 月推出。默默上线后，GPT-4.5 迅速淡出公众视野。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

所以，Orion 为何会失败？

最核心的原因就在于，团队摸到了预训练阶段的天花板。因为高质量网络数据已经日益枯竭，训练小模型时还有效的技巧，在大模型身上竟然就会失效。

这不光导致了 GPT-5 的延期，也让 OpenAI 的团队内部陷入了自我怀疑。

GPT-5，根本没有 GPT-3 到 GPT-4 级的跃迁

这个从神坛跌落的故事，要从去年 12 月说起。

当时，OpenAI 的研究者完成了一项内部测试，结果震惊了整个团队。

他们发现，当给一个新模型更多算力和思考时间，它就像开了挂一样，复杂推理信手拈来，执行任务出色到惊人。

然而，激动的工程师们很快发现，这份兴奋只是暂时的。

当他们把这个新模型转化为 o3 聊天版本时，那种惊人的性能提升消失了。

可以说，这次事件，正是 OpenAI 在今年大部分时间里所面临技术挑战的一个缩影。这让 OpenAI 不仅内部技术进展缓慢，大获成功的 ChatGPT 业务也受到波及。

GPT-5 发布前夕，各类泄露和爆料已经是满天飞。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

比如，它的编程和数学能力又有了显著提升。另外，它在驱动 AI 智能体方面也优于前代模型，只需要极少人工监督，就能处理复杂任务。

它能遵循极其复杂的指令，比如支持智能体何时应批准退款的规则。而在以往，模型需要学习多个棘手的「边缘案例」，才能处理此类退款。

但总的来说，这些改进根本无法与 2020 年 GPT-3 到 2023 年的 GPT-4 之间的性能飞跃相提并论。

也就是说，我们需要做好对 GPT-5 失望的准备。

不过，OpenAI 模型的任何改进，即便是渐进式的，也能刺激客户需求，以及给投资者信心。这样才能支持 OpenAI 未来三年半烧掉 450 亿的计划，毕竟租用服务器实在是太昂贵了。

高管为何相信 GPT-8？

最近曾有 OpenAI 高管向投资者透露：沿着目前架构，他们相信模型有朝一日会达到 GPT-8 的水平。

CEO 奥尔特曼也表示过，利用现有技术，OpenAI 有望创造出 AGI。

是什么给了他们这样的信念？

一位了解内情的微软员工透露了玄机：测试 GPT-5 后，他们发现它在不消耗更多算力的情况下，就能生成更高质量的代码和文本。

部分原因在于，它学会了精准判断出不同任务所需的计算资源量。

内部「混乱不堪」

不过 OpenAI 内部，可并非一片和谐。

比如一些高级研究者，非常抵触将自己的成果交给微软，尽管这位最大股东拥有的合同权利截至到 2030 年。

虽然两家公司财务紧密，但在具体合作条款上，却始终争执不休。最新信息是，OpenAI 重组营利性部门后，微软很可能在其中获得 33% 的股份。

而小扎以天价薪酬挖走的团队，也让 OpenAI 内部陷入了更大的混乱。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

走了这么多人，只能紧急进行组织架构调整。

上周，OpenAI 的研究副总裁 Jerry Tworek 在 Slack 上向上司、研究主管 Mark Chen 抱怨团队变动的事，许多同事都看到了这条信息。

当时，Tworek 表示需要休假一周来重新思考，但最终并未休假。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

绝境中的转机：推理模型的意外崛起

总之，直到今年 6 月，情况依然很严峻：OpenAI 开发的模型中，没有一个能顶得住 GPT-5 的名号。

好在，「推理模型」成了他们的全新突破口。

23 年末一项名为 Q * 的技术突破，能解决前所未见的数学问题，在 OpenAI 研究者中引发了巨大震动。

基于 Q*，OpenAI 开发了许多推理模型，在获得更多算力时，它们就会表现更佳 —— 看起来，预训练的性能增长瓶颈，就要被克服了。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

去年秋天，第一个推理模型正式推出，它就是 o1。24 年底，OpenAI 利用与 o1 基础相同的 GPT-4o，又推出了推理模型 o3。

据说，虽然师出同门，但 o3 的教师模型在理解科学知识方面，比 o1 的教师模型进步大得多。

背后原因，就是 OpenAI 用了更多英伟达芯片来开发 o3 的教师模型，这就让它理解复杂概念时能力更强。

还有一个原因，就是它被赋予了搜索网络，以及从代码库中提取信息的能力。

并且，它也同样受益于强化学习。此过程中，人类专家在生物学、软件工程和医学上提出刁钻的问题和答案，然后让模型针对这些问题生成数千个自己的回答。

随后，OpenAI 会利用那些与人类专家得出相同答案的 AI 生成回答（也即「合成数据」）来训练模型。

推理模型为何总翻车

o3 模型发布后，一度成为全球头条，引发病毒式讨论，然而现实很快给了当头一棒。

当 o3 的教师模型转换为学生模型，变成一个可以让人们提问的聊天版本时，它的性能显著下降，甚至跟 o1 相比没有任何区别。

同样，创建让企业通过 API 购买的版本时，同样的问题也出现了。

有知情人分析，原因是这样的：o3 理解概念的方式很独特，跟人类的交流方式大相径庭。

因此，如果创建一个聊天版本，其实就拉低了这个原始天才级模型的智能水平，因为它被迫用人类语言，而非自己的语言去交流。这种情况下，它的推理链条就会被迫压缩、扭曲。

甚至有开发者在调试时，偶尔能看到模型输出「乱码」般的中间语言 —— 那可能就是它「思考」的原始形态，也就是这个天才原本的样子。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

还有人认为，OpenAI 没有投入足够精力来训练模型在聊天场景中与人类进行有效沟通。

总之，o 系列模型让 ChatGPT 的用户非常困惑，因此公司决定重新回归 GPT 的命名体系。

「通用验证器」

好在，OpenAI 还有办法。

据悉，内部正在开发一种「通用验证器」，可以自动化地确保模型在 RL 过程中产生高质量的答案。

本质上，这个过程是让一个 LLM 承担起检查和评估另一个模型答案的任务，并利用各种信息源来对答案进行研究核实。

前一阵 OpenAI 的模型在数学竞赛中拿了金牌后，高级研究员 Alexander Wei 在 X 上表示，他们所使用的强化学习方法是「通用」的。

也就是说，这个模型不仅能检查编程这种标准答案清晰的内容，甚至还能判断写作这种主观性很强的内容质量。

这就对 GPT-5 助力极大！

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

OpenAI 强化学习团队负责人 Tworek 最近也公开表示，自己认同这个观点：OpenAI 模型背后的强化学习系统，其实已经具备了通往 AGI 的潜力。

目前，包括 xAI 和谷歌在内的 AI 大厂都已加倍押注强化学习。

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

上周，Altman 在播客节目中，描述 GPT-5 的能力说，它轻松解决了一个他根本看不懂的问题，直接让他坐到椅子上，感到晕眩。

这就进一步点燃了我们对 GPT-5 的狂热期待。

「在几乎所有方面，GPT-5 都比我们更聪明。」

究竟什么样的模型，才配叫作 GPT-5？好在，我们要等的时间不多了。

参考资料：

https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5?rc=epv9gi

本文来自微信公众号：（ID：AI_era）

openai OpenAI 算力谷歌 CEO AI 写作 GPT5 芯片 ChatGPT 4 测试训练模型微软服务器英伟达性能 AGI xAI GPT 大模型 4o

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命

Orion 陨落真相：GPT-5 没做出来，降级成 4.5 了

GPT-5，根本没有 GPT-3 到 GPT-4 级的跃迁

高管为何相信 GPT-8？

内部「混乱不堪」

绝境中的转机：推理模型的意外崛起

推理模型为何总翻车

「通用验证器」

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

Orion 陨落真相：GPT-5 没做出来，降级成 4.5 了

GPT-5，根本没有 GPT-3 到 GPT-4 级的跃迁

高管为何相信 GPT-8？

内部「混乱不堪」

绝境中的转机：推理模型的意外崛起

推理模型为何总翻车

「通用验证器」

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。