给AlphaFold2开刀！GPT-5.5自进化，狂肝150小时改进蛋白质折叠

2026-05-23 发布浏览339次点赞0次收藏0次

【导读】有人晒出开源项目：GPT-5.5连续狂飙150小时，自主挑战诺奖级AlphaFold2！它用拓扑「单纯形」重构蛋白质折叠逻辑，虽然性能暂未登顶，却展示了AI科学家的恐怖潜力：秒回滚、零情绪、全自动进化。科研范式，真要变天了。

就在最近，GitHub上一个名为SimplexFold 的开源项目突然火出了圈。

它的共同作者名单里，居然出现了这样一个名字——GPT-5.5！

Meta的机器学习工程师、开源社区硬核黑客Chris Hayduk爆料：他让GPT-5.5开启了「全自主目标模式」，在没有人类干预的情况下，连续不间断地疯狂运行了150多个小时！

它的终极任务只有一个：扮演一位硅基科学家，去挑战、重构、甚至颠覆那个刚刚斩获诺贝尔奖的行业神话——AlphaFold2。

在这场长达数天的「疯狂长跑」中，GPT-5.5 展现出了令人惊叹的科研自主性：它自己分析论文、自己设计网络拓扑、自己推导几何公式、自己魔改 PyTorch 代码、自己跑训练。

甚至，在遭遇严重过拟合时，它展现出了连人类专家都无法完全解释的「自发泛化」神迹！

诺奖AI的重大缺陷：AlphaFold2到底漏掉了什么？

要理解 GPT-5.5 为什么要对 AlphaFold2 开刀，我们得先来看看现有的「行业霸主」到底有什么遗憾。

2024年，AlphaFold2 凭借无可争议的晶体结构预测精度斩获诺贝尔化学奖。

它的核心武器是Evoformer模块。

在 Evoformer 内部，包含了一套非常强大的「残基对（Residue Pairs）」与「三角形（Triangle）」推理机制。

模型把蛋白质的氨基酸残基两两配对，用一个二阶的成对张量（Pair TensorZ_{ij}）来表示它们之间的关系。这在图论里，相当于蛋白质的「边（Edge）」。

著名的「三角更新（Triangle Updates）」机制，则是通过引入第三个残基，来反复校正和增强这些边之间的空间几何一致性（比如强制让残基 i, j, k 的边长满足三角形三边关系）。

但是，精妙的背后的代价是：遗忘。

现有的 AlphaFold2 在完成极其复杂的三角形计算后，做了一件非常「偷懒」的事——它顺手把计算结果又塞回了那条一阶的「边（Z_{ij}）」里面。

也就是说，AlphaFold2 内部并没有为一整个完整的三角形面 (i,j,k) 或是四面体单元 (i,j,k,l) 维护一个持久的、连续更新的「高阶状态表示」。

它就像一个记忆力只有3秒的工匠，虽然每次砌砖时都会用一把精密的「三角尺」量一下角度，但量完就把尺子扔了，脑子里记住的依然只有「砖头A和砖头B挨得有多近」。

这，就是 AlphaFold2 的核心禁区，也是限制其在极微观空间拓扑表达上更进一步的「隐形天花板」。

而 GPT-5.5 在翻阅了无数生物信息学文献后，敏锐地盯住了这个盲区。

SimplexFold 项目的核心设问由此诞生——

如果我们在神经网络里，直接让模型去学习、维护、更新一整个「三角形面」和「四面体单元」的持久状态，会发生什么？

用数学降维打击生物学复杂性

为了解决这个问题，GPT-5.5 引入了一个在近代拓扑学中大放异彩的概念——单纯形（Simplex）。

名字听起来很高深，但其实它的直观含义非常纯粹：单纯形，就是某个维度里最简单的几何图形。

项目主页用一张极其优雅的表格，向我们展示了蛋白质结构是如何被「单纯形化」的。

现有的绝大多数蛋白质神经网络，本质上都是普通的图神经网络。

在拓扑学语言里，它们只是一个孤独的「1-骨架」——只有节点（点）和关系（边）。

然而，生命不是一根根铁丝拧成的网，生命是丰满的三维实体。

蛋白质的折叠和多肽链的缠绕，内部充满了极其苛刻的三体、四体甚至多体物理约束。比如：主链的角度、二面角扭转、Beta折叠的扇面几何、疏水核心的紧密堆积、局部残基的侧链空间排布、甚至口袋内部的空腔和手性。

如果只用「边」来表达，模型不得不转无数个弯去猜这些高阶特征。

但如果引入「单纯形」，一个「面特征（Face Feature）」可以直接理直气壮地说：「残基 i, j, k 组成了一个局部的朝向表面，它的面积是多少，内角系统是怎样的。」

一个「四面体特征（Tetra Feature）」则可以直接高喊：「残基 i, j, k, l 构成了一个紧凑的三维包装核心，它的体积是正还是负（代表手性方向），空间位阻profile是什么！」

这就是 SimplexFold 压下的惊天豪赌：通过引入显式的高阶拓扑状态（点↔边↔面↔体），为神经网络注入极其强大的几何归纳偏置，从而用更少的数据、更优雅的架构，榨干蛋白质主链折叠的最后一丝精度！

自动研究 150 小时，GPT-5.5 究竟改了啥？

以上内容是不是太专业了，看不太懂？

X网友Michael Hla在线发问：「这 150 个小时里，AI 到底折腾出了什么硬核优化？」

作者 Chris Hayduk 随即大方地公开了 GPT-5.5 的「科研成果」。

在原始的设计里，SimplexFold 的信息传递比较简单粗暴：

边 (Edge)➡️面 (Face) ➡️体 (Tetra)➡️面 (Face)➡️重新倒回边和点。

这就好比大家开完会，最后派个代表写个大杂烩简报，把高维信息粗鲁地倒回一维的单体特征里。

而 GPT-5.5 疯狂加班 150 小时后，精细化地重构了整个通信路径！它设计了一套「高度结构化的回写机制」。

现在，被选中的三角形和四面体在往回传导信息时，不再是「大锅饭」式的倾倒。它们必须严格通过自己真正的边界边进行精准路由。

AI 还贴心地加入了几何感知门控和弱三角形注意力提示。

这直接把原本粗糙的「传话游戏」，升级成了带有精准导航、具备空间方向感的「高维立体通信网络」。

反转与吃瓜

对于这个炸裂的项目，网上的各路技术大牛和吃瓜群众当场讨论起来。

疑问一：等一下，这个实验图表怎么还带穿越的？

在作者晒出的自主实验进程图中，有眼尖的网友发现了一个诡异的现象。

「什么鬼？看第 80 次运行附近，曲线怎么突然倒流了？它回到了过去，然后创下了一个比后来还要高的新纪录？」

面对这个怪事大家开始疯狂猜测。最后得出的结论细思极恐： AI自己给自己开辟新路了。

AI在推进到某一步时，发现后面的路越走越窄。于是，它非常理智地回滚到了第 80 步那个曾经表现不错的历史分叉口，放弃了后面的错误路线，重新开辟了一条新战线。

这在人类科研里太常见了。

唯一不同的是，人类要是做实验做了好几天发现错了要推倒重来，回到前几天的步骤，那种心理崩溃要痛苦得多。

疑问二：结果其实不太行？

就在大家激动的时候，冷酷的现实给了大家当头一棒。

有人发现：这玩意儿太疯狂了，严重的过拟合居然引发了自发的泛化。

技术大佬解释道：没什么好大惊小怪的。仔细看作者发的最新的指标结果，其实相当糟糕。在这条 Y 轴上，正牌的 AlphaFold 分数大概在 90 左右，而这个 SimplexFold 差得远呢。别忘了，这模型可是把AlphaFold的论文喂给它训出来的。

所以，闹了半天，最后搞出来的模型性能其实被原生 AlphaFold 吊打？

既然最终的预测结果并不能比肩AlphaFold，那这个疯狂的「150小时实验」失败了吗？

恰恰相反。

几乎所有的一线AI实验室和科学家都给出了相同的答案：这事儿的意义，根本不在于 SimplexFold这个模型，而是在「自动研究员」本身。

这次实验，是一次极其硬核的概念验证。它证明了高阶逻辑的自洽性，展现了恐怖的样本效率和抗挫折能力，而且是一次低成本的试错。

连续 150 小时，自己给自己 debug、看报错、换路线、主动回滚历史分支。这种全自动的实验闭环，一旦配上更强的大模型，进化速度将超出人类想象。

当AI自动研究员全面走向实验室的那一天，或许就是人类无数顽疾被治愈的黎明。

参考资料：

https://x.com/chrishayduk/status/2055757345506877759?s=46

编辑：Aeneas David

大模型性能 GPT AI

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

给AlphaFold2开刀！GPT-5.5自进化，狂肝150小时改进蛋白质折叠

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。