给AlphaFold2开刀!GPT-5.5自进化,狂肝150小时改进蛋白质折叠

浏览31次 点赞0次 收藏0次

【导读】有人晒出开源项目:GPT-5.5连续狂飙150小时,自主挑战诺奖级AlphaFold2!它用拓扑「单纯形」重构蛋白质折叠逻辑,虽然性能暂未登顶,却展示了AI科学家的恐怖潜力:秒回滚、零情绪、全自动进化。科研范式,真要变天了。

就在最近,GitHub上一个名为SimplexFold 的开源项目突然火出了圈。

它的共同作者名单里,居然出现了这样一个名字——GPT-5.5!


Meta的机器学习工程师、开源社区硬核黑客Chris Hayduk爆料:他让GPT-5.5开启了「全自主目标模式」,在没有人类干预的情况下,连续不间断地疯狂运行了150多个小时!

它的终极任务只有一个:扮演一位硅基科学家,去挑战、重构、甚至颠覆那个刚刚斩获诺贝尔奖的行业神话——AlphaFold2。


在这场长达数天的「疯狂长跑」中,GPT-5.5 展现出了令人惊叹的科研自主性:它自己分析论文、自己设计网络拓扑、自己推导几何公式、自己魔改 PyTorch 代码、自己跑训练。


甚至,在遭遇严重过拟合时,它展现出了连人类专家都无法完全解释的「自发泛化」神迹!

诺奖AI的重大缺陷:AlphaFold2到底漏掉了什么?

要理解 GPT-5.5 为什么要对 AlphaFold2 开刀,我们得先来看看现有的「行业霸主」到底有什么遗憾。

2024年,AlphaFold2 凭借无可争议的晶体结构预测精度斩获诺贝尔化学奖。

它的核心武器是Evoformer模块。


在 Evoformer 内部,包含了一套非常强大的「残基对(Residue Pairs)」与「三角形(Triangle)」推理机制。

模型把蛋白质的氨基酸残基两两配对,用一个二阶的成对张量(Pair TensorZ_{ij})来表示它们之间的关系。这在图论里,相当于蛋白质的「边(Edge)」

著名的「三角更新(Triangle Updates)」机制,则是通过引入第三个残基,来反复校正和增强这些边之间的空间几何一致性(比如强制让残基 i, j, k 的边长满足三角形三边关系)。


但是,精妙的背后的代价是:遗忘。

现有的 AlphaFold2 在完成极其复杂的三角形计算后,做了一件非常「偷懒」的事——它顺手把计算结果又塞回了那条一阶的「边(Z_{ij})」里面。

也就是说,AlphaFold2 内部并没有为一整个完整的三角形面 (i,j,k) 或是四面体单元 (i,j,k,l) 维护一个持久的、连续更新的「高阶状态表示」。


它就像一个记忆力只有3秒的工匠,虽然每次砌砖时都会用一把精密的「三角尺」量一下角度,但量完就把尺子扔了,脑子里记住的依然只有「砖头A和砖头B挨得有多近」。

这,就是 AlphaFold2 的核心禁区,也是限制其在极微观空间拓扑表达上更进一步的「隐形天花板」。


而 GPT-5.5 在翻阅了无数生物信息学文献后,敏锐地盯住了这个盲区。

SimplexFold 项目的核心设问由此诞生——

如果我们在神经网络里,直接让模型去学习、维护、更新一整个「三角形面」和「四面体单元」的持久状态,会发生什么?

用数学降维打击生物学复杂性

为了解决这个问题,GPT-5.5 引入了一个在近代拓扑学中大放异彩的概念——单纯形(Simplex)


名字听起来很高深,但其实它的直观含义非常纯粹:单纯形,就是某个维度里最简单的几何图形。

项目主页用一张极其优雅的表格,向我们展示了蛋白质结构是如何被「单纯形化」的。


现有的绝大多数蛋白质神经网络,本质上都是普通的图神经网络

在拓扑学语言里,它们只是一个孤独的「1-骨架」——只有节点(点)和关系(边)。

然而,生命不是一根根铁丝拧成的网,生命是丰满的三维实体。

蛋白质的折叠和多肽链的缠绕,内部充满了极其苛刻的三体、四体甚至多体物理约束。比如:主链的角度、二面角扭转、Beta折叠的扇面几何、疏水核心的紧密堆积、局部残基的侧链空间排布、甚至口袋内部的空腔和手性。


如果只用「边」来表达,模型不得不转无数个弯去猜这些高阶特征。

但如果引入「单纯形」,一个「面特征(Face Feature)」可以直接理直气壮地说: 「残基 i, j, k 组成了一个局部的朝向表面,它的面积是多少,内角系统是怎样的。」

一个「四面体特征(Tetra Feature)」则可以直接高喊: 「残基 i, j, k, l 构成了一个紧凑的三维包装核心,它的体积是正还是负(代表手性方向),空间位阻profile是什么!」


这就是 SimplexFold 压下的惊天豪赌:通过引入显式的高阶拓扑状态(点体),为神经网络注入极其强大的几何归纳偏置,从而用更少的数据、更优雅的架构,榨干蛋白质主链折叠的最后一丝精度!


自动研究 150 小时,GPT-5.5 究竟改了啥?

以上内容是不是太专业了,看不太懂?

X网友Michael Hla在线发问:「这 150 个小时里,AI 到底折腾出了什么硬核优化?」

作者 Chris Hayduk 随即大方地公开了 GPT-5.5 的「科研成果」。

在原始的设计里,SimplexFold 的信息传递比较简单粗暴:

边 (Edge)➡️面 (Face) ➡️体 (Tetra)➡️面 (Face)➡️重新倒回边和点。


这就好比大家开完会,最后派个代表写个大杂烩简报,把高维信息粗鲁地倒回一维的单体特征里。

而 GPT-5.5 疯狂加班 150 小时后,精细化地重构了整个通信路径!它设计了一套「高度结构化的回写机制」。

现在,被选中的三角形和四面体在往回传导信息时,不再是「大锅饭」式的倾倒。它们必须严格通过自己真正的边界边进行精准路由。

AI 还贴心地加入了几何感知门控和弱三角形注意力提示

这直接把原本粗糙的「传话游戏」,升级成了带有精准导航、具备空间方向感的「高维立体通信网络」。


反转与吃瓜

对于这个炸裂的项目,网上的各路技术大牛和吃瓜群众当场讨论起来。

疑问一:等一下,这个实验图表怎么还带穿越的?

在作者晒出的自主实验进程图中,有眼尖的网友发现了一个诡异的现象。

「什么鬼?看第 80 次运行附近,曲线怎么突然倒流了?它回到了过去,然后创下了一个比后来还要高的新纪录?」


面对这个怪事大家开始疯狂猜测。最后得出的结论细思极恐: AI自己给自己开辟新路了。

AI在推进到某一步时,发现后面的路越走越窄。于是,它非常理智地回滚到了第 80 步那个曾经表现不错的历史分叉口,放弃了后面的错误路线,重新开辟了一条新战线。

这在人类科研里太常见了。

唯一不同的是,人类要是做实验做了好几天发现错了要推倒重来,回到前几天的步骤,那种心理崩溃要痛苦得多。

疑问二:结果其实不太行?

就在大家激动的时候,冷酷的现实给了大家当头一棒。

有人发现: 这玩意儿太疯狂了,严重的过拟合居然引发了自发的泛化。

技术大佬解释道: 没什么好大惊小怪的。仔细看作者发的最新的指标结果,其实相当糟糕。在这条 Y 轴上,正牌的 AlphaFold 分数大概在 90 左右,而这个 SimplexFold 差得远呢。别忘了,这模型可是把AlphaFold的论文喂给它训出来的。


所以, 闹了半天,最后搞出来的模型性能其实被原生 AlphaFold 吊打?

既然最终的预测结果并不能比肩AlphaFold,那这个疯狂的「150小时实验」失败了吗?

恰恰相反。

几乎所有的一线AI实验室和科学家都给出了相同的答案:这事儿的意义,根本不在于 SimplexFold这个模型,而是在「自动研究员」本身。


这次实验,是一次极其硬核的概念验证。它证明了高阶逻辑的自洽性,展现了恐怖的样本效率和抗挫折能力,而且是一次低成本的试错。

连续 150 小时,自己给自己 debug、看报错、换路线、主动回滚历史分支。这种全自动的实验闭环,一旦配上更强的大模型,进化速度将超出人类想象。

当AI自动研究员全面走向实验室的那一天,或许就是人类无数顽疾被治愈的黎明。

参考资料:

https://x.com/chrishayduk/status/2055757345506877759?s=46

编辑:Aeneas David

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯