AI 中文社/资讯/详情

AI半天顶博士6个月，奥特曼太激动！生化圈巨震

2025-11-22 发布 · 浏览20次 · 点赞0次 · 收藏0次

【导读】奥特曼激动转发！这将是AI最深刻的影响，预示科学从稀缺走向丰饶的时代即将来临。

让OpenAI奥特曼激动的AI成就！

「AI科学家」Kosmos带来了7项发现：

独立复现了神经科学、材料科学、生物学等领域3大发现，

还在遗传流行病学、多组学整合分析、阿尔茨海默症和转录组学上取得了4项原创发现。

OpenAI的奥特曼激动表示：「我预计大家会看到越来越多类似的事情，而这将成AI最重要影响之一。祝贺Future House团队！」

原来这项突破背后靠的OpenAI——

Future House董事兼首席执行官Sam Rodriques在推文评论：

这一切之所以成为可能，很大程度上要归功于OpenAI员工所做的出色工作。

持之以恒，接下来的几年注定精彩纷呈。

他还推销了Kosmos体验平台。

奥特曼送上祝贺的「未来之家」（Future House）什么来头？到底做什么了让奥特曼感到兴奋？

可以保证，这次奥特曼绝对没有「眩晕到瘫坐」。但毫无疑问，这让他真正看到了的ASI曙光！

全球首个AI科学家天团

为AI加速科学而生

前沿科学，正在从「稀缺」转向「丰饶」人类的知识正以指数级速度激增，但人的大脑容量却止步不前。

于是，新的发现被错过，潜在的联系无人察觉。

要推动科学进步，人类亟需一种能与数据量齐头并进、能够在整个人类知识记录中推理的智能体。

2023年，非营利组织FutureHouse成立，目标是打造一位能够加速创新的AI科学家。

「未来之家」的使命很简单：为每一位科研人员配备一位AI科学家，让跨领域的发现加速发生。

「未来之家」堪称全球第一AI科学家天团，，验证生化环材等科学领域的博士级想法是否靠谱；在2.5个月内，此平台找到了，让医学圈震撼。

本月初，FutureHouse的商业分支——爱迪生（Edison），现正将这项技术推向全球。

FutureHouse继续致力于推动基础生物学研究和教育普及，

而Edison（爱迪生）则将AI科学家技术扩展到全球的研究人员和各行各业中。

Edison由来自物理、生物、化学和人工智能等领域顶尖机构的科学家与工程师共同打造。

Edison将继续秉持FutureHouse的理念，为科研社区提供丰厚的免费服务，同时也为需要更高请求速率或额外功能的深度用户提供更多付费选项。

结构化世界模型

一次可读1500篇论文

Kosmos是继FutureHouse的上一代 AI科学家Robin之后的一次重大升级。

首先，Kosmos与许多AI工具完全不同。它不是聊天机器人，更像是一款「深度科研工具」：需要一定的学习和调试时间，尤其在提示词的设计上。

Edison团队强调，Kosmos并非闲聊式的「娱乐」工具，而是类似「试剂盒」的科研工具，适合用于真正高价值的研究任务。

所以，Kosmos的定价相当高，但学术用户可享免费额度。

作为下一代的AI科学家，Kosmos的核心突破，在于引入了结构化世界模型。

它能高效整合数百条智能体轨迹中提取的信息，在千万级token级别的文本中保持研究目标的一致性与连贯性。

此前诸如Robin等AI科学家，难以处理和整合大规模信息。受限于大语言模型的上下文长度，AI科学家在推理路径上「走不了多远」，难以完成复杂发现。

而一次完整的Kosmos 运行，能够阅读1500篇论文，执行42,000行分析代码，其能力远超我们已知的任何智能体。

正因如此，Kosmos相比上一代的Robin具备了更强大的分析能力。

据Beta测试用户反馈，Kosmos能在一天之内完成原本需要六个月才能完成的科研工作，而且结论的准确率高达 79.4%。

这个「六个月」的等效时长最初让人吃惊！

虽然Kosmos通常能生成相当于数月人力的科研成果，但它有时也会误入歧途——比如钻进一些统计显著但科学意义不大的方向。因此，把同一个研究目标运行多次 Kosmos，可以探索它可能采取的不同路径。

比OpenAI还早的科研AI实习生？

在Kosmos的开发过程中，最让人惊讶是：完整运行一次Kosmos，相当于博士生或博士后研究约六个月的工作量。

更有意思的是，开发团队发现这一「人类等效时间」随着运行深度线性增长。

这也成为目前首个与「科研任务复杂度」有关的推理时间scaling law。

起初，开发团队自己对这个结果也半信半疑，因此专门做了验证——

他们邀请Beta测试用户提供研究目标，并代为运行Kosmos。然后将结果发回给测试用户，并请他们估算：如果不借助 Kosmos，自己完成这一发现大约需要多长时间？

在7位科学家的反馈中，20步深度的Kosmos运行平均等效为6.14个月的研究工时。

他们对浅层运行也进行了同样的评估，并使用盲测手法进行控制，最终得出了技术报告中展示的那条scaling law曲线。

尽管「人类节省时间」的估算本身存在主观性，开发团队仍认为Kosmos所完成的工作包，确实可以等同于科学家数月的研究时间，原因主要有两点：

一是「独立复现」的客观对照验证。

在技术报告中，他们展示了Kosmos所做出的三项发现，实际上早已被人类科学家独立完成过，但在运行 Kosmos 时：

有两项仍未发表，
另一项虽已发布，但发布时间晚于Kosmos模型的训练数据截止日期，
他们还确保Kosmos无法访问这些文献或任何引用它们的研究。

即便如此，Kosmos依然在一次运行中成功复现了这些核心发现，而根据这些研究原作者的记录，人类完成这些发现通常需耗时约几个月。

当然，这一时间也存在不确定性（比如研究人员是否100%投入于该项目），但相较于基于主观问卷的「用户反馈法」，这种「已有成果对照法」显然更具客观性，进一步支持Kosmos工作成果的时间价值确实达到了「数月级」。

二是「计算工时」的独立估算模型。

他们还构建了一个更为量化的评估模型：假设科学家平均阅读一篇论文需时15分钟，执行一次完整的数据分析路径约耗时2小时（该假设与METR对当前 AI 智能体在软件工程任务中的时长估算一致）。

据此统计，Kosmos在一次平均运行中所阅读的论文数量与分析路径总和，换算为人类科研时间约为4.1个月（按每周40小时工作制计算）。

在OpenAI宣布「千亿美元股改」直播中，奥特曼直言OpenAI的「科学家愿景」：

到2026年9月，打造一位实习级别的研究助理AI；

到2028年，实现一位全自动的「真正AI科学家」。

如果现在Kosmos的自动研究就达到了「月级别时长」，是否是OpenAI的「实习级别的研究助理AI」？

如果Kosmos已经做到了，OpenAI当初2026年的目标，还有什么难度吗？

这也难怪奥特曼发推表示激动。

而且在技术报告中，Kosmos已经可以在生物、化学、材料科学等学科中发现新结果。

Kosmos报告中的所有结论均配有明确出处——要么引用原始文献，要么标明生成该结论的代码位置，确保整个推理链条完全可溯源。

经独立科学家验证，Kosmos报告中有79.4%的陈述是准确的。

7大新发现

拯救生化环材博士生！

技术报告详细列出了Kosmos做出的七项科研发现。

其中有三项，是对人类科学家此前成果的独立复现。

第一项发现：Kosmos利用代谢组学数据，复现了一篇尚未发表手稿中的核心结论——在低温条件下，小鼠大脑中核苷酸代谢是变化最显著的通路。

关键是，在Kosmos完成运行之后，这项研究的预印本才在BioRxiv发布。也就是说，AI和人类几乎同时独立发现了相同的结果。

第二项发现：Kosmos成功复现了一篇预印本中的关键观点，而这篇预印本的发布时间晚于其所用大语言模型（LLM）的训练数据截止日期，且Kosmos在运行时并未访问该文献。

这一发现出自材料科学领域，表明Kosmos 具备跨学科研究能力。

具体来说，Kosmos再现了这样一个结论：在热退火过程中，绝对湿度是决定钙钛矿太阳能电池效率的主导因素，并指出关键阈值为约60g/m³——一旦湿度超过这一值，器件将彻底失效。

第三项发现：Kosmos与Piazza等人研究报告中得出的结论一致——跨物种的神经元连接模式可由一套通用数学规则描述。

预印本链接：https://www.biorxiv.org/content/10.1101/2025.02.27.640551v1

需要说明的是，虽然Kosmos运行时未访问该研究，但该文预印本发布时间早于其所使用模型的训练数据截止日期，无法完全排除其可能在训练中接触过。

除了上述「复现性发现」，Kosmos还独立作出四项原创的科学贡献。

第四项发现：Kosmos结合公开的GWAS（全基因组关联分析）与pQTL（蛋白质数量性状位点）数据，进行孟德尔随机化分析，提供了统计学证据支持以下结论：血液中超氧化物歧化酶2（SOD2）浓度升高可能因果性地降低心肌 T1时间，并减少心肌纤维化风险。

尽管该机制在小鼠中已有研究，但这一发现进一步证实了其在人类中的潜在意义。

第五项发现：Kosmos基于多组学和统计遗传学公开数据，提出了一个全新的分子机制，解释某一单核苷酸多态性（SNP）如何可能降低2型糖尿病的患病风险。

第六项发现：Kosmos创新性地设计了一种新型分析方法，利用阿尔茨海默病（AD）患者的蛋白质组数据，推演出导致神经元中Tau蛋白积聚的分子事件序列。

第七项发现，具备明确的临床相关性。

在「衰老过程中神经元易损性」这一开放性课题中，Kosmos对年轻与年老小鼠的单细胞核转录组数据进行了大规模、无偏探索，发现内嗅皮层神经元（AD中最早出现Tau蛋白积累的区域）随年龄增长，其flippase（翻转酶）基因表达水平显著下降。

该下降可能导致磷脂酰丝氨酸暴露于细胞膜表面，向小胶质细胞释放「吃掉我」的信号，从而诱发免疫吞噬反应，导致神经元退化。

更关键的是，在另一组人类AD患者的单细胞RNA测序数据中验证了这一发现。在Braak病理阶段II的样本中，内嗅皮层上颗粒层神经元中的flippase表达量明显低于Braak 0阶段（即尚未出现病理变化的阶段），与Tau病变首次出现的时间点完全吻合。

从独立复现到原创发现，Kosmos标志着AI科研能力进入可验证、可复用的新阶段。

自动化科学正在形成，科研模式正迎来结构性变化。

参考资料：

https://edisonscientific.com/articles/announcing-kosmos

试用 OpenAI 人工智能 AI AI工具 4 测试体验评论

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。

浏览(20) 点赞(0) 收藏(0)

0条评论

珍惜第一个评论，它能得到比较好的回应。

游客

登录后再评论

鸟过留鸣，人过留评。
和谐社区，和谐点评。

AI半天顶博士6个月，奥特曼太激动！生化圈巨震

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

AI半天顶博士6个月，奥特曼太激动！生化圈巨震

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。