斯坦福华人研究火了:45分钟让你的论文变身AI智能体!
【导读】斯坦福大学研究人员提出了Paper2Agent,将静态论文转化为可交互的AI智能体,让学术成果可以直接被「调用」,为科研知识传播开辟了新模式,并为构建AI共研生态奠定基础。
把论文,变成会动的智能体?
这样论文就不再是静态的PDF文件,研究成果不仅可以「开口说话」,还能主动帮你把事做了。
传统科研论文的阅读门槛很高,往往需要读者投入大量精力去理解论文内容。
为了解决这一难题,斯坦福大学研究人员提出了Paper2Agent,让论文一键变身AI智能体。
这样一来,学术成果可以直接被「调用」,而不用再经历从阅读、理解再到最终应用的漫长转化过程。
https://arxiv.org/abs/2509.06917
Paper2Agent是一个可将科研论文转化为「研究助手型」AI智能体的自动化框架。
而且,它还可以实现多智能体协同作业。
研究人员利用Paper2Agent成功构建了AlphaGenome智能体,用于解释基因组变异,还做了Scanpy与TISSUE智能体,用于开展单细胞和空间转录组分析。
结果显示,Paper2Agent不仅能复现原论文结果,也能准确处理新的用户请求。
Paper2Agent提供了将科研论文转化为智能体的自动化工作流。
它的核心思路,是把论文封装成一个MCP服务器。
转化流程共分为三步:
识别论文的关键贡献(数据集、方法、模型或工作流)。
将这些关键贡献封装为MCP服务器,并明确其输入、输出与使用说明。
将MCP服务器连接至LLM驱动的智能体,实现自然语言查询与自主执行。
Paper2Agent概述
Paper2Agent生成的论文智能体具有以下特点:
交互便捷:用户可用自然语言执行复杂科学分析,无需编程基础;
可靠易复现:每个论文智能体所使用的工具均会通过示例数据集,与论文代码库中报告的结果与图表进行验证,并锁定配置确保可复现性。
Paper2Agent基于MCP生态系统,构建了两个关键组件:
Paper2MCP:从论文及其代码库中提取信息,用以构建远程MCP服务器;
智能体层:将每个MCP服务器封装为上下文提供者,从而生成针对特定论文的AI智能体(见图1A)。
每个MCP服务器包括三个核心组件:
MCP工具:可执行函数,封装了论文中的方法学创新。这些工具运行在预配置环境中,确保无缝执行。
MCP资源:静态资源仓库,包含论文文本、关联代码库及补充材料,如数据集、表格、图像等。
MCP提示词:精炼的指令模板,引导AI智能体完成从论文文本或代码库中提取的多步骤科学工作流。
研究人员借助Claude Code完成了对Paper2Agent的对接与调用。
整个流程,从识别论文相关的代码库开始(图1B)。
随后,调用两个专用智能体和一个测试智能体。
环境智能体,用于配置所需的软件环境;
提取智能体,用于将核心方法转化为可执行工具。
测试智能体,通过自动测试不断优化代码与环境,直到结果与参考输出一致。
完成验证后,工具与环境将被打包为MCP Python文件,可部署至Hugging Face等远程服务器。
最后,通过将MCP服务器与AI智能体连接,生成一个功能完整的论文智能体,用户就可以通过自然语言访问该论文的方法。
研究人员通过三个案例,来展示Paper2Agent如何将不同类型的科研论文转化为可靠的交互式AI智能体。
AlphaGenome Agent
基因组数据解读
AlphaGenome是一款AI模型,用于预测人类DNA中单核苷酸变异(SNV)或突变对多种基因调控过程的影响。
Paper2Agent将AlphaGenome论文转化为可交互的智能体,使用户能够自动解读基因组数据。
在无人干预的情况下,Paper2Agent在一台普通笔记本上,仅用约3小时便生成了22个AlphaGenome MCP工具,全面覆盖论文中的方法创新。
这些MCP工具可复用于未来应用,它们涵盖了单变异与批量变异评分、序列级预测、组织本体探索以及丰富的可视化功能。
研究人员进一步对AlphaGenome智能体进行了基准测试,评估其在数值与图表输出上的表现,是否可以媲美人类专家手动配置与运行代码的结果(图2C)。
结果显示AlphaGenome智能体在这些查询中均实现100%准确率,所有结果与原报告完全一致。
研究人员还演示了AlphaGenome智能体在GWAS位点解读中的应用能力,并验证了其是否能复现原论文的分析过程。
以使用AlphaGenome来解释「chr1:109274968:G>T与低密度脂蛋白胆固醇(LDL-C)相关的原因」为例(图2D),智能体构建了解决此任务的详细计划,并最终输出一份综合解读报告。
在这一过程中,研究人员还发现了Paper2Agent的重要优势:
只需一个提示词,用户即可基于独立的模型证据重新评估已发表的研究结论。
TISSUE智能体
不确定性感知的单细胞空间转录组分析
TISSUE是一篇近期发表的研究论文,提出了一种用于不确定性感知的单细胞空间转录组分析的新方法(见图3A)。
研究人员通过Paper2Agent自动生成了TISSUE智能体。
这一案例,适用于这样一个常见科研场景:
研究人员希望将新方法应用于自己的数据,但由于时间有限,很难深入理解代码库、配置运行环境,或掌握方法的特性与输入要求。
TISSUE智能体可以提供问答支持,帮助用户准备输入数据、理解方法功能,从而解决了这一难题。
对于TISSUE MCP服务器,Paper2Agent共生成了6个工具,涵盖空间基因表达预测、预测区间构建,以及面向不确定性的下游分析等(见图3A)。
值得注意的是,TISSUE智能体还可作为交互式指南使用(见图3B)。
研究人员评估了TISSUE智能体在构建空间转录组预测的预测区间方面的能力,发现智能体无需用户额外干预,便自动执行了整个TISSUE流程(见图3C)。
这说明智能体不仅能使用单个工具,还能独立完成从数据加载、预处理、插补到不确定性估计的整套分析流程。
最后,研究人员还展示了如何通过将TISSUE论文中的「数据可用性」部分转化为结构化注册表,来进一步利用MCP资源(见图3D)。
用户可以通过查询筛选出特定物种的数据集,而无需手动浏览多个数据仓库。
Scanpy智能体
用于单细胞数据预处理
Scanpy是一个广泛使用、功能强大的单细胞转录组分析工具包。
在实际应用中,研究者往往只用到Scanpy功能的一部分。
Paper2Agent不仅支持将完整方法转化为工具,也能抽取其中的关键部分,以构建更针对性的智能体,聚焦于某一特定分析任务。
研究人员聚焦于Scanpy最常见的使用场景:单细胞数据的预处理与聚类。
Paper2Agent用了约45分钟,便在一台笔记本电脑上生成了7个工具(见图4A)。
通过这些工具,用户可以通过自然语言提示让Scanpy智能体对其单细胞数据进行质控处理。
许多用户偏好从头到尾的预处理与聚类流程,即工具按既定顺序依次执行。
这类分析流程不仅常见于单细胞研究,也普遍存在于科学领域的其他复杂数据处理中。
然而,执行这些流程通常很具挑战性:AI智能体要么必须「预先知道」正确的执行顺序,要么依赖用户输入结构化良好的提示词明确指定步骤。
为解决这个问题,研究人员使用MCP提示词来规范流程。
MCP提示词提供了一种标准化方法,这些提示词由Paper2Agent直接从论文和代码库中自动推理得出,无需人工整理。
这种机制显著提高了复杂分析任务的可复现性与易用性。
例如,Scanpy智能体的MCP提示词就完整编码了一套标准的预处理与聚类流程,包括质控、标准化、特征选择、降维、图构建、聚类和细胞类型注释,并确保其按正确顺序执行(见图4B)。
研究人员使用三个公开单细胞数据集对Scanpy智能体的性能进行了评估,结果显示智能体输出的结果与人类研究者处理同样数据时的结果一致(图4C)。
这表明基于MCP提示词驱动的Scanpy智能体,能够流畅运行完整流程,使先进的单细胞分析更加易用和可复现。
作者简介
Jiacheng Miao
Jiacheng Miao现为斯坦福大学博士后,与Jonathan Pritchard和James Zou合作。在这份工作中,Jiacheng Miao与其他研究者共同提出了Paper2Agent。
2025年,Jiacheng Miao在威斯康星大学麦迪逊分校获得博士学位,导师是Qiongshi Lu和Lauren Schmitz。2019年,Jiacheng Miao在南京大学数学系完成了本科学业。
Jiacheng Miao的研究方向是构建可靠的AI co-scientists以加速科学发现,并使用Perturb-seq解释与疾病相关的基因。
2025年,Jiacheng Miao获得了NOMIS & Science青年探索者奖。
参考资料:
https://arxiv.org/abs/2509.06917
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。

游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。