Cursor 一夜翻车:300 万代码写浏览器被打假,全网群嘲 AI 泔水

2026-01-17 发布 · 浏览12次 · 点赞0次 · 收藏0次

GPT-5.2 连肝 7 天造出浏览器的事,刚刚被打假了!一位开发者发文证实,Cursor 这个项目就是个「AI 泔水」,代码根本无法编译。Cursor 这次可太心急了。

前几天,整个 AI 圈都被 Cursor 的一则重磅消息给炸晕了。

事情是这样的:Cursor 声称,他们让 GPT-5.2 驱动的编码智能体连续运行了整整 7 天,也就是 168 个小时。

结果,这群 AI 智能体居然从零开始,写出了一个包含 300 万行代码、功能堪比 Chrome 的浏览器!

这听起来实在是太诱人了 —— 随着 Token 变得像水电一样廉价,AI 可以无限期地自我迭代,直到完成目标。无论是操作系统、办公软件还是游戏引擎,只要算力足够,AI 似乎都能给你「肝」出来。

然而,就在大家还没从震惊中缓过神来的时候,技术社区的「列文虎克」们出手了。他们仔细扒了扒 Cursor 开源的这个项目代码,结果发现了一个惊天大瓜 ——

这个所谓的「AI 浏览器」,其实连最基本的编译都通过不了!

what表情包-livekong来悟空

在一篇技术博客中,作者犀利地指出:

Cursor 口中所谓的「突破性进展」,本质上就是一堆缺乏工程逻辑的「AI 泔水」(AI Slop)。他们所做的,其实在宣传上玩了一手漂亮的「障眼法」,让所有人都以为这个项目真的跑通了。但实际上,这根本就是一堆无法运行的废代码。

博客地址:https://embedding-shapes.github.io/ cursor-implied-success-without-evidence/

GPT-5.2 七天肝出一个浏览器,是假的?

接下来,让我们来仔细看看开发者社区的这篇「打假」文章,是如何抽丝剥茧地发现 Cursor 这一波宣传的不实之处的。

首先,作者分析了一下 Cursor 具体都干了什么。

在 1 月 14 日,他们发布了一篇题为「Scaling long-running autonomous coding」的博文。

官方博客:https://cursor.com/ blog / scaling-agents

在这篇文章中,他们聊到了让「编码智能体自主运行数周」的实验,其明确目标是:

了解我们能将智能体编码的边界推进到什么程度,从而完成那些通常需要人类团队花费数月时间才能完成的项目。

然后,Cursor 的研究者讨论了尝试过的一些方法,分析了失败原因,以及该如何解决问题。

终于,他们找到了某种方案,它「解决了我们大部分的协调问题,并让我们在不依赖单一智能体的情况下,将规模扩展到非常大的项目」。

最终,这种方案实现了一种惊人的结果 ——

为了测试这个系统,我们给它定了一个雄心勃勃的目标:从零开始构建一个网络浏览器。这些智能体运行了将近一周,在 1,000 个文件中编写了超过 100 万行代码。

同时,他们在 GitHub 上放出了源代码。

GitHub 项目:https://github.com/ wilsonzlin / fastrender

这就奇怪了,所以这个任务,智能体成功完成了吗?

如果你没有被这句话成功带节奏,就会发现这个扑朔迷离之处 ——

他们声称「尽管代码库规模很大,新的智能体仍然可以理解它并取得有意义的进展」,以及「数百个 worker 并发运行,推送到同一个分支,冲突极少」,但他们从未真正说明这个尝试成功没有。

它真的能跑起来吗?你自己能运行这个浏览器吗?我们不知道,而且他们从未明确说过。

所谓的演示,只是一个短短 8 秒的「视频」:

在下方,他们写道:

虽然这看起来像是一个简单的截图,但从零开始构建一个浏览器是非常困难的。总之,从头到尾,他们从未斩钉截铁地承认过:这个浏览器是可运行且功能正常的!

打开一看:全是报错,跑都跑不起来

总之,如果只是看 README、Demo 截图,甚至是几段宣传性质的描述,这个项目好像真的很厉害。

可是,只要你真正 clone 仓库、运行一次 cargo build 或 cargo check,问题就会立刻暴露出来

error: could not compile 'fastrender' (lib) due to 34 previous errors; 94 warnings emitted

可以说,这个代码库距离一个「可工作的浏览器」还差得远了,甚至可以说,它从未被真正成功构建过!

文章作者发现了如下多个证据。

首先,GitHub Actions 在 main 分支上的多次近期运行全部失败,其中甚至包含 workflow 文件本身的错误。

另外,如果尝试独立构建,就会发现报了数十个编译器错误,最近的 PR 还都是在 CI 挂掉的情况下合并的。

更夸张的是,如果翻看 Git 的历史记录,从最近的提交往回追溯 100 个提交,简直找不到哪怕一个能干净编译的提交。

也就是说,这个仓库从诞生起,就从未处于「能跑」的状态。

https://gist.github.com/embedding-shapes/f5d096dd10be44ff82b6e5ccdaf00b29

现在我们根本无法确定,Cursor 的研究者在这个代码库上释放的「智能体」实际上干了什么,但它们似乎从未运行过 cargo build,更不用说 cargo check 了。

因为这两个命令都会报出几十个错误和大约 100 个警告。如果真的去修这些错误,报错数量肯定还会爆炸式增长。

目前在他们的仓库中,有一个关于此的未解决 GitHub issue。

issue 地址:https://github.com/ wilsonzlin / fastrender / issues/98

结论已经非常明显:这根本就不是真正的工程代码,而是典型的「AI Slop」(AI 泔水)。

这种低质量的代码堆砌,或许在形式上模仿了某种功能,但其背后缺乏连贯的工程意图,实际上连最基本的编译都无法通过。

在 Cursor 的演示中,他们大谈下一步的宏伟计划,却对「如何运行」、「预期效果」或「工作原理」只字不提。

而且,除了丢出一个代码仓库链接,Cursor 没有提供任何可复现的演示,也没有给出任何已知可用的版本标签(tag / release / commit)来验证那些光鲜亮丽的截图。

无论初衷如何,Cursor 的博文试图营造出一个「功能正常的原型」的假象,却遗漏了工程界最看重的基本诚实 —— 可复现性

他们确实没有明确声称「它能正常运行」,这让他们在字面上避开了「撒谎」的指控,但这种误导性极强。

到目前为止,他们唯一证明的只是:

AI 智能体可以疯狂输出数百万个 Token,但最终生成的代码依然是一堆无法运行的废料。

一个「浏览器实验」不需要对标 Chrome,但它至少应该有一个合理的最低标准:

在受支持的工具链上编译通过,并渲染一个简单的 HTML 文件。

很遗憾,Cursor 的文章和公开构建均未达到这一及格线。

GitHub 被冲,开发者怒了

这种把「半成品」包装成「里程碑」的行为,彻底激怒了开发者社区。在 GitHub 的 Issue 区,愤怒的留言刷了屏:

  • 我也试了,根本跑不起来。

  • 代码逻辑风马牛不相及,CI 全红也敢合并?我们是在对着截图膜拜吗?

  • 既然功能是假的,开源这个仓库有什么意义?为了证明 AI 能制造电子垃圾吗?

还有人一针见血地指出了这种「泡沫工程」的本质:反正投资人看不懂代码,甚至不知道 GitHub 是什么。只要是电脑自动写的代码,业绩曲线就能蹭蹭涨,机器一响,黄金万两……

而且在 Hacker News 上,也有近 200 条讨论,将这一项目的底裤彻底扒了下来。

网友 pavlov 指出,所谓的「从零开始」和「定制 JS 虚拟机」纯属忽悠。

看一眼依赖列表(html5ever, cssparser, rquickjs)就能发现,这东西本质上就是 Mozilla 开发的 Servo 引擎的「套壳」版。

网友 brabel 更是哭笑不得:

这帮人居然觉得声称「从零手搓」是步好棋?

程序员上手第一件事就是查依赖,一眼就能看出是在调包。

唯一的解释是,他们赌没人会认真核实,毕竟大多数人只会看个标题就欢呼。

Anthropic 太强势,Cursor 被逼急了?

虽然 Cursor 从未直说「这已准备好投入生产」,但他们却用「从零构建」和「有意义的进展」这种宏大叙事,配合精心挑选的截图,成功制造了「实验成功」的假象。

他们最接近成功的表述是:

数百个智能体可以在同一个代码库上协同工作数周,取得真正的进展。

但这句惊人的声明,没有任何证据支持。

没有可工作的 commit,没有构建说明,没有演示。

大家并不指望它成为下一个 Chrome,但如果你声称你已经构建了一个浏览器,它至少应该能够演示被编译 + 加载一个基本的 HTML 文件,不然就是纯纯地愚弄大众了。

其实 Cursor 这个 AI 自动编程一周的消息一出来,就让人觉得有点奇怪。

最近一个月,全球 AI 圈的高光时刻,基本都在 Claude Code 身上。

Claude Code 之父 Boris Cherny 的 X 发帖,基本上都会引起社区的震动。比如他说自己过去 30 天内没写一行代码,对 Claude Code 代码库的贡献,全部由 Claude Code 自己完成。

谷歌首席工程师 Jaana Dogan 所说,Claude Code 一小时内,就完成了整个团队整整一年才做完的任务。

前特斯拉 AI 总监 Andrej Karpathy 更是直言:硅谷正在经历一场九级地震,自己从未感觉如此落后……

在这种形势下,一篇「编码智能体运行一周,自己写出一个浏览器」的叙事,是多么顺应潮流,多么吸引眼球啊。

也难怪 Cursor 工程师尝试这个脑洞后,没怎么多想就着急地发出来,这才被火眼金睛的开发者们冲了。

AI 程序员超进化:「开挂」工程师

这次「浏览器闹剧」虽然惨烈,但也意外地揭示了 AI 编程的真实进化路径。

Hyperbolic 联创兼 CTO Yuchen Jin 指出了 Cursor 演示中隐含的关键教训:单纯堆砌数量是行不通的。

让一堆智能体平级相处、自我协调,只会带来混乱。

· 角色分工必须明确:需要有规划者(Planner)、执行者(Executor)和评审员(Reviewer)。

· 模型差异化:GPT-5.2 更适合长程规划任务;而 Opus 4.5 容易「早退」和偷懒。

· 组织架构:增加太多「管理层」智能体反而会拖累效率,这与人类公司的「大企业病」如出一辙。

HyperWriteAI 的 CEO Matt Shumer 也在复现过程中发现,只要运行框架和能力支持到位,明确分工的 AI 智能体集群确实能产生实质性进展。

然而,更深层的进化不仅仅发生在 AI 身上,更发生在人类工程师身上。

在硅谷,一个新的流行词正在取代老派的「10 倍工程师」,那就是 ——「Cracked Engineer」(开挂工程师)

这个词,是指那些一个人能顶一个团队的顶级开发者。

Cursor 这次的翻车,恰恰是因为它 Karpathy 所说的「氛围编程」陷阱 ——

只享受 AI 疯狂生成代码的爽感,却完全抛弃了工程严谨性。

由此诞生的,只能是那种如果不修补就无法运行的「Cursor 搬运工」式废料。

真正的「开挂工程师」是这一现象的反面。他们疯狂使用 AI,但绝不盲信 AI。

他们拥有深厚的技术底蕴,能够一眼揪出 AI 生成的逻辑漏洞,能够清理像这次浏览器项目中出现的「电子泔水」。

正如初创公司 Intology 的创始人所言:

少数几个专注且懂行的人加上 AI,能比过去 15 个不用 AI 的人干得更多。

未来的软件开发,不会是数千个无人监管的 AI 智能体像无头苍蝇一样乱撞(然后造出一个编译不过的浏览器);而是由一名「开挂工程师」,带领着数十个 AI Agent,精准、高效地构建出真正的产品。

而这些「开挂」的程序员,也将会淘汰那些只会「假装在编程」的人。

参考资料:

  • https://embedding-shapes.github.io/cursor-implied-success-without-evidence/

  • https://www.theinformation.com/articles/forget-vibe-coders-cracked-engineers-rage-tech?rc=epv9gi

Cursor 一夜翻车:300 万代码写浏览器被打假,全网群嘲 AI 泔水 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。