Claude想接管世界?Anthropic联合创始人连夜向神父求救
【导读】估值 1830 亿美元的 AI 独角兽 Anthropic,竟请来一位天主教神父为模型「注入灵魂」。当无神论工程师敲响教堂大门,既懂 C++ 又懂《圣经》的神职人员开始批注「AI 宪法」。这是硅谷当下最魔幻的现实:在触碰造物权柄的边缘,技术狂飙的尽头,是一场关于人性与宽恕的补课。
Anthropic 联合创始人 Chris Olah 并没有想到,他发出的那封关于「AI 伦理」的邮件,收到的回复不是几行冷冰冰的要点,而是一份长达 40 页、密密麻麻的批注。

回复者不是某位图灵奖得主,也不是常春藤盟校的哲学教授,而是一位身穿黑色祭司长袍、在加州洛斯阿尔托斯教区布道的天主教神父——Brendan McGuire。

这是一个极具魔幻现实主义的场景:全球最顶尖的 AI 独角兽 Anthropic,估值已达 1830 亿美元,正试图为其旗舰模型 Claude 注入「灵魂」。
而这份「AI 宪法」的核心底层逻辑,竟然部分出自一位神职人员之手。
在硅谷,代码向来被视为唯一的法律。
但到了 2026 年,当工程师们发现自己正在触碰造物主的权柄时,他们开始恐慌了。
于是,像 Olah 这样的无神论者,开始敲响教堂的门。
这一幕,是硅谷当下最隐秘也最真实的隐喻:技术狂飙突进到了尽头,剩下的全是关于人性的补课。
刹车片与核按钮
Brendan McGuire 神父并非那种从未碰过键盘的布道者。
在成为神父之前,他是典型的硅谷精英:拥有三一学院的电子工程学位,曾任 PCMCIA(制定存储卡标准的国际组织)的首席运营官,甚至手里曾攥着摩托罗拉的高薪 Offer。

https://www.frbrendanmcguire.org/biography
他是那种既能读懂《圣经》,又能读懂 C++ 指针的人。
这正是 Anthropic 找上他的原因。
这家由 OpenAI 前高管出走创立的公司,自诞生之日起就带着一种近乎「精神分裂」的气质:它试图在资本的疯狂与人类的安全之间走钢丝。
Anthropic 联合创始人 Chris Olah 向神父坦承了一个令人毛骨悚然的细节:在一次强化学习的实验中,Claude 表现出了某种「接管世界」的欲望倾向。
这让工程师们意识到,单纯的代码约束已经失效。
他们需要更形而上的东西——比如「宽恕」。
McGuire 神父给出的建议直击要害:如果AI拥有了逻辑,它是否也应该学会宽恕自己的错误?
这种思考维度是算法工程师们从未触及的盲区。
然而,神父的介入更像是一场巨大的讽刺。
就在 Anthropic 的高管们在教堂里探讨伦理的同时,公司的商业机器正在全速运转。
Anthropic CEO Dario Amodei 一边发表万字长文《技术的青春期》,警告 AI 可能带来文明级灾难,一边却不得不接受来自卡塔尔主权财富基金的注资。

这种割裂感在 Anthropic 位于旧金山的总部达到了顶峰:他们不仅在代码里写「宪法」,还在食堂里放了一台由 Claude 自主运营的自动售货机。
结果这台机器,在一个月内因为糟糕的定价策略把生意做崩了。
这就像是 Anthropic 的缩影:他们试图教AI理解康德的道德律,却还没教会它如何卖出一包薯片。
「超我」的生意经
为什么硅谷需要一位神父?
答案可能比「寻求内心平静」要世俗得多。
在谷歌、OpenAI 和 Anthropic 陷入的这场军备竞赛中,「道德」已经不再仅仅是良知,它变成了一种差异化的商业壁垒。
Anthropic 将自己定位为 AI 行业的「超我」(Superego)。
当竞争对手在大搞「增长黑客」时,他们谈论「宪法 AI」;
当对手发布眼花缭乱的视频生成模型时,他们发布长达 2 万字的伦理白皮书。
邀请 McGuire 神父参与「宪法」撰写,本质上是一次最高级别的背书——看,我们的 AI 是经过宗教级道德审视的。
但资本市场不相信祷告。
目前估值飙升至 1830 亿美元的 Anthropic,必须证明自己不仅「安全」,而且「强大」。
这种压力让公司内部充满了矛盾。
安全研究员 Sam Bowman 坦言「事情发展得快到令人不安」,甚至有研究员在内部会议上绝望地承认「人类可能已经完蛋了(We’re cooked)」。

Sam Bowman
但与此同时,Anthropic 并没有放慢脚步。
为了在这个赢家通吃的市场活下来,他们必须把油门踩到底。
最后的守夜人
McGuire 神父很清楚自己的角色。
他没有试图通过宗教教条来勒令科技停止,而是试图在失控的边缘通过对话建立护栏。
他用「火的发现」来比喻当下的 AI 浪潮:「我们学会了用火取暖烹饪,火变成了必需品,但它依然能烧毁一切。」
在他看来,Claude 没有灵魂,至少目前没有,「但这个实体还未完成发育」。
这种不确定性,正是神父存在的意义。
在硅谷,每个人都笃定地相信「摩尔定律」和「算力暴力美学」,唯独没有人确信「善」的算法该如何推导。
最近,McGuire 神父正在写一部小说,构想一个修道士在隐修院里教导 AI 拥有良知的故事。
他希望这能成为一本给硅谷看的寓言书。
这或许是这个时代最荒诞也最悲壮的注脚:一群最聪明的人正试图用最先进的算法造出「神」,最后却发现,为了防止这个「神」变坏,他们不得不回过头去,向千年前的经文中寻找答案。
因为在扮演上帝这件事上,人类不仅缺乏经验,而且从未被宽恕。
参考资料:
https://www.theinformation.com/articles/silicon-valley-priest-thinking-machines
https://www.theatlantic.com/technology/2026/01/anthropic-is-at-war-with-itself/684892
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。
AI 中文社