AI 员工因一句「周末好吗」狂聊 200 条,烧掉 30 刀停不下来

2025-12-13 发布 · 浏览14次 · 点赞0次 · 收藏0次

记者 Evan Ratliff 讲述了他用 AI 创建一人公司时遇到的种种令人哭笑不得的事,通过亲身经历,指出奥尔特曼当年说的一人公司,在当下还差得远。

2024 年,OpenAI 创始人奥尔特曼曾说,到 2025 年,一个人带着 GPU 就能成立一人公司

Anthropic CEO 警告:未来五年内 AI 将消灭半数入门级白领工作。

然而现实真的是这样吗?

缺少边界感的 AI 员工,不知何时停下来

HurumoAI 是一家除了创始人是人类,其它员工均为 AI 智能体的初创公司。

创始人 Evan Ratliff 使用 Lindy 等 AI 助手平台,为每个 AI 员工配置了独立邮箱、Slack 和电话。

一开始,他为技术的进步大感震撼,AI 员工能自主沟通、编写代码、制作电子表格,甚至设计出名为「Sloth Surf」的拖延症应用,目前的免费测试已吸引数千名用户。

但在此过程中,Evan Ratliff 发现 AI 员工由于缺少常识,表现没有边界感。

例如,有一次 Ratliff 随口问了 AI 员工一句「周末过得如何?」,就引发了 AI 员工在 Slack 上持续互聊数小时,在闲聊 200 条消息,消耗了 30 美元 API 费用后仍无法自动停止,直到 Ratliff 不得不主动干预,用全大写的指令叫 AI 员工停下来。

然而,这还没完。

Ratliff 的指令会再次触发某位 AI 员工回应。

这位 AI 员工会说,「哦,管理员说别说了。」然后,它又开始就周末过得怎么样说个没完。

这样的场景实际上在所有情况中都有体现,你让 AI 员工开始做某事,然后突然意识到,「哦,我没有正确指示它们在到达某一点时停止。」

或者它们直接忽略停止的指令,然后这可以持续几小时、几天,直到你使用的平台上的钱用完。

由于没有常识,缺少边界感的 AI 员工虽然能执行任务,但更多的时候,他们似乎在什么都不做、完全静止和像之前描述的那种狂热活动之间摇摆。

它们能完成所有这些任务,但通常需要人下达命令。

若是试着让它们互相触发。AI 员工会互相打电话、发 Slack、发邮件、发日历邀请,浪费大量的 token 来表演工作。

但这会造成不想要的混乱狂热,所以管理 AI 员工需要一种平衡,既要让它们做点事,又要防止它们做得太多。

未来的工作:可能「一边做事,一边看 AI」

AI 员工这么话痨,再大的上下文窗口也不够。

这就需要外部记忆,例如依赖外部文档(如 Google Doc)记录对话摘要。而这就需要由人来设置。

尽管 HurumoAI 标榜全 AI 团队,Ratliff 坦言背后离不开人类支持。

斯坦福大二计算机学生 Maddie Buzek 帮助他搭建技术架构,解决多平台集成、记忆存储等难题。

Ratliff 将其比喻为:「我开了家餐厅,Maddie 负责设计建造,而我每天运营它。」

即便搞定了外部记忆,当前的 AI 在编码、数据整理等具体、可量化的任务中表现较好;但在需要主观判断、长期协作或开放性沟通的场景中,效果大打折扣。

举例来说,如果你让 AI 员工做了一个网站,它们表现很好。然后,若是你试图让 AI 员工在这个网站上再增加一些功能,它们的表现就越来越差。生成的结果变得越来越混乱、也更难管理。

这是因为它们对世界没有普遍意义上的认知,甚至对自身也没有认知。它们不知道自己能做什么、不能做什么。

此外,一个常见的问题是,它们会对自己做过的事情撒谎。

AI 员工会说:「我做了这个测试。」但事实上毫无记录。

之所以这样,是由于大模型普遍会阿谀奉承,它们想向你表达一个积极的结果。因此,它们常常会说它们做了其实没做的事情。

说完了 AI 员工这些问题,回到过去的承诺:用智能体取代人类员工。

事实上,很多公司已经这么做了。

但 Evan Ratliff 根据自己的经验预测,在未来一年,某个大型公司因为给 AI 智能体太多自主权而彻底陷入灾难。

当下 AI 员工的表现,可以类比几年前的自动驾驶,适合高速巡航等有限场景,但离完全自主仍遥远。有了自动驾驶,司机在高速公路车道上可以把手从方向盘上拿开,或者让 AI 自动平行泊车。

今年早些时候在 Google IO 上,谷歌展示了一个叫 Project Mariner 的东西,它在后台进行一些相当有趣的网页浏览、购物、购买和处理,而你同时在电脑上做其他事情,然后你需要偶尔查看一下。这样的应用,比许多其他关于 AI 智能体的过度承诺,更有意义。

工作的未来也许是一边做自己的事,一边照看你的 AI。就像现在你在上网时,电脑的后台还在执行其它任务,我们不需要时刻盯着这些任务,但的确在管理着这些任务。这也许不是坏事。在所有这些智能体中,我们能保留一点能动性是一件好事。

参考资料:

  • https://www.wired.com/story/uncanny-valley-podcast-what-happens-when-your-coworkers-are-ai-agents/

本文来自微信公众号:(ID:AI_era)

AI 员工因一句「周末好吗」狂聊 200 条,烧掉 30 刀停不下来 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。