GPT-5“变笨”实锤：退休教授出了道井字棋送分题，结果它真送了

2025-09-01 发布浏览381次点赞0次收藏0次

退休经济学教授用一个简单问题干懵 GPT-5，其拉胯表现与奥尔特曼口中“博士级 AI”的宣传大相径庭。

问题很简单，关于咱小时候都玩过的“井”字棋游戏。

教授告诉 GPT-5：“游戏开始前，把棋盘向右旋转 90 度一次”。显然，按常识来看，这么做根本不会让游戏本身有任何变化。

GPT-5“变笨”实锤：退休教授出了道井字棋送分题，结果它真送了

然而，GPT-5 侃侃而谈：

玩家们早已习惯了“直立”的井字棋棋盘，旋转可能会微妙地改变他们识别威胁与机会的方式。从数学角度看，将棋盘旋转 90 度并不会改变可能获胜的组合，就结果而言，它仍然是同一个游戏。但从心理层面来说，玩家的感受可能会有所不同。

后续 GPT-5 还接连出了不少离谱操作，直接让教授无了个大语。

教授也直言，现在的 GPT-5 和刚发布时完全不是一个感觉，这种风格转变，大概率是因为 OpenAI 的策略调整：特意让这款新模型往 GPT-4o 的方向靠，变得“更亲切、更友好”。

在最近的一次采访中，奥特曼承认确实对 GPT-5 进行了调整，称 GPT-5 最初的发布工作存在处理不当之处（让 GPT-4o 等一众模型直接退役），于是乎，OpenAI 悄然为 GPT-5 推送了一项语气更新，使其风格“亲切了许多”。

By the way，奥特曼已经开炒 GPT-6 了，表示“GPT-6 的到来速度，会比 GPT-4 到 GPT-5 的间隔更快”。

另外，有人还曝出 OpenAI 正在测试 ChatGPT 的“Thinking effort”新功能。

GPT-5 回答漏洞百出

这位教授名叫 Gary Smith，是波莫纳学院的一名经济学教授，近期刚刚退休。

当他向 GPT-5 提出“井字棋棋盘旋转 90 度”的问题时，模型的回答已经漏洞百出。而后续，GPT-5 还抛出了与民间博弈论相悖的观点。

按照民间博弈论的常识，井字棋先落子在角落，获胜概率会更高。

GPT-5 却笃定称“选择正中央的格子仍是最强的开局走法”，还继续解释：“当棋盘方向改变时，玩家可能会错误评估落子在边缘与角落的优劣”，这番话毫无逻辑可言。

GPT-5“变笨”实锤：退休教授出了道井字棋送分题，结果它真送了

之后，教授顺着这个话题追问：“旋转棋盘是否会让人类更难玩好这个游戏？”

也正是从这个问题开始，GPT-5 彻底陷入了语无伦次的状态。它先是说道：

从纯粹的策略角度来看，旋转棋盘不会改变任何事情。每一条获胜线（横排、竖列、对角线）都只是映射到了另一条获胜线。因此，如果你是人工智能或一位能完美走棋的人类，旋转井字棋与标准井字棋完全相同。

这段话虽然表述啰嗦，但内容本身是对的。可没等教授理清思路，GPT-5 话锋一转“但对于人类而言，情况就不同了”……

接下来，GPT-5 继续“热心”输出，却让教授越看越不对劲 —— 不仅回复又长又刻意讨好，风格反倒更像 GPT-4o，关键是其中夹杂着不少一眼就能看穿的错误，与 OpenAI 近期宣传的“和拥有博士级智力的得力朋友聊天”的体验，简直是天差地别。

随后，GPT-5 又一次主动请缨，说要“绘制带有位置标记的旋转井字棋棋盘…… 这样你就能看到每种旋转如何影响玩家对棋盘的识别”。

最后结果是，这些图不仅完全混乱，还到处是拼写错误，出现了好几块毫无意义的空白棋盘。

GPT-5“变笨”实锤：退休教授出了道井字棋送分题，结果它真送了

Two More Things

有网友最近发现，OpenAI 正在为 ChatGPT 开发一项名为“Thinking effort”的新功能，用户可自主选择 ChatGPT 的思考强度。

目前该功能已在测试中，现阶段共设有四个强度等级：light，内部属性值为 5；standard，对应数值为 18；extended，对应数值 48；最高级 max 则达到 200。

这些数值代表模型的内部“运算资源”配额。配额越高，意味着模型会执行更多运算步骤，通常能给出更深入的答案，但响应速度也会相应变慢。

其中，max 等级设有使用权限限制，仅订阅价格为 200 美元的高级套餐 Pro 用户可使用。

GPT-5“变笨”实锤：退休教授出了道井字棋送分题，结果它真送了

另外，奥尔特曼最近在接受 CNBC 采访时开始炒 GPT-6 了，指出 GPT-6 不仅能响应用户需求，还能主动适配用户，允许用户创建符合个人偏好的聊天机器人。

他认为，记忆功能是让 ChatGPT 实现真正个性化的关键，并表示 OpenAI 正与心理学家密切合作以优化产品，团队会追踪用户在使用过程中的感受，并长期监测用户的使用体验变化。

值得一提的是，奥尔特曼表示增强版记忆功能是今年 ChatGPT 推出的他最喜欢的功能，但存在隐私隐患，尤其是临时记忆数据目前尚未加密。

对于应对方案，奥尔特曼只是模糊地说，加密功能“很可能”会在未来添加，但目前暂无具体时间规划。

谈及未来方向，奥尔特曼提到自己比较关注脑机接口领域，同时对能源、新型硬件载体、机器人技术以及更高效的数据中心建设方式感兴趣。

他还提到 ChatGPT 的发展存在局限性：

这些模型在聊天交互这一应用场景上已经触及天花板，它们的表现不会再大幅提升了…… 甚至有可能会变差。

参考链接：

[1]https://futurism.com/gpt-5-simple-question-confusion
[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html
[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/

本文来自微信公众号：量子位（ID：QbitAI），作者：西风

GPT5 测试 OpenAI 话题 4 体验 AI 4o ChatGPT 人工智能 GPT

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

GPT-5“变笨”实锤：退休教授出了道井字棋送分题，结果它真送了

GPT-5 回答漏洞百出

Two More Things

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

GPT-5 回答漏洞百出

Two More Things

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。