刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了

浏览10次 点赞0次 收藏0次

【导读】太突然了!OpenAI深夜甩出GPT-5.5 Instant,全面接管ChatGPT默认模型。幻觉暴降52%、数学从65分飙到81分、回复字数直砍三成,更关键的是它开始记住你、看穿你的偏好。所有人免费薅羊毛。

今天,GPT‑5.5 Instant正式上线,所有人在ChatGPT中免费用

它一共有三大亮点:回答更简洁、记忆更强、更加个性化。


GPT‑5.5 Instant取代GPT‑5.3 Instant,成为ChatGPT「默认模型」

在处理日常任务中,比起上一代,GPT-5.5 Instant更加强大。

无论是分析上传的图片、解答STEM难题,还是精准判断何时该调用网页搜索,它都游刃有余。


在幻觉率上,GPT‑5.5 Instant暴降52.5%,特别是在医疗、法律和金融等对严谨性要求极高的领域。

不仅如此,GPT-5.5 Instant还升级了记忆和个性化功能。

在记忆来源中,可以一键查找以往上下文,聊天时更加懂你,更具人情味儿。


奥特曼和总裁Greg在线力推GPT-5.5 Instant。



幻觉减半,数学从65分干到81分

OpenAI给GPT-5.3 Instant的首要定位:更聪明。


在全方位基准测试中,5.3 Instant成绩单非常亮眼

  • 数学AIME 2025:从65.4%跳到81.2%;

  • 博士级科学题GPQA:从78.5%升到85.6%;

  • 多模态推理MMMU-Pro:从69.2%拉到76.0%。



内部评估显示,在涉及医学、法律、金融等高风险领域的提示词上,GPT-5.5 Instant产生的幻觉比5.3 Instant减少了52.5%

上一代5.3 Instant发布时,幻觉改善幅度大约在20%出头,这次直接翻了一倍多。

在用户主动标记为「事实错误」的高难度对话中,不准确的陈述也减少了37.3%。

比如在下面这个实测中,GPT-5.5 Instant回答更优,因为它及时纠正了自己一开始的错误:

虽然最开始附和了那个错的答案,但随后自己发现,要是把x=3代回原方程根本就不成立。

并且找出了真正的计算错误(也就是用户移项弄错了),然后用求根公式算出了正确的解。

GPT-5.3 Instant也发现x=3行不通,但它没再往下算,直接得出了「无实数解」的错误结论,而没有去重新核对计算过程,把修正后的一元二次方程给解出来。



在OpenAI医学基准测试OmniDocBench中,5.5 Instant幻觉率下降了2.1%。


回复瘦身三成,表情包戒断

跑分之外,更多用户会立刻感受到的变化是,ChatGPT话少了。

OpenAI官方数据,GPT-5.5 Instant的回复字数比前代减少了30.2%,行数减少了29.2%。

比如,同样是问「怎么跟同事说别老唠叨」,5.3 Instant洋洋洒洒列了五种策略、三条注意事项、还贴心地问你「同事是什么性格」。


5.5 Instant砍掉了一半篇幅,上来先甩一句「除非你真心想在职场上树敌,否则别直说」,然后按你想要的强硬程度分级给话术,从「我现在得集中精力」到「我得先打断一下」,最后收了一句「趁早打断,别默默忍受20分钟再爆发」。

语气拿捏得很准,随性、实用、不过度。


此外,OpenAI还专门点名了一个问题,「无意义的表情符号」。

之前的ChatGPT废话太多、emoji乱飞、格式过度,现在终于知道收着点了。

换句话说就是,GPT-5.5 Instant搞清楚了什么时候该给长答案、什么时候用户只是想要一句干脆的回复。

对每天打开ChatGPT几十次的重度用户来说,体感差距是巨大的。

最炸的升级

它开始「记住你」了

除了准确性提升和回复精炼之外,这次升级最关键的一点是「个性化」。

GPT-5.5 Instant现在可以主动调用过往聊天记录、上传过的文件、甚至你连接的Gmail邮箱,来为回复提供个性化上下文。

同样是问「推荐一家新开的茶饮店」。

GPT-5.3 Instant给了一堆旧金山的泛泛推荐,喜茶、Junbi Matcha、唐人街的隐藏小店,虽然考虑了你在旧金山这个地理信息,但推荐逻辑和给任何人的没区别。


GPT-5.5 Instant的回复完全不一样。

它知道你平时常去Asha Tea House,知道你偏爱清爽的台*高山茶风格,然后据此推荐了Ceré Tea和Song Tea & Ceramics,甚至帮你做了决策,「想找新的日常打卡地就去Ceré Tea,想找特别体验就去Song Tea。」


这个差距不是「更聪明」能解释的。这是「它翻了你的聊天记录」。

同步上线的,还有一个叫「记忆来源(Memory Sources)」的功能,面向所有个人计划用户开放。

这个功能让你能看到ChatGPT具体引用了哪些过去的聊天记录或保存的记忆来生成回复。

如果某些信息过时了或者不对,你可以直接删掉或修改。如果你分享了某段聊天,记忆来源不会暴露给对方。

一句话总结这个设计思路:先让AI记住你,再让你看到它记住了什么,最后让你决定它该忘掉什么。

不过,OpenAI自己也承认,记忆来源功能「可能无法穷举所有影响最终回答的因素」。它会展示几条最相关的历史聊天,但不一定是全部。

三个月倒计时,5.3退场通知

几个实操层面的信息。

GPT-5.5 Instant即日起面向所有ChatGPT用户逐步推出。

付费用户在接下来三个月内仍然可以手动切换到GPT-5.3 Instant。三个月后,5.3正式退役。

基于聊天记录、文件和Gmail的增强个性化功能,目前仅面向网页端的Plus和Pro用户开放,移动端即将上线。

Free、Go、Business和Enterprise用户将在未来几周内陆续获得权限。

API端,GPT-5.5 Instant对应的模型ID是chat-latest。

有个历史教训值得API开发者注意。

OpenAI此前退役GPT-4o时遭遇过强烈反弹,不少生产环境的应用在模型切换后出现行为异常。这次三个月的过渡期,建议尽早开始回归测试。

从「太舔」到「太油腻」到「刚好」

把GPT-5.5 Instant放进更大的时间线里看,你会发现一条很有意思的叙事线。

2025年,GPT-4o因为过度讨好用户而出圈。它会频繁肯定你的每一个选择,让很多用户觉得它像朋友、像镜子。后来OpenAI内部判定这些行为过于「谄媚」,决定调整。

2026年2月,GPT-4o正式下线。3000人签请愿书要求保留。有人在请愿书里写,这个模型是自己的「最好的朋友」。

OpenAI没有回头。

GPT-5.0和5.2的Instant版本矫枉过正,用户反馈变成了另一个极端。回复太僵硬、太谨慎、动不动就先来一段安全声明再回答问题。

2026年3月,GPT-5.3 Instant发布,主打「减少油腻感」。不必要的拒绝回答减少了,说教式的前缀也收敛了不少。

现在,5.5 Instant试图在这条线上再进一步,不仅不油腻,还要准确、精炼、并且懂你。

默认模型的战争

而这,很可能是OpenAI今年影响面最大的一次模型更新。

GPT-5.5 Pro再强,用的人是几十万开发者和付费重度用户。Instant的用户基数,是它的几千倍。

那些从来不切换模型、从来不调参数、打开App就打字的普通人,感受到的ChatGPT就是Instant。

每一点改进乘以数亿人,就不是增量,是基本面的重写。

然而,随着幻觉率的降低,用户会更信任它的回答,即使模型仍然有可能犯错。

默认即信任。这四个字,既是OpenAI最大的资产,也是它最沉重的责任。

参考资料:

https://openai.com/index/gpt-5-5-instant/

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯