OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5

浏览33次 点赞0次 收藏0次

6 月 27 日消息,OpenAI 公司今天(6 月 27 日)正式发布 GPT-5.6 系列模型,不过暂未全面开放,应美国政*要求,现阶段仅向少数“可信合作伙伴”提供预览权限。

在模型方面,援引博文介绍,OpenAI 本次共发布 3 档模型:

  • 旗舰版 Sol:每 100 万 Tokens 输入 5 美元(现汇率约合 34 元人民币),每 100 万 Tokens 输出 30 美元(现汇率约合 204.3 元人民币)

  • 均衡版 Terra:每 100 万 Tokens 输入 2.5 美元(现汇率约合 17 元人民币),每 100 万 Tokens 输出 15 美元(现汇率约合 102.1 元人民币)

  • 主打速度和成本的 Luna:每 100 万 Tokens 输入 1 美元(现汇率约合 6.8 元人民币),每 100 万 Tokens 输出 6 美元(现汇率约合 40.9 元人民币)

此外 OpenAI 表示优化提示词缓存机制,在调用过程中出现重复提示词,会更加便宜、更加可以预测。

在模型能力方面,OpenAI 称 GPT-5.6 Sol 为该公司最强模型,并引入新的 Max 推理强度,以及借助子智能体加速复杂任务的 Ultra 模式。

在编程场景中,Sol 在 Terminal-Bench 2.1 上刷新最佳成绩,标准模式下得分 88.8%,超过 Claude Mythos 5(88.0%),在开启 Ultra 模式后更是达到 91.9%。

在生物学 GeneBench v1 测试任务中,该模型消耗更少 token,不过性能表现比 GPT-5.5 更强。

网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等长链路安全任务上提升明显。在 ExploitBench 中,它用约 1/3 输出 token 即可达到与 Mythos Preview 相近的表现。

安全设计上,OpenAI 表示 GPT-5.6 Sol、Terra 和 Luna 采用分层防护体系,包括模型内置拒答、生成过程实时分类器、账户级风险审查、差异化访问、监控和执法机制。对于高风险情况,系统可暂停生成,并交由更大推理模型复核;若判定违规,内容会在展示前被拦截。

在开放进度方面,OpenAI 表示计划在未来几周内公开上线 GPT-5.6 Sol、Terra 和 Luna。

OpenAI 还计划于 7 月在 Cerebras 上线 GPT-5.6 Sol,速度最高可达每秒 750 token,初期仅向部分客户开放。

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯