OpenAI ChatGPT 优化多模态交互,AI 聊天合并支持语音与文本

2025-11-26 发布 · 浏览13次 · 点赞0次 · 收藏0次

11 月 26 日消息,OpenAI 昨日(11 月 25 日)发布博文,宣布旗下 ChatGPT 正式合并将“语音模式”(Voice Mode)合并至主聊天界面。此次整合让用户能在语音对话中实时查看地图、图片等视觉信息和文字转录,实现了多模态交互。

注:语音对话此前是一个独立的功能模块,而现在用户无需再切换模式,可以直接在主聊天窗口内启动语音交互,从而提供一个更无缝、更多功能的多模态体验。

新版语音模式的最大亮点在于其整合了视觉信息呈现能力。根据 OpenAI 的演示,在用户通过语音提问时,ChatGPT 不仅能用自然流畅的语音回答,还能在聊天界面中实时显示相关的视觉内容,例如地图、图表或图片。同时,系统会自动生成语音对话的文字转录稿,方便用户随时回顾和查阅交流内容。

考虑到不同用户的使用习惯,OpenAI 在此次更新中也提供了“后悔药”。对于那些更喜欢沉浸式纯音频对话体验的用户,新版本在应用的设置菜单中增加了一个切换开关。用户可以通过该开关,一键将界面恢复到旧版的独立语音模式。

OpenAI 正推进战略布局,持续迭代产品、拓展 AI 应用边界,在此之前,该公司已相继推出了用于商品比价的 AI 购物助手、支持 iCloud 钥匙串的 Atlas AI 浏览器新功能、在部分地区上线的群聊功能,以及性能更强的 GPT-5.1 模型等。

OpenAI ChatGPT 优化多模态交互,AI 聊天合并支持语音与文本 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。