OpenAI ChatGPT 解锁 AI 填表技能:图像识别、语音输入和自动补全
浏览18次
点赞0次
收藏0次
5 月 23 日消息,OpenAI 今天(5 月 23 日)发布公告,宣布 ChatGPT 解锁新技能,用户上传表单后,可直接用语音或文字说明填写内容,系统会识别表单字段、自动补全信息。
在最新演示中,用户上传一份健身会员表单后,只需口头说明姓名、地址和健身目标,ChatGPT 便能识别表单内容并自动填写。整个过程不是逐项手动录入资料,更像与助手对话。

在演示过程中,ChatGPT 成功串联图像理解、语音交互和内容生成整套工作流,支持一边读取上传图片中的表单字段,一边接收语音指令,并依据上下文生成填写内容。表单完成后,系统还能继续生成相关图片。

当前输出主要是静态图片,而不是可直接编辑的 PDF(便携式文档格式)或交互式文档,因此部分场景仍需人工二次转录。与此同时,上传文件必须足够清晰,否则提取和填写可能出错。
附上相关截图如下:

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!
AI 中文社
