OpenAI ChatGPT 解锁 AI 填表技能：图像识别、语音输入和自动补全

2026-05-23 发布浏览298次点赞0次收藏0次

5 月 23 日消息，OpenAI 今天（5 月 23 日）发布公告，宣布 ChatGPT 解锁新技能，用户上传表单后，可直接用语音或文字说明填写内容，系统会识别表单字段、自动补全信息。

在最新演示中，用户上传一份健身会员表单后，只需口头说明姓名、地址和健身目标，ChatGPT 便能识别表单内容并自动填写。整个过程不是逐项手动录入资料，更像与助手对话。

在演示过程中，ChatGPT 成功串联图像理解、语音交互和内容生成整套工作流，支持一边读取上传图片中的表单字段，一边接收语音指令，并依据上下文生成填写内容。表单完成后，系统还能继续生成相关图片。

OpenAI ChatGPT 解锁 AI 填表技能：图像识别、语音输入和自动补全

当前输出主要是静态图片，而不是可直接编辑的 PDF（便携式文档格式）或交互式文档，因此部分场景仍需人工二次转录。与此同时，上传文件必须足够清晰，否则提取和填写可能出错。

附上相关截图如下：

OpenAI ChatGPT 解锁 AI 填表技能：图像识别、语音输入和自动补全

ChatGPT OpenAI AI GPT

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！