“车展实拍”视频走红,场景、人物、对话声音全由谷歌 Veo 模型生成
5 月 23 日消息,几十年来,大型车展对汽车厂商、中外记者,以及所有热爱马力、机械和时尚的人而言,都是不可错过的年度大事。但近年在海外,情况大变 —— 多家车展人流锐减、展会纷纷停办,公众兴趣明显降温。
据外媒 Carscoops 今日报道,与此同时,一段近期在网上热传的视频却显示,“某处”正在举行一场盛大的车展,观众热情高涨。但问题是,这场车展根本不存在。
视频开头就已点明真相:“欢迎来到一个不存在的车展。”一名“主持人”出场如是说。“我们来听听大家的看法。”随后是一分多钟的“采访”片段,镜头中“观众”畅谈展会体验与展车感想。
有人兴奋不已,有人担忧安全,还有人只是单纯享受参展的喜悦。但所有人、所有声音乃至画面中的车与背景,其实全是 AI 生成。发布这段视频的是名为 László Gaál 的创作者,他在 X 平台上传了这段视频并表示:“在你开口之前我就先说了:这一切都是 AI。”
他补充道,每一段视频都是通过“单一的提示词(single text prompts)”生成,随后再剪辑整合。具体来看,他使用了谷歌 Veo3 完成制作。
当然,视频也非毫无破绽。例如夹克上的字母常常拼错,AI 最难处理的“手”也仍有缺陷。有段镜头中,一位男子的手几乎是反向的,另一处画面则出现手穿过衣袋的情形。尽管如此,整体完成度依旧令人赞叹,就连背景的汽车也足以以假乱真。
据此前报道,在今年的 I/O 开发者大会上,谷歌发布新一代视频生成模型 Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。
相关阅读:
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。

游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。