谷歌深夜双发!最便宜Nano Banana来了
【导读】谷歌深夜狂甩王炸:4秒极速出图,成本仅需两毛!新模型Nano Banana 2 Lite联手视频神器Omni Flash,彻底打通图生视频流水线,引爆AI创作效率革命。
昨晚,Google DeepMind悄然上线两枚重磅杀器。

Nano Banana 2 Lite(gemini-3.1-flash-lite-image),堪称史上最快最便宜的文生图模型,4秒生图,每张1K分辨率高清图成本低至0.24元。
Gemini Omni Flash则是面向开发者的高质量视频生成模型,支持图、文、视频混合输入,带来史诗级的「对话式视频编辑」体验!
不过,要说谷歌这次真正的必杀技,是把这两个模型通过Interactions API强强串联。
Lite高速生图,Omni Flash把图动画化,配合Interactions API最多可连续叠三次编辑。
这样,一条「文字➡️生图➡️生视频」的创作流水线,就这么被谷歌打通了!
性价比之王Nano Banana:
4秒一张图,两毛多成本
先看主角之一:Nano Banana 2 Lite(gemini-3.1-flash-lite-image) 。
这是Nano Banana家族中速度最快、成本最优的图像模型。
速度有多快?4秒出图。

你输入一段文字描述,它能在4秒内生成一张1024x1024的图像。

对于需要快速迭代创意、频繁调整画面的开发者来说,这个速度可以即时反馈——不再需要盯着进度条发呆,创作节奏可以快得像聊天一样自然。
而它的成本,也是低至每1K张图像仅需0.034美元,换算成人民币,大约两毛多一张。

所以,我们可以大规模批量生成图像,而不用担心预算爆炸。谷歌官方直接给出了硬核答复:非但不掉队,反而建议初代用户直接升级替换!
关键性能指标上,Lite版本在三个方面保持了竞争力:
提示词遵循:你说什么,它画什么,不会理解偏差
角色一致性:多张图中同一角色保持稳定的形象特征,非常适合AI漫画或者连载IP
图中文字清晰度:生成的图像里,文字可读、不模糊,「让AI在图里写字」这个行业难题直接被攻克
这意味着,即便它主打速度和成本,该有的基本功一样没落下。


将 Nano Banana 2 和 2 Lite 与竞争对手的 AI 图像模型进行性能基准测试,评估生成/编辑质量(Elo 分数)、处理延迟和每张 1K 分辨率图像的成本之间的权衡
理解Nano Banana家族:
四款模型,各有所长
谷歌这次把Nano Banana家族做了一个清晰的定位分层,方便开发者按需选择:

Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image):速度狂魔,专为近乎实时的超大批量工作流设计,追求极致低延迟。
Nano Banana 2 (Gemini 3.1 Flash Image):六边形战士,通用型主力军,在较低延迟下提供极高质量,性价比平衡的最佳选择。
Nano Banana Pro (Gemini 3 Pro Image):专业大师,专为复杂的专业级使用场景优化,提供最强大的控制力和高级推理能力,适合对精度要求远大于速度的任务。
Nano Banana (初代,Gemini 2.5 Flash Image):旧时代的残党传统型号,官方建议:别用了,赶紧升级到2 Lite版享受降维打击!
目前,Nano Banana 2 Lite 已经全面登陆 Google AI Studio、Gemini API 以及 Gemini 企业代理平台。
更令人惊喜的是,它实际上迅速渗透到谷歌的 C 端全家桶中,包括搜索 AI 模式、Gemini App、NotebookLM、Google Photos 甚至 Google Ads。
所以,普通用户很快也能在日常产品里体验到4秒出图的速度感!


一场效率的狂欢,已经拉开帷幕。
测评机构Arena.ai,也已经给出评分——得分高达1251分!


另一个研究机构也在提前体验后给出高分。

并且,已经有网友给出实测。


另一位网友测试后表示,从速度上来说,Nano Banana 2 Lite让人印象深刻。


Gemini Omni Flash:首度向开发者开放的AI视频生成模型
如果说Nano Banana 2 Lite是高效的制图工厂,那么这次首度向开发者开放的Gemini Omni Flash,就是引爆好莱坞的魔法引擎!


这款模型在今年Google I/O大会上首次亮相,当时就引发了不小的关注。如今,它正式向开发者开放——通过Gemini API和Google AI Studio即可调用。
定价与 Veo 3.1 Fast 持平,视频输出0.10美元/秒,它带来的绝不仅仅是生成视频,而是颠覆传统的视频编辑方式。
Omni Flas的核心能力是:高质量视频生成 + 对话式编辑。
支持以下输入组合:
纯文本 → 生成视频
文本 + 图像 → 生成视频
文本 + 图像 + 视频 → 生成视频
你可以在对话中用自然语言反复修改、调整视频内容——就像跟一个视频剪辑师聊天一样。
目前,它仅支持10秒视频生成,更长的时长将在后续版本推出。
插入视频
Omni Flash的四大亮点:
① 对话式视频编辑
Omni Flash 最大的亮点,就在于可以用自然语言就能修改视频——「把背景换成黄昏」「让主角看向左边」「加快动作节奏」,不需要复杂的剪辑软件操作。
这就是大模型多模态推理能力对传统视频剪辑的降维打击。
② 多模态参考输入
Omni Flash 支持真正的「大杂烩」式输入。你可以同时丢给它一段文字、一张图片、甚至一段短视频,生成符合要求的视频。
同时输入文本、图像、视频三种模态的信息,模型就能更理解你的创作意图。
③ 真实世界知识的视频大脑
很多视频生成大模型容易出现反人类物理常识的「诡异画面」(比如人长出六根手指、水往高处流)。但Omni Flash背后依靠的是Gemini庞大的知识库,精通历史、生物学和叙事逻辑!
生成「中世纪骑士冲锋」,它会调用历史知识;生成细胞分裂,它会遵循生物学常识。
④ 文字与动作同步
通过简单的提示词,就能让文字、图形与视频中的动作产生联动——比如在画面左上角显示NEW字样,同时镜头拉近。
同时,谷歌官方公开了一些限制,方便开发者避坑:
-仅支持10秒视频生成
-暂不支持上传音频参考
-场景扩展功能暂未开放
-视频参考输入虽已在API中支持,但当前版本处理尚不完善
-场景切换或平移时的角色一致性存在一定局限
但是,作为一个定价仅0.10美元/秒的生产力工具,Omni Flash已经展现出可怕的商业潜力。
有人实测了替换视频中角色的功能。

真正的杀招:两者串联,一条龙创作
单独拿出一个模型,或许只是工具的升级。
然而谷歌的真正的意图是,让两者串联使用!

官方推荐的玩法是,借助 Interactions API,将 Nano Banana 2 Lite 和 Gemini Omni Flash 串联起来,打造出「秒级生图 + 顺滑生视频」的多轮交互体验!
在这个工作流中,先用Nano Banana 2 Lite 快速生成一张图像;随后,把这张图作为参考,传给Gemini Omni Flash,生成一段高质量视频。
更牛的是,得益于 Interactions API,系统会保持会话历史和上下文记忆。
这意味着,用户可以在生成的视频基础上,继续用自然语言进行最多连续三次的迭代编辑!
为了让开发者立刻领略这套组合拳的威力,谷歌一口气开源了三个极具启发性的Demo应用,每一个都精准踩在了不同行业的痛点上
Demo 1:Anywhere(一秒穿越全世界)
应用场景:社交媒体、旅游营销、个人娱乐
上传一张自拍或照片,Lite会把你传送到数十个地标场景中,比如巴黎埃菲尔铁塔下、埃及金字塔旁,或是富士山的樱花林。
点击任意一张生成图,Omni Flash就会把它变成一段动态视频,一段专属于你的「环游世界」微电影就此诞生!
Demo 2:Space Lift(空间焕新魔术师)
应用场景:室内设计、房地产中介、家居电商
室内设计师和装修业主们的终极神器来了!
上传一张房间照片,Lite会自动生成多种装修风格的概念图。
选定心仪的风格后,点击视频按钮,Omni Flash会把静态设计图变成一段沉浸式漫游视频,让你在装修前就能「走进」未来的家。
Demo 3:Omni Product Studio(电商爆款制造机)
应用场景:淘宝/亚马逊卖家、广告营销、自媒体矩阵
对于中小电商卖家来说,拍视频是一个高成本的门槛,但这个Demo将彻底打破规则。
把Lite生成的静态产品图,交给Omni Flash转化为电影级电商展示视频。
这三个Demo只是冰山一角。当「廉价极速生图」与「高智商视频编辑」碰撞在一起,未来我们能看到怎样的爆款应用,全凭开发者的想象力!
另外,这次谷歌给两类产品全面集成了SynthID水印技术。
是一种数字水印,人眼看不见,但可以通过工具检测。
用户可以通过Gemini应用、Chrome浏览器或Search来验证一段内容是否由AI生成。这有助于保护创作者权益,也让AI生成内容在网络上更加透明。
总之,谷歌DeepMind这次的双发,看似是两个独立模型的上线,实则是一条完整创作流水线的落成,让每个人都有能力把脑海中的创意变成视觉内容。
AI创作的下一站,正在加速到来。
参考资料:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/
https://x.com/GoogleDeepMind/status/2071988044878516466
编辑:Aeneas 马可

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!
AI 中文社