谷歌深夜双发！最便宜Nano Banana来了

2026-07-01 发布浏览17次点赞0次收藏0次

【导读】谷歌深夜狂甩王炸：4秒极速出图，成本仅需两毛！新模型Nano Banana 2 Lite联手视频神器Omni Flash，彻底打通图生视频流水线，引爆AI创作效率革命。

昨晚，Google DeepMind悄然上线两枚重磅杀器。

Nano Banana 2 Lite（gemini-3.1-flash-lite-image），堪称史上最快最便宜的文生图模型，4秒生图，每张1K分辨率高清图成本低至0.24元。

Gemini Omni Flash则是面向开发者的高质量视频生成模型，支持图、文、视频混合输入，带来史诗级的「对话式视频编辑」体验！

不过，要说谷歌这次真正的必杀技，是把这两个模型通过Interactions API强强串联。

Lite高速生图，Omni Flash把图动画化，配合Interactions API最多可连续叠三次编辑。

这样，一条「文字➡️生图➡️生视频」的创作流水线，就这么被谷歌打通了！

性价比之王Nano Banana：

4秒一张图，两毛多成本

先看主角之一：Nano Banana 2 Lite（gemini-3.1-flash-lite-image）。

这是Nano Banana家族中速度最快、成本最优的图像模型。

速度有多快？4秒出图。

你输入一段文字描述，它能在4秒内生成一张1024x1024的图像。

对于需要快速迭代创意、频繁调整画面的开发者来说，这个速度可以即时反馈——不再需要盯着进度条发呆，创作节奏可以快得像聊天一样自然。

而它的成本，也是低至每1K张图像仅需0.034美元，换算成人民币，大约两毛多一张。

所以，我们可以大规模批量生成图像，而不用担心预算爆炸。谷歌官方直接给出了硬核答复：非但不掉队，反而建议初代用户直接升级替换！

关键性能指标上，Lite版本在三个方面保持了竞争力：

提示词遵循：你说什么，它画什么，不会理解偏差

角色一致性：多张图中同一角色保持稳定的形象特征，非常适合AI漫画或者连载IP

图中文字清晰度：生成的图像里，文字可读、不模糊，「让AI在图里写字」这个行业难题直接被攻克

这意味着，即便它主打速度和成本，该有的基本功一样没落下。

将 Nano Banana 2 和 2 Lite 与竞争对手的 AI 图像模型进行性能基准测试，评估生成/编辑质量（Elo 分数）、处理延迟和每张 1K 分辨率图像的成本之间的权衡

理解Nano Banana家族：

四款模型，各有所长

谷歌这次把Nano Banana家族做了一个清晰的定位分层，方便开发者按需选择：

Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)：速度狂魔，专为近乎实时的超大批量工作流设计，追求极致低延迟。

Nano Banana 2 (Gemini 3.1 Flash Image)：六边形战士，通用型主力军，在较低延迟下提供极高质量，性价比平衡的最佳选择。

Nano Banana Pro (Gemini 3 Pro Image)：专业大师，专为复杂的专业级使用场景优化，提供最强大的控制力和高级推理能力，适合对精度要求远大于速度的任务。

Nano Banana (初代，Gemini 2.5 Flash Image)：旧时代的残党传统型号，官方建议：别用了，赶紧升级到2 Lite版享受降维打击！

目前，Nano Banana 2 Lite 已经全面登陆 Google AI Studio、Gemini API 以及 Gemini 企业代理平台。

更令人惊喜的是，它实际上迅速渗透到谷歌的 C 端全家桶中，包括搜索 AI 模式、Gemini App、NotebookLM、Google Photos 甚至 Google Ads。

所以，普通用户很快也能在日常产品里体验到4秒出图的速度感！

一场效率的狂欢，已经拉开帷幕。

测评机构Arena.ai，也已经给出评分——得分高达1251分！

另一个研究机构也在提前体验后给出高分。

并且，已经有网友给出实测。

另一位网友测试后表示，从速度上来说，Nano Banana 2 Lite让人印象深刻。

Gemini Omni Flash：首度向开发者开放的AI视频生成模型

如果说Nano Banana 2 Lite是高效的制图工厂，那么这次首度向开发者开放的Gemini Omni Flash，就是引爆好莱坞的魔法引擎！

这款模型在今年Google I/O大会上首次亮相，当时就引发了不小的关注。如今，它正式向开发者开放——通过Gemini API和Google AI Studio即可调用。

定价与 Veo 3.1 Fast 持平，视频输出0.10美元/秒，它带来的绝不仅仅是生成视频，而是颠覆传统的视频编辑方式。

Omni Flas的核心能力是：高质量视频生成 + 对话式编辑。

支持以下输入组合：

纯文本 → 生成视频

文本 + 图像 → 生成视频

文本 + 图像 + 视频 → 生成视频

你可以在对话中用自然语言反复修改、调整视频内容——就像跟一个视频剪辑师聊天一样。

目前，它仅支持10秒视频生成，更长的时长将在后续版本推出。

插入视频

Omni Flash的四大亮点：

① 对话式视频编辑

Omni Flash 最大的亮点，就在于可以用自然语言就能修改视频——「把背景换成黄昏」「让主角看向左边」「加快动作节奏」，不需要复杂的剪辑软件操作。

这就是大模型多模态推理能力对传统视频剪辑的降维打击。

② 多模态参考输入

Omni Flash 支持真正的「大杂烩」式输入。你可以同时丢给它一段文字、一张图片、甚至一段短视频，生成符合要求的视频。

同时输入文本、图像、视频三种模态的信息，模型就能更理解你的创作意图。

③ 真实世界知识的视频大脑

很多视频生成大模型容易出现反人类物理常识的「诡异画面」（比如人长出六根手指、水往高处流）。但Omni Flash背后依靠的是Gemini庞大的知识库，精通历史、生物学和叙事逻辑！

生成「中世纪骑士冲锋」，它会调用历史知识；生成细胞分裂，它会遵循生物学常识。

④ 文字与动作同步

通过简单的提示词，就能让文字、图形与视频中的动作产生联动——比如在画面左上角显示NEW字样，同时镜头拉近。

同时，谷歌官方公开了一些限制，方便开发者避坑：

-仅支持10秒视频生成

-暂不支持上传音频参考

-场景扩展功能暂未开放

-视频参考输入虽已在API中支持，但当前版本处理尚不完善

-场景切换或平移时的角色一致性存在一定局限

但是，作为一个定价仅0.10美元/秒的生产力工具，Omni Flash已经展现出可怕的商业潜力。

有人实测了替换视频中角色的功能。

真正的杀招：两者串联，一条龙创作

单独拿出一个模型，或许只是工具的升级。

然而谷歌的真正的意图是，让两者串联使用！

官方推荐的玩法是，借助 Interactions API，将 Nano Banana 2 Lite 和 Gemini Omni Flash 串联起来，打造出「秒级生图 + 顺滑生视频」的多轮交互体验！

在这个工作流中，先用Nano Banana 2 Lite 快速生成一张图像；随后，把这张图作为参考，传给Gemini Omni Flash，生成一段高质量视频。

更牛的是，得益于 Interactions API，系统会保持会话历史和上下文记忆。

这意味着，用户可以在生成的视频基础上，继续用自然语言进行最多连续三次的迭代编辑！

为了让开发者立刻领略这套组合拳的威力，谷歌一口气开源了三个极具启发性的Demo应用，每一个都精准踩在了不同行业的痛点上

Demo 1：Anywhere（一秒穿越全世界）

应用场景：社交媒体、旅游营销、个人娱乐

上传一张自拍或照片，Lite会把你传送到数十个地标场景中，比如巴黎埃菲尔铁塔下、埃及金字塔旁，或是富士山的樱花林。

点击任意一张生成图，Omni Flash就会把它变成一段动态视频，一段专属于你的「环游世界」微电影就此诞生！

Demo 2：Space Lift（空间焕新魔术师）

应用场景：室内设计、房地产中介、家居电商

室内设计师和装修业主们的终极神器来了！

上传一张房间照片，Lite会自动生成多种装修风格的概念图。

选定心仪的风格后，点击视频按钮，Omni Flash会把静态设计图变成一段沉浸式漫游视频，让你在装修前就能「走进」未来的家。

Demo 3：Omni Product Studio（电商爆款制造机）

应用场景：淘宝/亚马逊卖家、广告营销、自媒体矩阵

对于中小电商卖家来说，拍视频是一个高成本的门槛，但这个Demo将彻底打破规则。

把Lite生成的静态产品图，交给Omni Flash转化为电影级电商展示视频。

这三个Demo只是冰山一角。当「廉价极速生图」与「高智商视频编辑」碰撞在一起，未来我们能看到怎样的爆款应用，全凭开发者的想象力！

另外，这次谷歌给两类产品全面集成了SynthID水印技术。

是一种数字水印，人眼看不见，但可以通过工具检测。

用户可以通过Gemini应用、Chrome浏览器或Search来验证一段内容是否由AI生成。这有助于保护创作者权益，也让AI生成内容在网络上更加透明。

总之，谷歌DeepMind这次的双发，看似是两个独立模型的上线，实则是一条完整创作流水线的落成，让每个人都有能力把脑海中的创意变成视觉内容。

AI创作的下一站，正在加速到来。

参考资料：

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

https://x.com/GoogleDeepMind/status/2071988044878516466

编辑：Aeneas 马可

大模型代理性能 Google 亚马逊 C 体验测试 AI mod AI创作谷歌 models Go Chrome

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

谷歌深夜双发！最便宜Nano Banana来了

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。