谷歌正式发布了名为“Nano Banana”的图像生成与编辑模型,其官方名称为“Gemini 2.5 Flash Image”。该模型于2025年6月正式上线,并在随后的几个月内迅速获得广泛关注。该模型在图像生成与编辑方面表现出色,具备SOTA(当前最优)的图像生成与编辑能力,具有惊人的角色一致性、闪电般的速度以及高效的处理能力。
在性能方面,Nano Banana 在多项基准测试中表现优异,超越了OpenAI的GPT-4o Image等模型。其生成一张图片的成本约为0.039美元(约合人民币0.3元),远低于OpenAI的同类模型。此外,该模型支持多种使用方式,包括通过Google AI Studio、Gemini API、Vertex AI等平台进行访问。
Nano Banana 在图像编辑领域展现出显著优势,能够实现自然语言驱动的图像编辑,支持角色一致性、多图融合、风格迁移等功能,甚至可以实现“一句话”生成图像或修改图像内容。该模型的推出被认为可能重塑图像编辑领域,降低专业图像处理的技术门槛。