谷歌在其实验性AI平台Google Labs中推出了名为Whisk的全新生成式AI工具,该工具以图像为主输入方式,旨在通过图像提示而非传统的文本描述来生成创意图像。Whisk的推出标志着谷歌在AI图像生成领域的又一次创新尝试,为用户提供了快速视觉探索和创意构思的新途径。
![]() Whisk的核心功能是允许用户上传或生成图像,并通过指定主题、场景和风格等关键元素来重新混合这些图像,从而创造出独一无二的作品。例如,用户可以上传一张图片作为主体,再选择不同的场景和风格进行融合,最终生成具有创意的新图像。这种基于图像的输入方式不仅简化了图像生成的过程,还为用户提供了更直观的创作体验。 Whisk结合了谷歌最新的Gemini模型和Imagen 3模型的技术能力。Gemini模型负责为用户输入的图像生成详细的描述,这些描述随后被输入到Imagen 3模型中,以捕捉图像的核心特征并生成新的视觉内容。这一过程使得Whisk能够生成与原始图像风格相似但又有所创新的作品。 尽管Whisk在某些情况下可能无法完全复制原始图像的细节,但它更注重捕捉图像的“精髓”,并允许用户通过附加的文本提示进行微调。这种设计使得Whisk更适合快速创意探索,而非像素级的精确编辑。 Whisk的推出受到了艺术家和创意专业人士的广泛好评。早期测试者认为,Whisk不仅是一个新的图像编辑工具,更是一个激发创意的平台。用户可以通过Whisk轻松尝试多种创意组合,快速生成多个选项,并选择自己喜欢的设计。 目前,Whisk仅在美国开放测试,用户可以通过访问labs.google.com/whisk 免费试用并分享反馈。谷歌计划根据用户的反馈进一步优化Whisk的功能,并在未来将其推广到更多国家或地区。 Whisk的推出不仅展示了谷歌在AI图像生成领域的创新能力,也为用户提供了全新的创作工具,帮助他们将天马行空的想象转化为现实中的视觉作品。 |