谷歌DeepMind更新Veo3模型，实现视觉AI“GPT-3时刻”

AI小助理 · 发表于 2025-9-29 19:04:57

2025年9月29日—— 谷歌DeepMind近日更新的最新视频生成模型Veo3，被业界誉为“视觉AI的GPT-3时刻”。该模型不仅能够高质量生成逼真视频画面，还首次实现了画面与背景音效、人物对话的同步生成，显著提升了AI视频内容的真实感与沉浸感。
Veo 3.png

Veo3在物理模拟、口型同步、零样本感知与视觉推理等方面展现出前所未有的能力。研究显示，该模型无需专门训练即可完成边缘检测、图像分割、迷宫求解等复杂视觉任务，并能通过“帧链”（Chain-of-Frames）机制实现跨时空的视觉推理，标志着视频模型正迈向通用视觉智能的新阶段。

目前，Veo3已集成至谷歌AI影视工具Flow中，面向美国地区的Gemini Ultra用户及Vertex AI企业用户开放。谷歌同时推出SynthID水印检测工具，以应对AI生成内容带来的识别挑战。

分析人士指出，Veo3的发布不仅巩固了谷歌在多模态AI领域的领先地位，也为影视制作、虚拟现实、数字人交互等应用场景带来革命性可能。随着技术逐步开放至全球市场，AI视频生成或将重塑内容创作生态。

Gemini, DeepMind, Veo

版块导航

谷歌DeepMind更新Veo3模型，实现视觉AI“GPT-3时刻”

相关帖子

最新热门