DeepMind首席执行官Demis Hassabis表示，Google最终将结合其双子座和VEO AI模型

知识菜鸟

2025年04月11日 09:05发布

1387阅读

在最近的一次露面中，播客由LinkedIn共同创始人Reid Hoffman共同主持，Google DeepMind首席执行官Demis Hassabis表示，Google计划最终将其Gemini AI模型与其素养视频生成模型相结合，以改善前者对物理世界的理解。

“我们一直在建立我们的基础模型Gemini，从一开始就成为多式联运，” Hassabis说，“这是因为我们这样做的原因是，我们对这个通用数字助手的想法有愿景，一个助手，实际上是在现实世界中帮助您的助手。”

AI行业正在逐步发展“ Omni”模型，如果您愿意的话，可以理解和合成多种形式的媒体的模型。 Google的最新双子座模型可以生成音频以及图像和文本，而OpenAI在Chatgpt中的默认模型本质上可以创建图像，包括吉卜力工作室式的艺术品。亚马逊也有一个已名列的计划在今年晚些时候推出“任何一无所有”的模型。

这些OMNI模型需要大量培训数据 - 图像，视频，音频，文本等。 Hassabis暗示，VEO的视频数据主要来自Google拥有的平台YouTube。

“基本上，通过观看YouTube视频 - 许多YouTube视频 - [VEO 2]可以知道，您知道，世界物理学，” Hassabis说。

Google此前曾告诉TechCrunch的模型“可能会”在与YouTube创作者的协议上对“一些” YouTube内容培训。据报道，Google去年扩大了其服务条款，部分原因使该公司可以利用更多数据来训练其AI模型。