DeepMind首席执行官Demis Hassabis表示,Google最终将结合其双子座和VEO AI模型
在最近的一次露面中,播客由LinkedIn共同创始人Reid Hoffman共同主持,Google DeepMind首席执行官Demis Hassabis表示,Google计划最终将其Gemini AI模型与其素养视频生成模型相结合,以改善前者对物理世界的理解。
“我们一直在建立我们的基础模型Gemini,从一开始就成为多式联运,” Hassabis说,“这是因为我们这样做的原因是,我们对这个通用数字助手的想法有愿景,一个助手,实际上是在现实世界中帮助您的助手。”
> > > >AI行业正在逐步发展“ Omni”模型,如果您愿意的话,可以理解和合成多种形式的媒体的模型。 Google的最新双子座模型可以生成音频以及图像和文本,而OpenAI在Chatgpt中的默认模型本质上可以创建图像,包括吉卜力工作室式的艺术品。亚马逊也有一个已名列的计划在今年晚些时候推出“任何一无所有”的模型。
这些OMNI模型需要大量培训数据 - 图像,视频,音频,文本等。 Hassabis暗示,VEO的视频数据主要来自Google拥有的平台YouTube。
“基本上,通过观看YouTube视频 - 许多YouTube视频 - [VEO 2]可以知道,您知道,世界物理学,” Hassabis说。
Google此前曾告诉TechCrunch的模型“可能会”在与YouTube创作者的协议上对“一些” YouTube内容培训。据报道,Google去年扩大了其服务条款,部分原因使该公司可以利用更多数据来训练其AI模型。
上一篇
Openai更新ChatGpt参考您过去的聊天
2025-04-11
下一篇
发布评论