Google的最新双子座AI模型专注于效率
Google正在发布一种新的AI模型,旨在提供强大的性能,以效率为重点。
模型Gemini 2.5 Flash将很快在Google AI开发平台Vertex AI中启动。该公司表示,它提供了“动态和可控的”计算,使开发人员可以根据查询的复杂性调整处理时间。
“ [您可以调整]满足特定需求的速度,准确性和成本平衡,” Google在提供给TechCrunch的博客文章中写道。 “这种灵活性是优化大量,成本敏感应用程序中闪存性能的关键。”
Gemini 2.5 Flash随着旗舰AI型号的成本继续向上趋势而到达。较低价格的性能型号(例如2.5 Flash)以某种精度为代价提供了昂贵顶级选项的有吸引力的替代品。
Gemini 2.5 Flash是Openai的O3线的“推理”模型-Mini和DeepSeek的R1。这意味着要回答问题需要更长的时间才能进行事实检查。
Google说,2.5 Flash是“大量”和“实时”应用程序(例如客户服务和文档解析)的理想选择。
“此主力模型专门针对低潜伏期和降低成本进行了优化,” Google在其博客文章中说。 “这是响应迅速的虚拟助手和实时摘要工具的理想引擎,在该工具中,效率是关键的。”
Google没有为Gemini 2.5 Flash发布安全性或技术报告,这使得模型脱颖而出的位置更具挑战性。该公司此前曾告诉TechCrunch,它没有发布有关模型的报告,它认为是“实验性的”。
Google还在周三宣布,它计划将诸如2.5 Flash之类的双子座型号从第三季度开始。公司Mpany的Gemini模型将在Google Distribution Cloud(GDC)上提供,该云是Google的本地解决方案,适用于具有严格数据治理要求的客户。 Google表示,它正在与NVIDIA合作,将Gemini模型带到符合GDC的NVIDIA Blackwell Systems,客户可以通过Google或其首选渠道购买。
发布评论