Google的最新双子座AI模型专注于效率

知识菜鸟

2025年04月10日 11:05发布

3712阅读

Google正在发布一种新的AI模型，旨在提供强大的性能，以效率为重点。

模型Gemini 2.5 Flash将很快在Google AI开发平台Vertex AI中启动。该公司表示，它提供了“动态和可控的”计算，使开发人员可以根据查询的复杂性调整处理时间。

“ [您可以调整]满足特定需求的速度，准确性和成本平衡，” Google在提供给TechCrunch的博客文章中写道。 “这种灵活性是优化大量，成本敏感应用程序中闪存性能的关键。”

Gemini 2.5 Flash随着旗舰AI型号的成本继续向上趋势而到达。较低价格的性能型号（例如2.5 Flash）以某种精度为代价提供了昂贵顶级选项的有吸引力的替代品。

Gemini 2.5 Flash是Openai的O3线的“推理”模型-Mini和DeepSeek的R1。这意味着要回答问题需要更长的时间才能进行事实检查。

Google说，2.5 Flash是“大量”和“实时”应用程序（例如客户服务和文档解析）的理想选择。

“此主力模型专门针对低潜伏期和降低成本进行了优化，” Google在其博客文章中说。 “这是响应迅速的虚拟助手和实时摘要工具的理想引擎，在该工具中，效率是关键的。”

Google没有为Gemini 2.5 Flash发布安全性或技术报告，这使得模型脱颖而出的位置更具挑战性。该公司此前曾告诉TechCrunch，它没有发布有关模型的报告，它认为是“实验性的”。

Google还在周三宣布，它计划将诸如2.5 Flash之类的双子座型号从第三季度开始。公司Mpany的Gemini模型将在Google Distribution Cloud（GDC）上提供，该云是Google的本地解决方案，适用于具有严格数据治理要求的客户。 Google表示，它正在与NVIDIA合作，将Gemini模型带到符合GDC的NVIDIA Blackwell Systems，客户可以通过Google或其首选渠道购买。