Google的双子座击败了PokémonBlue(有所帮助)
Google最昂贵的AI模型似乎已经跨越了一个重要的里程碑:击败了29年历史的视频游戏。
昨晚,Google首席执行官Sundar Pichai在X上获胜,“真是太好了!Gemini 2.5 Pro刚刚完成PokémonBlue!”
要清楚,双子座播放口袋妖怪直播是由(用他自己的话)创建的:“一位30年历史的软件工程师与Google无关”,但乔尔·Z(Joel Z.
例如,Google AI Studio的产品负责人Logan Kilpatrick上个月发布说,Gemini“在完成神奇宝贝方面取得了长足的进步”,并“赢得了第五个徽章(下一个最佳型号到目前为止只有3个徽章,但虽然有不同的代理商线束),但带领Pichai却带领Pichai开玩笑,“我们正在开玩笑,“我们正在开玩笑,“我们正在嘲笑Api,Api,ArtafterPokémonMeticemen Mettlements Mettlements Mettlemence Meticels Mettlecence”
为什么要神奇宝贝?早在二月份,拟人化强调了其Claude AI模型在“PokémonRed”中取得的进展NKING和代理训练”将其“重大提高”在“更出乎意料的”任务上,例如玩经典游戏。尽管取得了进步,但克劳德似乎还没有击败过“神奇宝贝红”。这是否意味着双子座在游戏中客观上更好?乔尔·Z(Joel Z)在他的抽搐页面上敦促观众:“请不要认为这是LLM可以玩口袋妖怪的基准。
和两个AI模型都需要帮助玩游戏 - 这是上述代理安全带进来的地方,为模型提供了游戏屏幕截图,并覆盖了其他信息,从而使模型可以决定如何做出响应(这可能涉及调用SPE呼叫SPEcialized代理),然后按与AI指令相对应的按钮。
TechCrunch活动 TechCrunch会议展览:AI 在TC会议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 TechCrunch会议展览:AI 在TC会议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 加利福尼亚州伯克利 | 6月5日 立即预订乔尔·Z(Joel Z)承认,还有其他“开发干预措施”可以帮助双子座完成游戏,但坚持认为这不是作弊。
“我的干预措施改善了双子座的整体决策和推理能力,”他说。 “我不给出特定的提示 - 没有诸如Moon山之类的特定挑战的演练或直接说明。唯一接近的事情是让双子座知道它需要两次与火箭咕unt交谈才能获得升降机钥匙,这是后来用口袋妖怪黄色固定的错误。”
另外,他说:“双子座扮演神奇宝贝仍在积极发展,框架继续发展。”
发布评论