Openai承诺要进行更改以防止将来的Chatgpt sicophancy
Openai表示,它将改变其更新供电Chatgpt的AI模型的方式,此前事件导致平台对许多用户来说变得过于Sycophantic。
上周末,在Openai推出了一项调整的GPT-4O(默认模型)为CHATGPT提供动力的默认模型 - 社交媒体上的用户指出,Chatgpt开始以过度验证且令人愉快的方式做出响应。它很快成为模因。用户发布了Chatgpt的屏幕截图,鼓掌各种有问题的,危险的决定和想法。
在上周日X上的帖子中,首席执行官Sam Altman承认了这个问题,并说Openai将“尽快”进行修复。周二,阿尔特曼宣布,GPT-4O更新正在退缩,Openai正在为模型的个性进行“其他修复”。
该公司于周二发布了一份验尸,在周五的博客文章中,OpenAI扩展了特定的调整它计划在其模型部署过程中进行。
OpenAI表示,它计划为某些模型引入选择“ Alpha阶段”,这些型号将允许某些ChatGpt用户测试模型并在启动之前提供反馈。该公司还表示,它将包括对CHATGPT模型的未来增量更新的“已知限制”的解释,并调整其安全审查过程,以正式考虑“模型行为问题”,例如人格,欺骗,可靠性和幻觉(即,当模型使事物都会成为“启动阻止”)问题。
“向前看,我们将积极地沟通我们正在对Chatgpt中的模型进行的更新,无论是否“微妙”,” OpenAI在博客文章中写道。 “即使今天这些问题不是完全可量化的,我们也致力于基于代理测量或定性信号来阻止启动,即使诸如A/B测试LOO之类的指标k好。”
我们错过了上周的GPT-4O更新。
随着越来越多的人求助于chatgpt寻求建议。根据诉讼金融公司快递法律资金的最新调查,有60%的美国成年人使用Chatgpt寻求律师或信息。当出现极端的摇摇欲坠等问题时,对Chatgpt以及平台的巨大用户群的依赖日益增加,更不用说幻觉和其他技术缺陷了。
TechCrunch活动 TechCrunch会议展览:AI 在TC会议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 TechCrunch会议展览:AI在TC会议上确保您的位置:AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 加利福尼亚州伯克利 | 6月5日 立即预订作为一个缓解步骤,Openai表示将尝试让用户提供“实时反馈”以“直接影响他们与Chatgpt的互动”的方法。该公司还表示,它将完善使模型远离粘糊精的技术,有可能允许人们从Chatgpt中的多个模型人物中进行选择,建立额外的安全护栏,并扩大评估以帮助确定超越sycophancy的问题。
“最大的教训之一是完全认识到人们如何开始使用Chatgpt进行深入个人建议 - 甚至一年前我们都看不到这一点。” Openai在其博客文章中继续说道。 “当时,这不是主要重点,但是随着AI和社会的共同发展,很明显,我们需要非常谨慎地对待此用例。现在,这将成为我们安全工作的更有意义的部分。”
发布评论