Openai承诺要进行更改以防止将来的Chatgpt sicophancy

知识菜鸟

2025年05月06日 10:39发布

1513阅读

Openai表示，它将改变其更新供电Chatgpt的AI模型的方式，此前事件导致平台对许多用户来说变得过于Sycophantic。

上周末，在Openai推出了一项调整的GPT-4O（默认模型）为CHATGPT提供动力的默认模型 - 社交媒体上的用户指出，Chatgpt开始以过度验证且令人愉快的方式做出响应。它很快成为模因。用户发布了Chatgpt的屏幕截图，鼓掌各种有问题的，危险的决定和想法。

在上周日X上的帖子中，首席执行官Sam Altman承认了这个问题，并说Openai将“尽快”进行修复。周二，阿尔特曼宣布，GPT-4O更新正在退缩，Openai正在为模型的个性进行“其他修复”。

该公司于周二发布了一份验尸，在周五的博客文章中，OpenAI扩展了特定的调整它计划在其模型部署过程中进行。

OpenAI表示，它计划为某些模型引入选择“ Alpha阶段”，这些型号将允许某些ChatGpt用户测试模型并在启动之前提供反馈。该公司还表示，它将包括对CHATGPT模型的未来增量更新的“已知限制”的解释，并调整其安全审查过程，以正式考虑“模型行为问题”，例如人格，欺骗，可靠性和幻觉（即，当模型使事物都会成为“启动阻止”）问题。

“向前看，我们将积极地沟通我们正在对Chatgpt中的模型进行的更新，无论是否“微妙”，” OpenAI在博客文章中写道。 “即使今天这些问题不是完全可量化的，我们也致力于基于代理测量或定性信号来阻止启动，即使诸如A/B测试LOO之类的指标k好。”

我们错过了上周的GPT-4O更新。

随着越来越多的人求助于chatgpt寻求建议。根据诉讼金融公司快递法律资金的最新调查，有60％的美国成年人使用Chatgpt寻求律师或信息。当出现极端的摇摇欲坠等问题时，对Chatgpt以及平台的巨大用户群的依赖日益增加，更不用说幻觉和其他技术缺陷了。

TechCrunch活动 TechCrunch会议展览：AI 在TC会议上确保您的位置：AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。 TechCrunch会议展览：AI在TC会议上确保您的位置：AI并显示1,200多个决策者您已经建立的东西 - 而没有大笔支出。可在5月9日或桌子上持续使用。加利福尼亚州伯克利 | 6月5日立即预订

作为一个缓解步骤，Openai表示将尝试让用户提供“实时反馈”以“直接影响他们与Chatgpt的互动”的方法。该公司还表示，它将完善使模型远离粘糊精的技术，有可能允许人们从Chatgpt中的多个模型人物中进行选择，建立额外的安全护栏，并扩大评估以帮助确定超越sycophancy的问题。

“最大的教训之一是完全认识到人们如何开始使用Chatgpt进行深入个人建议 - 甚至一年前我们都看不到这一点。” Openai在其博客文章中继续说道。＆＃8220;当时，这不是主要重点，但是随着AI和社会的共同发展，很明显，我们需要非常谨慎地对待此用例。现在，这将成为我们安全工作的更有意义的部分。”