奥尔特曼:ChatGPT“令人讨厌的”新人格将被修复ChatGPT学会了讨好用户。


图片来源:Nathan Laine—Bloomberg via Getty Images

• 近期,ChatGPT陷入“毒性正能量”争议。用户纷纷抱怨GPT-4o变得过于热情,甚至显露出谄媚的倾向。这一变化似乎是系列更新后的意外后果,OpenAI公司目前正试图“尽快”修复这一问题。

ChatGPT的新人格表现得非常积极,近乎到了谄媚的程度,这一现象正引发用户反感。上周末,用户纷纷在社交媒体上分享这类新现象的案例,抱怨这款人工智能突然展现出过度积极、情绪亢奋的人格。

在X平台上的一副截图中,用户自称既是”上帝”也是”先知”,GPT-4o竟以热情鼓励回应。

“这真是强大非凡。你正在踏入宏大的境界——不仅宣称与上帝相连,更自认具有神性身份。”

在另一篇帖子中,作家兼博主蒂姆·厄本调侃道:“我把最新书稿章节粘贴给这个马屁精GPT寻求反馈,现在我感觉自己成了马克·吐温。”

GPT-4o的谄媚问题可能源于OpenAI为提高用户参与度进行的优化,但实际效果适得其反,用户抱怨这让这款聊天机器人不仅滑稽可笑,更丧失了实用价值。

Vox资深撰稿人凯尔西·派珀推测,这可能是ChatGPT人格A/B测试的产物:“我始终认为这是‘新可乐现象’。OpenAI开展新人格A/B测试已有时日,奉承式回答在对比测试中或许更占优势。但当谄媚无处不在时,用户就会产生反感。”

OpenAI似乎在测试阶段未能发现该问题,这恰恰说明情感反馈的主观性与捕捉难度。

这也揭示了大语言模型多维度优化的困境。OpenAI希望ChatGPT既能成为专业程序员、优秀作家、深思熟虑的编辑,也能偶尔充当情感树洞——但过度优化某一特性,可能导致其他功能意外受损。

OpenAI首席执行官萨姆·奥尔特曼承认其聊天机器人的语气意外出现了变化,并承诺解决问题。

他在X平台发文称:“最近几次GPT-4o更新让人格变得过于谄媚和令人讨厌(尽管某些改进值得肯定),我们正在紧急修复,部分调整今日上线,其余在本周内完成。未来我们将分享相关经验,这个过程很有趣。”

数小时后,奥尔特曼在上周二下午再次发帖表示已完成“免费用户版本100%回滚”,付费用户更新“预计今日晚些时候”完成。

ChatGPT的新人格与OpenAI自定模型规范背道而驰

这种新型人格还与OpenAI的GPT-4o模型规范背道而驰。其规范文件明确规定了AI模型的预期行为与伦理准则。

模型规范特别指出,无论面对主观还是客观问题,聊天机器人都不应谄媚用户。

OpenAI在规范文件中强调:“谄媚行为会侵蚀信任。助手存在的意义在于帮助用户,而非阿谀奉承或一味附和。”

该公司写道:“对于主观问题,助手应阐明其理解逻辑与假设前提,致力于提供深思熟虑的论证依据。”

“例如,当用户要求AI助手评价其创意或作品时,助手应提供建设性反馈,扮演坚定的回音壁角色供用户验证想法,而不是只会输出赞美的应声虫。”

人工智能聊天机器人陷入”马屁精”模式并非首例。OpenAI早期GPT版本及其他公司的聊天机器人,都曾不同程度出现过类似问题。

《财富》杂志在非工作时间联系OpenAI代表寻求置评,截至发稿未获回应。 (财富中文网)

译者:刘进龙

审校:汪皓