OpenAI新幻觉论文惹争议GPT5拉胯难道是测试基准有问题OpenAI好不容易

量子位看科技 2025-09-08 18:14:40

OpenAI新幻觉论文惹争议GPT5拉胯难道是测试基准有问题

OpenAI好不容易发了篇新论文,还是给GPT-5挽尊?

最近,《语言模型为何会产生幻觉?》()这篇论文火了。

它提出模型有幻觉是因为:标准的训练和评估流程,更倾向于奖励“猜对”,而非承认不确定。

正因如此,模型在面对不确定的问题时,往往会选择冒险猜测以获得更高评分。

所以,为了让模型“老实说不”,就应该重新设计评估指标,从而鼓励模型承认自己不会,惩罚随意猜测。

而好巧不巧的是,OpenAI自家的GPT-5就最不爱猜测。【图1】

于是,眼尖的网友开始“虾仁猪心”地盘OpenAI的核心逻辑:

GPT-5表现不好➔不是模型拉垮➔是现有测试基准出了问题➔GPT-5幻觉少刷不上分➔所以应该重新设定指标。(完美闭环)

> 您不会是为了给GPT-5挽尊,所以想找个新基准吧?【图2】

所以,这究竟是OpenAI为了GPT-5这口醋才包的饺子,还是说真的揭开了大模型幻觉背后的更深层问题?

0 阅读:4
量子位看科技

量子位看科技

感谢大家的关注