GPT-5.1 成为首个通过七指图测试的LLM,很有趣,这一次 ChatGPT 给出了正确答案。在这之前的所有 Chatbot 几乎全军覆没了,无一例外都会说是 5 指。这种对人来说显而易见的问题,LLM 大部分会答错,这也是所谓 LLM 锯齿智能的表现之一。很多高度复杂的问题可以答对,很多显而易见的问题却错了...虽然说,这一次 ChatGPT 花了 2 分 35 秒,远超正常人类所需用时,看思维过程还调用了代码编程...但结果总算是对了。

GPT-5.1 成为首个通过七指图测试的LLM,很有趣,这一次 ChatGPT 给出了正确答案。在这之前的所有 Chatbot 几乎全军覆没了,无一例外都会说是 5 指。这种对人来说显而易见的问题,LLM 大部分会答错,这也是所谓 LLM 锯齿智能的表现之一。很多高度复杂的问题可以答对,很多显而易见的问题却错了...虽然说,这一次 ChatGPT 花了 2 分 35 秒,远超正常人类所需用时,看思维过程还调用了代码编程...但结果总算是对了。

猜你喜欢
【101评论】【76点赞】
【6评论】【5点赞】
【2评论】【2点赞】
【160评论】【75点赞】
作者最新文章
热门分类
汽车TOP
汽车最新文章