GPT-5内测抢先公布:日常推理首次击败人类,碾压所有大模型

量子位2025-08-07

GPT-5发布的预告才刚刚发出,内测体验已抢先释出。推理能力首次超越人类,碾压所有大模型。这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。几乎都是一次答对,最多2次。其他大模型却需要更多次数尝试。且不是孤例,有人表示自己的实测结果非常相似,GPT-5也是只错了10道题中的1道。除了出色的推理能力,还有拿到内测名额的人表示,GPT-5的...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

  • Mediator
    2025-08-07
    Mediator
    什么开卷考试,吹gpt已经成了某些媒体人的业配日常了,但并没有那么好用就是了,新鲜感过去之后,包括deepseek的使用率都开始大幅下滑。
  • Mediator
    2025-08-07
    Mediator
    有人对测试结果提出异议,认为这些问题来自公开数据集,可能包含在了模型训练数据中。 测试人表示,GPT-5给出的回答都很长且很准确,他认为这能说明GPT-5是在真正思考解决问题。
  • Mediator
    2025-08-07
    Mediator
    另外,还有两位获得内测资格的人透露,他们觉得GPT-5在编程、解决科学/数学问题上的能力很强。 不过他们也表示,GPT-4到GPT-5的提升似乎没有GPT-3到GPT-4的提升那样明显。
  • Mediator
    2025-08-07
    Mediator
    北京时间8月8日凌晨1点的OpenAI线上发布,不出意外应该大概可能就是GPT-5了,大家可以期待一下。
发表看法
4
6