12月12日,Investinglive分析师Adam Button表示,萨姆·阿尔特曼发布了GPT-5.2模型的思维能力测评结果,坦白说,这些数字简直令人震惊。这并非渐进式提升,而是质的飞跃。对于追求通用人工智能纯粹主义的研究者而言,ARC-AGI-2是关键指标。GPT-5.2在此项测试中的表现从GPT-5.1的17.6%跃升至52.9%。这标志着大语言模型在抽象推理与泛化能力这一长期短板上取得...
网页链接12月12日,Investinglive分析师Adam Button表示,萨姆·阿尔特曼发布了GPT-5.2模型的思维能力测评结果,坦白说,这些数字简直令人震惊。这并非渐进式提升,而是质的飞跃。对于追求通用人工智能纯粹主义的研究者而言,ARC-AGI-2是关键指标。GPT-5.2在此项测试中的表现从GPT-5.1的17.6%跃升至52.9%。这标志着大语言模型在抽象推理与泛化能力这一长期短板上取得...
网页链接
精彩评论