openai 公布的o3  编程能力跻身人类全球前200



o3相比o1最突出的成绩,一是顶尖程序员竞赛CodeForces分数超过2700,人类超过这个分数的目前只有不到200个。

二是在为AGI准备的测试ARC-AGI上分数从32%跃升到了75.7%、87.5%。

为什么有两个成绩呢?

因为o3支持低思考程度和高思考程度两种设置,高思考程度花费的算力(横轴)也直接拉满。

ARC-AGI是Keras之父Franois Chollet发起的测试基准,典型题目为图形逻辑推理。


追加内容

本文作者可以追加内容哦 !