openai 公布的o3 编程能力跻身人类全球前200
o3相比o1最突出的成绩,一是顶尖程序员竞赛CodeForces分数超过2700,人类超过这个分数的目前只有不到200个。
二是在为AGI准备的测试ARC-AGI上分数从32%跃升到了75.7%、87.5%。
为什么有两个成绩呢?
因为o3支持低思考程度和高思考程度两种设置,高思考程度花费的算力(横轴)也直接拉满。
ARC-AGI是Keras之父Franois Chollet发起的测试基准,典型题目为图形逻辑推理。
追加内容
本文作者可以追加内容哦 !