OpenAI的o1模型在科学、编码、数学领域性能参数:

1)数学方面,以2024年的美国数学邀请赛为测试集,o1单次生成可解决74%的问题,多次生成后进一步提升正确率到83%,GPT-4只能解决12%的问题。

2)编程方面,模型在Codeforces竞赛上超过83%的专业人员。

3)科学方面,模型GPQADimond测试集正确率78%,超越人类专家70%水平,超越普通人类博士能力。

果麦文化AI校对大模型在校对领域的能力:

果麦文化总裁瞿总说:校对质量很难通过人工来提高的,因为我们人都会疲劳,有惰性,我们只能依靠科技。现在,我们总共进行了一年多的AI校对研发,总共是训练字量达到25.5亿的文字量,20多个出版社正在测试。目前,校对的成功率已经超过了80%,误判率远远低于我们现在常用的一些校对软件(规则类校对软件)。果麦文化董事长路金波在接受采访时说:AI校对能够降低果麦60% 到 80% 的人力。今年3月果麦文化总裁瞿洪斌接受全景网采访时表示:正常情况下AI校对软件今年就能进入使用,AI校对软件除了解决我们自己的问题,也能解决全行业的问题,能解决行业痛点,跟我们合作的出版机构都对我们产品报以高度期望,他们认为我们的产品如果研发出来,将解决他们几十年都无法解决的问题。$果麦文化(SZ301052)$  $中际旭创(SZ300308)$  $因赛集团(SZ300781)$  

转发:《果麦文化深度:独家研发AI校对大模型软件,已到收获期》

追加内容

本文作者可以追加内容哦 !