使用OpenAI的模型构建应用程序可能会产生巨额费用。没有能力负担费用的开发者可能会被完全排除在外,并可能选择更便宜的模型,如谷歌的Gemini 1.5 Flash或Anthropic的Claude 3 Haiku。现在,OpenAI开始涉足轻量级模型市场了。

“我认为GPT-4o Mini真正体现了OpenAI的使命,即让AI更广泛地惠及大众。如果我们希望AI能为世界每一个角落、每一个行业、每一个应用带来益处,就必须让AI更加经济实惠,”负责API平台产品的Olivier Godement告诉媒体。

从今天开始,Free、Plus和Team计划的ChatGPT用户可以使用GPT-4o Mini代替GPT-3.5 Turbo,企业用户将在下周获得使用权限。这意味着对于ChatGPT的用户来说,GPT-3.5将不再是一个选择,但如果他们更喜欢不切换到GPT-4o Mini的情况下通过API使用,它仍然可以提供给开发者。Godement表示,GPT-3.5将在某个时候从API中退役——只是不确定何时。

新的轻量级模型还将在API中支持文本和视觉,OpenAI表示它很快就能处理像视频和音频这样的多媒体输入和输出。有了这些功能,这可能会看起来像是更能干的虚拟助手,可以理解你的旅行行程并提供建议。然而,该模型主要用于简单的任务,所以没有人会为了省钱而去构建一个像Siri一样的虚拟助手。

这个新模型在Measuring Massive Multitask Language Understanding (MMLU)基准测试中获得了82%的成绩,该测试包含57个学术科目的约16000道多项选择题。当MMLU在2020年首次推出时,大多数模型在这项测试中的表现都很糟糕,这是有意为之,因为之前的基准测试已经让模型变得过于先进了。GPT-3.5在这项基准测试中得分为70%,GPT-4o的得分为88.7%,而谷歌声称Gemini Ultra的得分为有史以来最高的90%。相比之下,竞争对手模型Claude 3 Haiku和Gemini 1.5 Flash的得分分别为75.2%和78.9%。

值得注意的是,研究人员对像MMLU这样的基准测试持谨慎态度,因为不同公司在实施测试时略有不同。这使得不同模型的得分难以比较。还有一个问题是,AI可能在数据集中包含这些答案,这实际上让它作弊,通常情况下,没有第三方评估者参与这一过程。

对于渴望以低成本开发AI应用程序的开发者来说,GPT-4o Mini的推出为他们提供了另一种工具。OpenAI让金融科技初创公司Ramp测试了该模型,并使用GPT-4o Mini构建了一款工具,从收据中提取费用数据。因此,用户无需在文本框中费力输入,而是可以上传收据图片,然后模型会为他们整理好一切。Superhuman是一款电子邮件客户端,也对GPT-4o Mini进行了测试,并使用它创建了电子邮件回复的自动提示功能。

目标是为开发人员提供一种轻量级且价格合理的工具,以便他们能够创建以前无法使用像GPT-4这样大型且昂贵模型的各种应用程序和工具。许多开发人员在支付运行最健壮模型所需的令人难以置信的计算成本之前,会转向Claude 3 Haiku或Gemini 1.5 Flash。

那么,OpenAI为何花了这么长时间?Godement表示,这是纯粹的优先级排序问题,因为该公司专注于创建像GPT-4这样的更大、更好的模型,这需要投入大量人力和计算资源。随着时间的推移,OpenAI注意到越来越多的开发人员渴望使用较小的模型,因此该公司决定将资源投入到开发GPT-4o Mini中。

“我认为它将会非常受欢迎,”Godement说。“不仅现有使用OpenAI所有AI功能的应用程序会喜欢它,而且许多在定价之前推出的应用程序也会喜欢它。”

追加内容

本文作者可以追加内容哦 !