北京时间5月14日凌晨,OpenAI发布了最新的多模态大模型GPT-4o,支持文本、音频和图像任意组合的输入和输出。OpenAI表示,GPT-4o可以检测用户情绪,并以类似人类的语调与用户交谈。同时,其速度比现有的GPT-4 Turbo快了两倍,而成本仅为其一半。受此消息带动,A股多模态模型、传媒、游戏等AI相关板块纷纷走强。
GPT-4o可以实现文本、音频和图像多模态的实时推理和交互,既说明下游应用在人工智能领域大有可为,也说明AI领域投资的核心矛盾在于下游应用,而应用的核心矛盾在于准确率。此次GPT-4o在演示过程中也出现一些失误,如在尚未读取到图像时就开始求解方程,还一度把人的面部识别为“木质表面”,距离解决AI不可靠的问题还有很长的路要走。当前AI应用距离商业变现还需要较长时间打磨,相对于企业用户而言其准确率较低,难以出现明显的降本增效。美股AI应用领域在最新的财报季几乎没有公司披露运营数据,也说明AI应用从产品到落地的难度。提升大模型准确率较难从通用模型的角度下手,更多需要基于场景做工程化处理,是一项需要投入人力、时间的工程。
同时,此次OpenAI未如市场期待发布GPT-5,而国内大模型能力已快速逼近并超过GPT-3.5,AI的技术壁垒或没有此前市场想象的高。人类AI发展至今,尚未出现较为纯粹的、以AI技术立身的商业模式,这也大致说明AI技术壁垒相对较低,技术扩散较快。从Transformer(大语言模型中使用的技术架构)驱动的创新来看,OpenAI从最早的“”,到现在领先美国竞争对手半年左右,差距正在逐渐缩短。当前国内大模型由于受到算力制约,多选择走差异化路线,如kimi的长文本、秘塔的学术写作、deepseek的低成本等。如果大模型能力大幅进步,相应的特色领域可能被更多参数、更强算力的大模型降维打击,而如果大模型能力提升速度放缓,则国内AI应用端有一定的商业化机会。
整体来看,之前市场期待的,AI应用短期“突变”的概率正逐步降低,美股和A股也正在逐步定价这个逻辑。从当前AI技术到应用端落地还需要耐心,市场更多去捕捉主题机会。
$工银传媒指数A(OTCFUND|164818)$
$工银传媒指数C(OTCFUND|010677)$
$工银传媒指数E(OTCFUND|020407)$
本文作者可以追加内容哦 !