$弘信电子(SZ300657)$   

多模态AI全线提速!ChatGPT-5 即将发布,龙头厂商全梳理


近期有媒体报道,ChatGPT即将在未来几个月内迎来全新版本,OpenAI公司CEO奥特曼正带领团队紧锣密鼓地推进研发工作,有望在今年夏季正式推出GPT-5。

自2022年底ChatGPT横空出世以来,全球范围内掀起了大模型创新的热潮。当前大模型从单模态向多模态趋势持续演进。

大语言模型在文本端的应用已经趋于成熟,无论是在自然语言处理、机器翻译还是智能问答等领域,都取得了显著的成果。与此同时,图像和视频生成技术也在快速发展,AIGC浪潮全面加速!

大模型朝多模态方向发展:

资料来源:中关村产业研究院

算力端方面海外大厂对硬件的投资持续且强劲。Meta在2024年有望进一步扩大对GPU的投资,以支撑其在人工智能领域的持续发展。微软Google和Amazon等科技巨头也预计在新的一年里继续扩大资本性支出,以支持AI技术的研发和应用。

广告

随着大模型的持续迭代和相关应用的不断涌现,视频生成领域有望在2024年迎来新的发展热潮。

多模态行业概览

根据处理数据类型数量的不同,AI模型可以分为两类:单模态和多模态。

单模态模型只能处理一种类型的数据如文本,多模态模型则可以处理两种及以上的数据类型,类似于人脑能够同时处理文本、声音、图像等不同类型的信息。

多模态大模型通过结合文本、图像等多种模态信息进行学习,能够充分利用大模型的泛化能力,构建多模态数据集,并解决融合和对齐等问题。从而提升其在多个感知任务上的性能和表现。

多模态大模型的框架包括数据、算法和应用三个层面。

多模态大模型框架:

多模态市场竞争格局和龙头梳理

当前,海外的大语言模型技术正迈入一个新的突破阶段。大模型领域已形成一超多强的竞争格局,OpenAI虽处于领先地位,但正面临其他竞争对手的加速追赶。

Sora模型的发布,标志着视频生成模型迎来了类似GPT3的重要时刻。海外初创公司Pika其模型效果在短时间内得到了显著提升。而Google发布的VideoPoet更是基于LLM的技术路径,展现出了令人印象深刻的视频生成能力。

海外多模态加速授迭代:

资料来源:IT之家

国内大语言模型的能力也不断取得突破,大模型领域呈现百家争鸣的态势。据IDC数据显示,为应对多模态技术这一发展趋势,我国云厂商、创新企业、AI企业、大数据企业和传统软件企业都在积极布局多模态技术。

百度发布了文心一言、阿里巴巴发布了通义千问大模型、商汤科技发布了日日新大模型等等。此外,科大讯飞发布的星火大模型3.5能力与GPT-4相当,基于全国产化算力平台“飞星一号”,星火大模型V3.5实现了七大能力提升。通义千问推出的2.0版本能力赶超了GPT 3.5;Minimax在国内推出了MoE模型abab6;百川智能上线的Baichuan3在中文、医疗能力方面表现优秀;三六零自研的千亿参数大模型——360智脑4.0功能覆盖了大模型应用的所有场景,并成为了首批通过国内首个官方“大模型标准符合性评测”的四个大模型之一。国内还涌现出一批应用于金融、医疗、教育、工业等领域的行业大模型,拓宽了大模型的应用边界,截至2023年11月,国产大模型的数量已激增至300多个。#人工智能##多模态##多模态AI##算力##aigc##科技##财经#

大多模态产业链方面,AI应用与算力厂商正在加速参与布局,代表厂商包括金山办公、弘信电子、福昕软件万兴科技美图公司用友网络金蝶国际恒生电子、科大讯飞。基础设施方面代表厂商主要有浪潮信息、弘信电子、中科曙光、工业富维、拓维信息神州数码海光信息等。

随着AI在全球持续爆发,多模态领域的各路厂商不断加速创新和突破,将为全球大模型的发展和应用提供更多可能性。

追加内容

本文作者可以追加内容哦 !