在美国当地时间2024年的2月15日,OpenAI发布首款文生视频模型Sora,该模型通过对视频使用DALL·E 3的重述提示词技术,以提高文本保真度及视频整体质量,并利用GPT将简短提示转换为较长的详细描述,使其自身拥有较准确的语义理解能力。同时,该模型拥有模拟物理世界中人物、动物及环境等复杂场景演绎的能力,能在同一视频中设计出多个镜头,并保持角色和视觉风格的一致性。简单理解就是这是一款可以直接通过人工智能由文字或者语言直接生成的视频大模型,且官方并没有单纯的把它叫做视频模型,而是称为世界模拟器,也就是说,从这一刻开始拟合更多真实物理定律的数字孪生世界将走进了人类社会。

目前OpenAI还没有发布Sora的公开使用版本,但已经发布的40多个演示视频中,包含有细节拉满的场景、复杂的摄像机以及多个充满情感的角色。OpenAI宣称,Sora可以理解物体在物理世界中如何存在,并准确地解释道具并生成引人注目的角色来表达充满活力的情感。

Sora最主要有三个优点:第一、超长视频:可以生成长达60秒的连贯视频,突破了以往文本生成视频模型只能生成4秒连贯视频的限制。第二、多视角切换:可以在一个视频中包含多个镜头角度,包括多角度镜头和一镜到底,展现场景中的光影关系、物体之间的物理遮挡和碰撞关系,镜头转换流畅。第三、多模态输入处理:可以接受文字、图片、视频的输入提示,能够根据图像创建视频或补充现有视频,还能沿时间线向前或向后扩展视频。

若Sora成为视频创作领域的超级应用,将带来巨大的网络设备升级需求。同时随着谷歌最新多模态大模型Gemini 1.5以及英伟达本地聊天机器人Chat with RTX在近期陆续发布,我们认为AI发展趋势已经愈发明确,其中带来的投资机会也愈发清晰。

1.  算力或成为AI时代确定性较高的赛道。

产业专家也表示训练类似当前Sora的文生视频模型,最起码需要8千-1万片以上H100,是文本GPT的10倍以上,如考虑后续模型升级和推理,算力需求将会更大。人工智能的发展将对算力提出更高要求,算力网络基础设施需求有望持续提升。根据中国信通院数据,2022 年全球计算设备算力总规模达到 906EFlops(每秒浮点运算次数),同比增长47%,预计 2030 年全球算力规模将达到 56ZFlps,平均年均增 长 65%。 2022年我国算力规模稳步扩张,智能算力保持强劲增长,近6年累计出货超过2091万台通用服务器,82万台AI服务器,计算设备算力总规模到302EFlops,其中智能算力规模持续高速增长,增速达72%,在我国算力占比超过59%。

2. 算力产业链涉及环节较多,行业需求有望全面提升。

AI算力产业链涉及环节较多,按照算力基础设施构成来看,包括AI芯片及服务器、交换机及光模块、IDC机房及上游产业链等。其中,随着训练和推理需求提升,AI 芯片及服务器需求将率先放量;AI算力对数据中心内部数据流量较大,光模块速率及数量均有显著提升,交换机的端口数及端口速率也有相应的增长;IDC也有望进入需求释放阶段。相关机构预测,未来五年,硬件将成为中国人工智能最大的细分市场,占人工智能总投资的 50%以上。2026年,中国在人工智能硬件市场的 IT 投资将超过 150 亿美元,接近美国人工智能硬件的市场规模,五年复合年增长率 16.5%。服务器作为硬件市场的主要组成部分,预计将占总投入的 80%以上。

3.多模态模型迭代节奏加快,推动内容创作领域发展,数字经济大时代或即将到来。

伴随行业内公司多模态模型推出节奏加快,以Sora为代表的多模态模型输入输出能力迭代有望持续降低内容创作门槛,解放内容生产力,打造新型内容产品,推动内容创作领域发展,并扩大影响范围,延伸至教育、营销、游戏、娱乐等领域,推动多行业发展。

本次Sora的发布意味着AI在视频技术领域取得突破性进展。随着AI在多模态领域陆续实现飞跃式发展,相关领域及产业在带动下也将迎来深度变革。作为普通人的我们,面对变革浪潮的到来或可以选择积极拥抱变化,通过选择合适的投资标的,分享变革浪潮带来的时代红利。

$数字经济ETF(SZ159658)$$科创信息ETF(SH588260)$$科创芯片ETF基金(SH588290)$#Sora大模型横空出世,影响几何?##科技巨头排位有变,AI热助英伟达飙至第三##龙年首交易日A股站上2900点,什么信号?#

风险提示:本文所载信息或所表达的意见仅为提供参考之目的,并不构成对买入或卖出此文中所提及的任何证券的建议。本文并非基金宣传推介资料,亦不构成任何法律文件。本文非为对相关证券或市场的完整表述或概括,有关数据仅供参考,本公司不对其中的任何错漏和疏忽承担法律责任。投资者购买本公司旗下的产品时,应认真阅读相关法律文件。基金有风险,投资需谨慎。

追加内容

本文作者可以追加内容哦 !