近日,全球领先的人工智能大模型企业OpenAI发布首款视频大模型Sora,可实现输入文本/图像并直接输出视频像素,输出视频最长可达60秒。这些视频不仅呈现出细腻的场景布置,还展现了复杂而连贯的镜头运动,同时视频中的人物角色也栩栩如生。这一技术的横空出世将带来哪些改革?未来的技术发展路线是什么?哪些细分领域有望成为龙年的投资热点?博时基金投资副总监兼基金经理肖瑞瑾将为你解答。
肖瑞瑾
权益投资四部投资副总监兼基金经理
Sora的横空出世,将会带来哪些深度变革?
博时基金投资副总监兼基金经理肖瑞瑾表示Open Sora大模型的重要意义和优势在于三点:
首先,Sora是首款创造性使用Transformer+Diffusion(DiT)大模型架构的视频大模型,Transformer是Open GPT-4等已经被证明体现强大智慧涌现能力的大语言模型(LLM),而Diffusion扩散模型则是图像生成的绝对主流路线。两者结合后,在更大的训练数据、更强的训练算力和更灵活的编码下,Sora模型产生显著的智慧涌现,生成视频的长度和质量获得指数级的提升。
其次,Sora的成功表明大语言模型(LLM)的Scaling Law(规模法则)的绝对有效。Scaling Law的含义是在训练大模型时,使用更多优质的数据、更好的数据标注、更灵活高效的算法以及更强大的算力,那么你就能找到一套通用规律,保证数据越多、算力越强、模型越大,那么大模型效果就越好。大语言模型与Diffusion扩散模型的成功结合证明了这一点,也指明了后续继续进化的道路:获取更多数据,建设更多的算力。
最后,Sora的发布表明了生成式人工智能正在成为崭新的生产力工具,不远的未来甚至将能够模拟和生成物理世界的模型,并成为通向AGI通用人工智能的重要路径。目前Sora生成的视频具有良好的空间性质(视角变换,物体遮挡等的合理性)、时间维度物体的连贯性,并能够模拟现实世界物理的交互,甚至模拟数字世界,已经展现了强大的可用性和工程能力,足以成为新质生产力工具。
综上,Sora的本质是一个数据驱动的物理引擎,在可见的未来将遵循Scaling Law不断实现智慧涌现,展现更强大的智慧和生产力,最终甚至能够模拟现实和生成虚拟世界,这表明人工智能已经进入重要发展节点。
Sora将会对哪些行业产生影响?
图片和视频制作成本将显著降低。借助Sora等视频大模型,未来输入一部小说,输出一部电影将不再是科幻故事,对于需要视频制作的传媒和游戏企业而言,意味着巨大的生产力提升和潜在的人力成本节约。
物理仿真和工程建模能力将显著提升。Sora具备强大的模拟现实世界物理的交互和建模能力,未来将极有可能展现出强大的物理仿真和工程建模能力,大大缩短工程设计周期、提升工程设计的复杂度,这对工业制造业意义重大。
Sora表明了通用大模型方法论的成功。Sora的工程实现可能大量使用Open AI已有的DALL-E和GPT-V大模型提供数据标注,如同搭积木,用已有模型去构造更多数据是实现更强大模型的重要方法。同时更多数据、更强算力、更多参数意味着模型越大则越强,这将导致头部大模型的算力竞赛,并对算力相关的AI芯片、光模块、交换机、路由器、服务器等基础设施产生巨大拉动力。
AI热潮之下,哪些细分领域
有望成为龙年的投资热点?
1 AI应用。类似于移动互联网的发展历程,中国具备完备的数字经济基础设施,庞大的内需市场和人口规模成为AI应用快速发展的重要基础。因此我们看好AI应用板块诞生出有市场竞争力的头部企业,潜在的下游应用行业集中在视频生成、游戏制作、AI+医疗,AI+教育,AI+交通等领域。
2 AI算力。Sora的成功展现了大语言模型遵循的Scaling Law的巨大效用。但在当前国际环境下,中国面临算力被卡脖子的困境,因此自主可控的AI算力基础设施是重要的投资方向,其中包括AI芯片、光模块及光芯片、交换机、路由器和AI服务器,以及生产AI芯片所需的先进半导体产线、HBM存储芯片、CoWoS等先进封装产能等。
3AI数据。训练大模型需要大量的文本、图片和视频数据,掌握数据资源的企业将获得数据要素资产价值重估,同时也在训练大模型中占得先机。
展望未来,AI发展的技术路线是什么?
大模型和小模型并肩发展:OpenAI等少数企业未来将持续主导通用大模型的前沿研发,人工智能大模型的发展将一步步走向AGI通用人工智能。部分垂直企业通过对模型进行微调,研发MoE混合专家模型、适用于移动终端的小参数模型,也能获取一席之地。
AGI通用人工智能将成为新质生产力工具,赋能千行百业。比如大模型对医疗、教育、工业制造等各个行业的赋能,每个行业都将是上千亿甚至上万亿的潜在市场。
AGI通用人工智能将通过人形机器人实现具身智能,并走向生产和生活。人形机器人将能够胜任工厂机械性操作,在家庭中照顾陪伴老人,这对逐步进入老龄化社会的中国至关重要。工业和家庭的潜在市场空间都是多达万亿的。
AGI通用人工智能将逐步发展为世界模拟器,帮助我们探索和认识世界,在前沿科研领域成为人类的重要助手,潜在的科研需求和科研价值也无法估量。
风险提示:投资有风险,投资需谨慎。基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,但不保证本基金一定盈利,也不保证最低收益。本基金的过往业绩及其净值高低并不预示其未来业绩表现,基金管理人管理的其他基金的业绩并不构成对本基金业绩表现的保证。【基金管理人/基金销售机构】提醒您基金投资的“买者自负”原则,在做出投资决策后,基金运营状况与基金净值变化引致的投资风险,由您自行负担。基金管理人、基金托管人、基金销售机构及相关机构不对基金投资收益做出任何承诺或保证。
您在做出投资决策之前,请仔细阅读基金合同、基金招募说明书和基金产品资料概要等产品法律文件和风险揭示书,充分认识本基金的风险收益特征和产品特性,认真考虑本基金存在的各项风险因素,并根据自身的投资目的、投资期限、投资经验、资产状况等因素充分考虑自身的风险承受能力,在了解产品情况及销售适当性意见的基础上,理性判断并谨慎做出投资决策。
#英伟达涨超16%,能否引爆AI产业链?#
$博时中证传媒指数发起式A(OTCFUND|020183)$$博时标普500ETF联接A(OTCFUND|050025)$$博时纳斯达克100ETF发起式联接(QDII)C人民币(OTCFUND|016057)$
本文作者可以追加内容哦 !