美国的AI大模型发展现状:
现在几乎所有AI大模型的训练都采用Transformer网络结构,它是谷歌在2017年提出的,具有优秀的长序列处理能力,更高的并行计算效率,无需手动设计以及更强的语义表达能力等特征。Transformer的提出让大模型训练成为可能。
算力是保证AI大模型出现在美国的另一个关键。美国拥有世界上最大的云计算企业。IDC数据显示,2021年全球IaaS市场中,包括亚马逊、微软、谷歌、IBM在内的美国企业合计占比近70%。
算力的另一个维度是芯片,高性能的芯片可以提供更加高效的计算能力,从而加速训练过程。
2016年,黄仁勋将世界第一台DGX-1(英伟达计算平台)捐献给了OpenAI,DGX-1是3000人花费3年时间才研发出来的首个轻量化的小型超算,计算和能力相当于 250台传统服务器。有了DGX-1,OpenAI之前一年的计算量只要一个月就能完成。
目前,英伟达的A100芯片仍然是唯一能够在云端实际执行任务的GPU芯片。最近的GTC2023上,黄仁勋又更新了新芯片H100的进度。H100配有Transformer引擎,可以专门用作处理类似ChatGPT、GPT-4、PaLM 2等的AI大模型,由其构建的服务器效率是A100的十倍。
从2012年AI萌芽时期,到2022年ChatGPT带来的AI浪潮,该国一直是AI领域的破局者,引领世界AI的发展。无论是算力、算法,还是数据,都占据着主导地位。
Sora 是该国人工智能公司OpenAI发布的人工智能文生视频大模型,于2024年2月15日正式对外发布。其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。Sora可以根据用户的文本提示创建最长60秒的逼真视频,该模型了解这些物体在物理世界中的存在方式,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。对于需要制作视频的艺术家、电影制片人带来无限可能。OpenAI 可以“教AI理解和模拟运动中的物理世界”,这标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。
2024年12月10日,OpenAI正式向用户开放人工智能视频生成模型Sora。12月18日,文生视频大模型Sora入选“2024全球十大工程成就”。
从经济、技术、人才,到资金、硬件、软件、环境,几乎在每个方面都领先其他一大截,这也导致目前行业最具代表性的AI大模型主要都集中在该国。
追加内容
本文作者可以追加内容哦 !