究竟是什么样的大模型,居然让吴恩达博士如此兴高采烈?

吴恩达收过最好的生日礼物

作为全球人工智能和机器学习领域国际上最权威的学者之一,吴恩达(Andrew Ng)博士在全球科技圈可以说是家喻户晓。

在人工智能和机器学习领域深耕多年的吴恩达博士,曾经是Google Google Brain(深度学习)项目的创始负责人,曾经担任过百度首席科学家兼副总裁,后来又成立了AI Fund投资基金,投身于AI创业项目的投资与管理。

2024年4月12日,亚马逊发布公告称,欢迎吴恩达博士加入亚马逊董事会,该任命自2024年4月9日起生效。

就在吴恩达博士正式成为亚马逊董事会成员之后,美国当地时间4月18日,Meta发布了其最新的开源大模型Llama 3,将数据和规模提升到了新的高度。

作为坚定的AI开源倡导者,吴恩达得知这一消息后兴奋地表示:“Meta在我生日这天发布的Llama 3大模型,是自己收到过最好的生日礼物!感谢Meta!”

Llama 3加入亚马逊云科技“豪华套餐”

Meta此次发布的开源大模型Llama 3,包括了Llama 3 8B和Llama 3 70B两款大模型,其中8B版本适合在消费级GPU上高效部署和开发;70B版本则专为大规模AI应用设计。每个版本都包括基础和指令调优两种形式。

作为迄今为止最强大的Llama模型,Llama 3使用的训练数据集是Llama 2数据量的7倍,其中包括了4倍数量的代码。同时Llama 3支持8000个上下文长度,这个数字是Llama 2容量的两倍。在Meta公布的AI基准测试中,Llama 3 70B的表现甚至超越了谷歌的Gemini Pro1.5以及Anthropic的Claude 3 Sonnet。如此惊艳的性能表现,足以让任何对开源大模型的疑虑都烟消云散。

Llama 3大模型发布之后,亚马逊云科技就在第一时间表示,客户已经可以通过亚马逊云科技的Amazon SageMaker JumpStart使用这两款模型。

伴随着Meta Llama 3的加入,亚马逊云科技目前提供的“大模型豪华套餐”,已经包括了通过Amazon Bedrock提供的来自AI21 Labs, Amazon, Anthropic, Cohere, Meta, Mistral AI和Stability AI的领先大模型,以及通过Amazon SageMaker JumpStart提供的包括Meta Llama 3在内的各种大模型,可谓盛况空前。

部署Llama 3大模型带来的收益

不论是AI开发者还是用户,一定都非常迫切地想要知道如何通过亚马逊云科技旗下的Amazon SageMaker JumpStart,来发现部署Llama 3并运行推理。

作为亚马逊云科技专门构建的机器学习中心,Amazon SageMaker JumpStart能够提供预训练的模型、内置算法和预构建的解决方案,帮助客户快速开始机器学习项目。通过Amazon SageMaker JumpStart部署Llama 3,客户能够获得诸多的收益:

1、降低部署所需的时间:在SageMaker JumpStart登录页面中,用户能够通过以模型提供商命名的不同中心轻松发现各种模型,也可以通过搜索快速定位找到自己需要部署的模型,并通过简单的设置即可轻松部署。

2、提供灵活的部署路径,用户能够用自己惯用的部署方式来进行:通过SageMaker Studio UI和SageMaker Python SDK中的SageMaker JumpStart访问基础模型。

3、丰富的功能支持来加速开发:客户能够利用SageMaker Pipelines、SageMaker Debugger或容器日志等功能,来提升模型性能和并实施MLOps控制

4、安全的隔离环境:上述方式部署的模型将始终处在亚马逊云科技的安全环境下,由客户的VPC控制,以确保数据安全。

亚马逊云科技推动AI技术普惠

凭借在生成式AI与大模型领域的诸多创新与实践,亚马逊云科技很早就认识到,没有一个模型可以适用于所有的场景,这也是其一直都在不断充实和丰富大模型“豪华套餐”的根本原因。如今Llama 3大模型的发布,意味着广大用户在大模型上又有了更加多样化的选择。

在2023年11月底的re:Invent 2023主题演讲中,亚马逊云科技首席执行官Adam Selipsky就曾经表示:“事情发展得如此之快,在这种环境中,适应能力是您可以拥有的最有价值的能力。不会有一个统治一切的模型,也肯定不会有一家公司能提供所有人使用的模型。”

Adam Selipsky指出,用户在选择最优技术的同时,还应该有多个模型提供者的选项,以考察谁不仅技术过硬,还能作为自己商业上可依赖的伙伴。在亚马逊云科技的整个历史中,一直都在强调这种选择的需要,这也是亚马逊云科技在谈论生成式AI战略时明确阐述的方法,让构建和调用一系列基础模型变得像API调用一样简单。

“我们在亚马逊云科技中构建的,不仅仅是一个引人注目的应用程序或基础模型。这些服务在堆栈的所有三个层次上构成了一套基础服务,从而实现下一个划时代的人工智能阶段普惠化,并将为内外部构建者赋能,以转变我们所知道的几乎每一个客户体验,或是创造全新的客户体验。我们乐观地认为,这种改变世界的人工智能大部分将建立在亚马逊云科技上。”亚马逊首席执行官安迪·贾西(Andy Jassy)表示。

追加内容

本文作者可以追加内容哦 !