【突破算力限制！Meta开源“记忆层”重塑Transformer架构大模型】今天_财富号

2025年01月03日 08:45 湖南返回网宿科技吧>

大中小

$网宿科技(SZ300017)$ 【突破算力限制！Meta开源“记忆层” 重塑Transformer架构大模型】今天凌晨3点，全球社交巨头Meta分享了一个创新研究——Memory layers（记忆层）。目前，Transformer架构的预训练大模型在存储、查询数据时，随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法，通过比较查询键与两个较小集合中的键，可以快速找到最相关的键，而无需遍历模型的整个记忆层。这也就是说，可以在不增加算力的情况下显著增加大模型的参数。例如，研究人员在仅有1.3亿参数的模型中添加了128亿额外的记忆参数，其性能与Meta开源的Llama 2- 70相当，而算力却比它低了10倍左右。（AIGC社区）

追加内容

本文作者可以追加内容哦 !

郑重声明：用户在社区发表的所有信息将由本网站记录保存，仅代表作者个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

A雯雯

更多文章

投资组合

总收益	20日收益	日收益
--	--	--

最新操作
-	-	-

历史收益率走势(%)

Chart

自选股

代码	名称	最新价	涨跌幅
查看更多

浪客视频

郑重声明：东方财富网发布此信息的目的在于传播更多信息，与本站立场无关。东方财富网不保证该信息（包括但不限于文字、视频、音频、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实，不对您构成任何投资建议，据此操作，风险自担。

东方财富

扫一扫下载APP

东方财富产品

证券交易

关注东方财富

天天基金

扫一扫下载APP

基金交易

关注天天基金

期货交易

信息网络传播视听节目许可证：0908328号经营证券期货业务许可证编号：913101046312860336 违法和不良信息举报:021-61278686 举报邮箱：jubao@eastmoney.com

关于我们可持续发展广告服务联系我们诚聘英才法律声明隐私保护征稿启事友情链接

亲爱的市民朋友，上海警方反诈劝阻电
话“962110”系专门针对避免您财产被
骗受损而设，请您一旦收到来电，立即
接听。