定调,算力即国力!
原创社长说研讯社
2024年12月29日 20:04上海998人
为百万财经人士倾心打造的投研资讯平台
为您解析宏观及政策、研判产业格局及动态,
与君共同见证中国资本市场的壮阔奋进时代!
——研讯社
周六18时20分,由中央广播电视总台和国务院国资委联合制作的大型系列纪录片《大国基石》,推出第三期——《算力引擎》,其中明确强调:
“算力即国力,它是数字经济时代的新质生产力。截至2023年底,中国算力总规模位列全球第二。在中国,算力正以勃发之姿,启前所未有之业。”
新一轮算力革命,也开始了加速启动。在“东数西算”规划布局和“新基建”浪潮下,开放共享的公共算力数据中心,正在全国各地如雨后春笋般破土而出。截至2023年,中国累计建成国家级超算中心14个,全国在用超大型和大型数据中心达633个、智算中心达60个。
算力即国力,不是空谈。周五晚上,上海市人民政府办公厅印发《关于人工智能“模塑申城”的实施方案》,其中明确目标:
到2025年底,建成世界级人工智能产业生态,力争全市智能算力规模突破100EFLOPS,形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3-5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。
无独有偶,12月23日,河南省数据工作会议在郑州召开,会议强调,要推进数据基础设施建设,力争明年算力规模达94EFLOPS。目标也是跟上海同等数量级。
按上海自身增速看,目前算力规模大概是50EFLOPS,那如果明年能到100EFLOPS,就是增长一倍。
而如果按全国类推,考虑上海和河南是算力相对集中的城市,上海+河南两地最新目标合计差不多200EFLOPS,保守估计明年全国1000EFLOPS,那相比今年也是4-5倍的增长。(截至2024年6月,我国在用算力中心超过830万标准机架,算力规模达246EFLOPS)
很明显,各地方为了抢算力资源先发优势,正在开启一轮算力建设竞赛。国内算力基础设施建设正在进入加速期。
最后,关于幻方DeepSeek V3大模型引起热议,称仅使用2048张H800 GPU,预训练不到两个月,达到了性能强、成本极低的惊人效果,有声音认为减少了算力的需求。
实际上,DeepSeek算力和训练时间减少主要来自模型架构、数据增强、策略优化等原因,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题,其在特定任务表现出色(编程、数学等),但丧失一定通用性和稳定性。
说简单点,DeepSeek模型是因为“偷懒了”,一是站在了前任的肩膀上,节省了前期大量高质量数据的合成和清洗、预训练,二是在牺牲了一定通用性的情况下进行了降本,因此这在行业专用大模型上是有效的,但这并不意味着AI整体算力需求会减少,只是进一步证明了算力投入重心从预训练转移到了后训练和推理。
追加内容

本文作者可以追加内容哦 !