1、DeepSeek V3发布,加速AI应用落地

事项:

12月26日,DeepSeek-V3(深度求索)首个版本正式发布并同步开源,已在网页端和API全面上线。其在训练效率和推理速度上相较历史模型有了大幅提升,同时可保证领先的模型能力表现,引起业内高度关注。

模型:数学、代码等能力优异,API性价比较高。

参考官方论文,DeepSeek v3为6710亿参数MoE架构模型,激活37B,在14.8T token上进行了预训练。能力上,模型暂不支持多模态输入,但在通识和专业知识测试集上表现优秀,MMLU pro正确率75.9%,GPQA-Diamond正确率59.1%,达到国内第一梯队,接近Claude 3.5 Sonnet的水平;并且在数学和代码领域测试表现突出,MATH 500正确率90.2%,SWE-bench正确率42.0%,Codeforces得分51.6,超越所有非o系列模型。模型生成速度达到60TPS,是前代模型的三倍。定价上,API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,与字节Doubao-pro-256k定价输入每百万tokens 5元,输出每百万tokens 9元的水平相当,在国产模型中性价比较高。

应用:国产模型能力提升、价格下降,支撑全领域AI应用加速。

豆包pro、DeepSeek v3等国产模型连续发布。模型能力上,国产模型在文本和知识能力上接近GPT-4、Claude、Llama等海外前沿模型水平,多模态能力逐步完备,逻辑和代码能力在非o1技术路线下达到可用水平。价格上,国产模型API百万tokens输出普遍定价10元以内,是GPT-4o的1/3甚至更低。我们预计模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量加速各领域落地。其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

算力:DeepSeek训练效率大幅提升,助力推理算力需求高增。

1)训练效率大幅提升,GPT4的训练成本约为DeepSeek V3的6.2倍。根据DeepSeek V3的官方技术文档,本次DeepSeek的训练仅使用了2048个H800 GPU,总训练GPU卡时为2788千小时(其中预训练为2664千小时),平均到每个GPU上,仅为1361小时,约合56.7天。与之相对比,根据英伟达CEO黄仁勋在GTC2024上的演讲内容,GPT-4 MoE使用8000个H100训练了90天,合计约为17280千卡时,相当于DeepSeek V3的6.2倍。

2)训练效率提升归因:我们认为DeepSeek V3训练提效的原因主要包括低精度计算、小参数量、高质量数据等方面。精度方面,根据英伟达官方文档,其GPU的8位精度算力通常是16位精度算力的2倍,因此数据精度从FP16降低到FP8可以贡献一倍效率提升。参数方面,GPT-4 MoE模型总参数量达到1800B,而按照DeepSeek V3官方文档,其总参数量只有671B,约为GPT-4 MoE的1/3,同时,DeepSeek的激活参数大约为37B,而GPT4-MoE每次推理激活的参数量约为280B,二者约为7.57倍关系;数据方面,GPT-4 MoE使用了13万亿(1300B)token,而DeepSeek V3使用的token数量约为14.8万亿(1480B),数据量相差不大,但DeepSeek V3技术文档提及了使用模型生成训练数据等,因此我们认为数据质量或有较大幅度提升。此外,采用负载均衡、更好的流水线策略亦是其官方提及的提升训练效率的重要原因。

3)从推理侧助推AI普惠,带动推理算力需求倍增,打开更广阔算力市场空间。我们认为,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏,正如4G提速降费给我国移动互联网产业提供了助力。当前AI应用渗透率仍然较低,产业仍在早期,根据我们在2024年12月13日外发的报告《计算机行业“智能网联”系列报告54—算力需求测算:Agent+Sora》,随着Agent成为流量入口,渗透率达到30%左右,全球Agent的推理token数量将增长3个数量级以上,且视频生成与实时视频理解等形态的AI同样有望带来巨量需求增长,并且根据我们对视频生成模型的测算,视频推理算力需求将有望达到训练算力需求的2-3个数量级以上。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮,带动全产业链扩张,随着AI进一步普及到日常生活与产业当中,我们认为推理算力需求将仍然驱动AI算力产业链持续增长。

风险因素:

AI核心技术发展不及预期,AI被不当使用造成严重社会影响,企业数据安全风险,信息安全风险,行业竞争加剧。

投资策略:建议关注AI全产业相关投资机会$人工智能AIETF(SH515070)$,综合梳理以下投资主线:

1)AI 应用:伴随模型能力升级,Agent等应用形式有望加速落地,带动办公、教育、管理、端侧、具身智能等应用领域公司加速兑现业绩弹性。

2)AI Infra:模型场景化与行业化发展催生数据服务和模型平台需求,产业发展确定性高。

3)AI算力:AI应用加速落地带动推理端算力新需求。

来源:中信证券

2、上海印发人工智能“模塑申城”实施方案

上海市人民政府办公厅印发《关于人工智能“模塑申城”的实施方案》,到2025年底,建成世界级人工智能产业生态,力争全市智能算力规模突破100EFLOPS,形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3-5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。

来源:财联社

3、“成都造”人形机器人矩阵亮相 成都加快打造机器人产业发展高地

12月27日,成都市机器人产业创新成果发布大会暨成都世运会智能制造应用场景推介会在成都科创生态岛召开。

会上,成都人形机器人创新中心有限公司研发的人形机器人矩阵惊艳亮相,贡嘎一号二代轮式单臂人形机器人、贡嘎二号双足人形机器人“鸿鹄”、贡嘎四号双足人形机器人“灵蛟龙”、贡嘎五号多形态双足机器人“灵鸮”以及半身人形机器人“鸿鹄”概念验证机等5类7台产品与大家见面,标志着成都已在这一前沿领域实现跨越式发展。

其中,贡嘎二号双足人形机器人“鸿鹄”是首个“成都造”全栈自研且配备“最强大脑”的人形机器人整机产品,赋予了人形机器人理解、推理和执行能力。依托中国首个基于扩散架构的人形机器人高速推理模型R-DDIRM和首个机器人多模态模型RRMM,“鸿鹄”能够实现外界信息多维度感知、抽象语义精准解读、任务路径快速规划等功能,将为众多应用场景带来全新的智能化解决方案。

同时,会上成都人形机器人创新中心有限公司与成都创新风险投资有限公司、四川天府新区科创和人才服务有限公司、成都高新策源投资集团有限公司、深圳市东方富海创业投资管理有限公司成功达成战略投资合作,并与四川水发勘测设计研究有限公司、成都文化旅游发展集团有限责任公司、红星传媒(成都)有限公司、四川文投名者名文化传播有限公司以及中兵红箭成都银河动力有限公司共同签署合作协议,各方将在陪伴机器人、融媒体机器人、水下机器人、特种机器人等多个关键领域深入开展产业化协作。

大会还发布了涵盖人形机器人在火炬传递、体育展示、咨询接待、零售服务等多个场景,以及面向运动员、观众和工作人员提供的智能服务系统开发等多样化服务的智能制造应用场景机会清单。

成都市经信局市新经济委相关负责人表示,目前成都以四川天府新区、成都高新区、成都成华区等地为主要承载地,聚集了超80家产业链上下游企业,初步形成了从关键零部件、机器人本体、系统集成到终端应用的全产业链发展态势。

据了解,成都市经信局市新经济委始终高度重视资本在产业发展中的引导作用,出台了机器人三年行动方案,强化场景牵引,高标准策划机器人“十进”活动,以“进万企、解难题、优环境、促发展”工作为抓手,今年以来,促进成都科创投集团与成华科创投公司携手签约,成功组建总规模达100亿元的成都人工智能与机器人基金;成都市重大产业化项目二期股权投资基金有限公司、成都成华产业振兴股权投资基金合伙企业(有限合伙)、成都技转创业投资有限公司共同出资,成立了首期10亿元的华智机器人产业投资基金。这一系列产业投资基金的相继落地将大力推动人形机器人领域的技术创新与产业蓬勃发展,助力成都打造机器人产业发展高地。

成都市经信局市新经济委还积极探索1000余台机器人在70余类场景的创新应用,并力争到2026年,打造标杆示范场景不少于100个,实现机器人在重点行业的规模化应用,切实打造机器人“无处不在、无时不有”的产业生态格局。

来源:每日经济新闻

风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或其他关联机构的正式观点。历史业绩不代表未来收益,市场有风险,投资需谨慎
$人工智能AIETF(SH515070)$ $机器人ETF(SH562500)$

#算力即国力!板块迎多个利好催化##AI眼镜有哪些黑科技?何时能大爆发?#

追加内容

本文作者可以追加内容哦 !