#投资干货##股市怎么看##AI算力引爆变压器荒,订单排到2027年##SpaceX与xAI正式合并打造太空AI算力##谷歌母公司Q4业绩超预期,云业务猛增48%#$新易盛(SZ300502)$$人工智能ETF(SH515980)$
一、Agent生态全面扩张,开启AI应用新篇章
首先,我们来看看当前Agent生态的爆发式进展。近期全球科技巨头和创新企业动作频频,Agent技术的落地速度和应用场景远超市场预期,主要呈现三大亮点:
(一)头部企业营收爆发,商业化进程加速
大模型公司Anthropic近期大幅上调了未来数年的营收预测,预计今年销售额将增长四倍,达到180亿美元,明年更是有望飙升至550亿美元。这一预测远高于去年夏天的预期,核心驱动力来自其AI编码助手Claude Code的爆发式增长——该产品去年11月的年化收入已超过10亿美元,占当时总年化收入的14%,助力Anthropic在去年年底实现了超过90亿美元的年化收入。尽管目前训练和运行AI模型的成本增长速度超过收入,导致现金流正增长时间推迟到2028年,但这一营收规模已充分证明Agent技术的商业化潜力,也反映出市场对高效AI工具的强烈需求。
(二)技术创新突破,Agent集群能力升级
1月27日,月之暗面发布并开源了K2.5模型,其最大亮点在于创新的Agent集群架构。与传统"全能专家"式模型不同,K2.5能够根据任务需求,现场调度多达100个分身,并行处理1500个步骤,所有角色分配与任务拆解无需预设,完全由模型自主决策。
给大家举个具体案例:如果向Kimi Agent集群投喂40篇关于心理学和AI的论文,Kimi会先通过多次调用工具通读所有论文,确保上下文完整保留关键信息;随后衍生出多个子Agent,分别负责不同章节的撰写;最后由主Agent把关验收,汇总生成长达几十页的专业PDF综述。这种集群化协作模式,彻底改变了AI处理复杂任务的方式,大幅提升了效率和专业性。
(三)应用形态革新,"贾维斯"式体验落地
近期一款名为Clawdbot的AI助手从海外火到国内,成为2026年开年最受瞩目的AI爆款。它就像线上版"贾维斯",能接管个人终端几乎所有任务,包括清空收件箱、发送电子邮件、管理日历、办理航班值机等,还能接入WhatsApp、Telegram等常用聊天APP,用户只需通过对话就能操控设备自动执行操作。
更值得关注的是,Clawdbot作为免费开源项目,已吸引腾讯云、阿里云等国内云厂商火速接入,提供一键部署服务。其核心设计理念是"本地运行",能深度访问用户的电脑系统、文件、应用和聊天记录,因此不少用户专门下单苹果Mac mini来保障其24小时在线运行,谷歌AI产品负责人Logan Kilpatrick就是其中之一。虽然目前Clawdbot还处于极客尝鲜阶段,但它所展现的"万物互联+自然交互"的未来形态,为Agent技术打开了全新的应用空间。
从这三大进展可以看出,Agent生态已经从技术探索期迈入规模化应用的临界点,其核心价值在于打破了传统AI的功能边界,实现了从"被动响应"到"主动服务"的跨越,这一变革将对整个IT产业的技术架构和硬件需求产生深远影响。
二、三大核心逻辑,Agent为何催生CPU刚性需求
随着大模型应用从简单Chatbot向复杂任务Agent演进,计算负载的重心正在发生微妙偏移。过去大家普遍关注GPU在AI推理中的核心作用,但在Agent时代,CPU可能比GPU更早成为瓶颈。这背后有三大核心逻辑,我们逐一为大家解析:
(一)Multi-Agent架构引发OS调度压力激增
传统LLM对话是线性的,而Agent的工作流是"推理→执行→评估→反思"的复杂闭环。模型需要不断在"思考"和"行动"之间切换,这导致操作系统层面的上下文切换和进程调度任务大幅增加。
同时,Agent执行代码等操作时,经常需要在隔离的云端沙盒(Sandbox)中运行,这些沙盒环境的启动、运行和销毁都高度依赖CPU算力。随着Multi-Agent协作场景的增多,成百上千个独立Agent的并行运行,给操作系统调度带来了巨大压力,CPU的调度能力成为关键制约因素。
(二)长上下文场景下KV Cache卸载的CPU挑战
键值缓存(KV Cache)是加速Transformer推理的核心技术,但它会消耗大量显存。随着大模型上下文长度不断增长,这个问题愈发突出——当上下文长度达到8万个token时,仅KV Cache就可能消耗数十GB显存,而GPU显存还需同时容纳模型权重和中间计算结果,极易出现显存耗尽导致推理失败的情况。
为解决这一问题,业界采用了KV Cache Offload技术,将GPU内存中不活跃或暂时未使用的键值数据迁移到CPU内存或SSD中。但这一方案带来了新的挑战:一方面,CPU与GPU之间的通信带宽远低于GPU内部的HBM带宽;另一方面,KV Cache的传输和管理需要CPU承担繁重的调度任务,进一步加剧了CPU负载。NVIDIA在2025年9月的技术博客中也明确指出,长上下文场景下将KV Cache卸载到CPU内存是解决HBM瓶颈的关键手段。
(三)高并发工具调用带来的CPU算力消耗
Agent的核心能力不仅在于对话,更在于灵活使用各类工具,比如检索、写代码、浏览网页等,这些非模型推理任务主要由CPU承担。英特尔与佐治亚理工学院2025年11月的论文《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》,通过对五大代表性Agent工作负载(HaystackRAG、Toolformer、ChemCrow、LangChain、SWE-Agent)的测试发现,CPU端的工具处理占延迟的43.8%~90.6%,而LLM推理仅占较小部分。
以HaystackRAG在Natural Questions基准测试为例,检索耗时8.0秒,占总延迟的90.6%,而LLM推理仅需0.5秒。在高并发场景下,大量Agent同时工作,多线程/多进程的处理需求进一步推高了CPU负载。测试数据显示,当Batch Size达到128时,Langchain基准测试中出现严重的CPU上下文切换瓶颈,此时CPU的能耗(1807 Joules)已非常接近GPU(2307 Joules)。
此外,DeepSeek推出的Engram架构进一步推动了"以存代算"趋势。该架构将大模型的"计算"和"超大规模记忆"解耦,Transformer的算子全部在GPU/加速卡上计算,而1000亿参数的Engram表存储运行则在CPU内存中,仅产生小于3%的可忽略开销。无独有偶,Anthropic也为Claude Cowork升级了全新永久记忆方式,通过知识库扩展模型记忆能力。这类架构创新能有效突破GPU显存限制,进一步推动CPU配比提升。
综合来看,Agent时代的计算架构正在从"GPU主导"向"CPU+GPU协同"演进,CPU的调度能力、内存容量和多线程处理能力成为决定Agent性能的关键因素,这催生了对高性能CPU的刚性需求。
三、Agent驱动存储需求爆发,产业链迎来量价齐升
除了CPU,Agent技术的规模化应用还带来了存储需求的持续增长。Agent的执行过程需要大量记忆和上下文缓存,从底层技术到终端应用,全方位推动存储产业链的升级与扩容。
(一)KV Cache Offloading技术激活SSD需求
三星在最新发布的白皮书《Scaling AI Inference with KV Cache Offloading》中指出,在Agentic AI时代,利用SSD进行KV Cache Offloading是解决GPU显存瓶颈、提高推理性能并降低成本的关键方案。
LLM推理分为预填充(Prefill)和解码(Decode)两个阶段:Prefill阶段一次性处理完整提示词,生成初始KV Cache并存储在GPU显存中,以计算为主;Decode阶段基于KV Cache逐token生成输出,以内存访问为主。KV缓存通过复用已计算的键值对,能显著提升推理效率,但在Agent环境中,多轮对话需反复处理相似提示词。如果KV缓存仅存于GPU本地,会话迁移时(如负载均衡场景)需重新预填充,会引入高延迟。
通过将KV缓存卸载至NVMe SSD等共享存储,可实现跨节点快速恢复,大幅降低延迟。这一技术方案不仅提升了推理性能,更直接拉动了企业级SSD的需求增长,尤其是高带宽、低延迟的高端产品。
(二)存储厂商业绩亮眼,需求增长确定性强
近期美国存储厂商陆续披露的2026财年第二财季业绩,充分验证了存储需求的爆发式增长:
希捷科技第二财季营收同比增长22%至28.3亿美元,经调整每股净利润3.11美元,双双超越市场预期;第三季度指引更为强劲,调整后EPS预期3.2至3.6美元,销售额预期28至30亿美元,均大幅高于分析师预期。希捷CEO在财报电话会议上表示,2026年的产能已经分配完毕,预计未来几个月开始接受2027年上半年的订单,而Agentic AI是驱动存储需求增长的核心动力——"Agentic AI依赖于对大量历史数据的持续访问,以实现有效的规划、推理和独立决策,其应用已呈现加速增长趋势,一家领先云服务提供商的调查显示,超过一半的受访客户正在积极使用人工智能代理"。
闪迪的业绩表现更为突出,第二财季营收30.25亿美元,同比增长61%;GAAP口径下净利润8.03亿美元,同比增长672%;稀释后每股收益5.15美元,同比增长615%;毛利率提升至50.9%,同比提升18.6%,全面超越市场预期。公司预计第三财季营收44至48亿美元,GAAP毛利率64.9%至66.9%。闪迪CEO David Goeckeler表示,2026年之后的客户需求远高于供应,在大型科技公司推动下,数据中心将在2026年首次成为NAND的最大市场,而AI工作负载扩展正推动企业级SSD需求加速增长,特别是推理场景显著增加了每次部署中的NAND含量。
从行业趋势来看,Agent不仅在数据中心层面拉动存储需求,其在边缘端的部署更是打开了增量空间——边缘端蕴藏着大量未开发数据,Agent的应用将推动这些数据的生成和存储,为推理、持续训练和模型完整性维护提供支撑,形成"数据生成-存储-应用"的良性循环,持续拉动存储需求增长。
未来三大主线或值得关注:一是Agent生态直接受益的CPU;二是存储产业链;三是国内算力基础设施配套。
风险提示
基金/股市有风险,投资需谨慎。
本文章关于经济形势、证券市场以及相关行业的论述仅为本公司对当下证券市场与相关行业的研究观点,基于市场环境的不确定和多变性,所涉观点后续可能随着市场发生调整或变化。本内容仅用于投资者沟通交流之目的,不构成对任何机构和个人投资的建议或意见,不代表本公司管理基金当下或未来的持仓,也不必然作为本公司管理之基金进行投资决策的依据,不构成对投资者投资收益的承诺或保证。本文章中所提产品及相关公司仅作示例,不构成任何投资建议。预测性信息均存在不确定性,实际结果可能受经济变动、政策调整、技术进步等多种因素影响而与预测有所偏差,本公司不对任何直接或间接使用本数据所造成的损失负责。投资人应根据个人风险承受能力和投资经验,审慎参与基金/股市投资。文章中所提产品及相关公司仅作为示例,不构成任何投资建议。文章内容仅限于基金管理人与合作平台开展宣传推广之目的, 禁止第三方机构单独摘引、截取或以其他不恰当方式传播。
本文作者可以追加内容哦 !