在东方财富看资讯行情,选东方财富证券一站式开户交易>>

“2025年会迎来AI Agent爆发的元年!”


“AI Agent会代替人采取一些行动,对很多问题做更全面的思考,制定框架并完成目标。”


“AI推理成本持续下降,带来整个行业应用的蓬勃发展。”


“移动终端有望成为超级入口,强势的消费电子厂商有机会获得更强大的附加值。”


“AI Agent将渗透到生活的各个领域,具备AI功能的终端数量将远超手机时代。”


以上是瀛赐基金合伙人、科技产业负责人黄昊在瀛赐基金2025年度策略会上发表的精彩观点。以下是我们整理的演讲实录。


各位投资者大家下午好,我是瀛赐基金的黄昊,为大家汇报的主题是迎接AI Agent大时代。报告主要分成三个部分:第一部分简单介绍下AI Agent;第二部分介绍下AI Agent所需要的发展条件;第三部分详细介绍下AI Agent在B端和C端的应用。


01

AI Agent时代到来



OpenAI 的两位创始人,奥特曼(Sam Altman)和格瑞格(Greg Brockman),明确表示 AI 的下一个重磅产品就是 AI Agent。2025年会迎来 AI Agent 爆发的元年!

根据 OpenAI 把AI发展阶段分为五个阶段,前三个阶段分别是:

•  聊天机器人阶段:AI 具备对话功能,例如 GPT-3 及其早期版本,主要用于文本生成和回答问题。

•  复杂问题处理阶段:AI 能够处理更复杂的任务,如解答高考题、数学竞赛题等,体现出更强的逻辑推理和知识应用能力。

•  Agent 时代:AI 能够代替人类执行任务,制定框架并完成目标,而不仅仅是提供信息或建议。

资料来源:Bloomberg,瀛赐基金整理

从工作模式上来划分,AI 跟人之间的协作,分为三个阶段:1、嵌入式模式:AI提供信息或建议。2、副驾驶模式:AI协助人类完成部分工作。3、Agent模式:AI独立完成任务。比如给它下达帮我们订机票的任务,这样的任务它会从头到尾,帮我们去查询机票,筛选机票并完成付款。这就是 agent 的作用。

资料来源:瀛赐基金整理

举两个例子:第一个例子,AI Agent推出了一个 task 的功能,让GPT帮忙做一个定时,每天的九点钟设置一个闹钟,非常简单,但也是起到了agent 的作用。第二个例子,这个任务是帮我们去盯股价,比如每天上午十点钟给我们汇报一下股价走势情况,或者让 GPT 来帮我们去收集一些跟个股相关的信息。这些简单的任务,其实也是 AI Agent的雏形。

近期,Openai发布一个 【Operator】的功能,这是 OpenAI 推出的一个Agent。

除了OpenAI外,像微软、谷歌这样一些超大型的公司也在推出各种各样的AI Agent 的功能。以微软为例,它已经在自己的云端推出上百个 agent。如果考虑客户应用的话,可能有上千个 AI 模型,那么AI Agent都可以调用这些模型的应用。谷歌这边主要在客户服务、员工赋能、软件开发方面提供一些AI Agent的功能开发。在整个AI Agent时代,离不开这些大公司的积极参与。

AI Agent 不仅仅是一个聊天机器人,而是一个具有规划、记忆、执行等能力的智能体。它能利用多种工具完成复杂任务,并结合音频、视觉和语言交互,实现更高级别的智能化应用。从架构来看核心组成部分包括大语言模型(LLM)、规划,记忆,工具和行动,其中LL是AI agent的核心,负责理解和生成语言,会贯穿整个agent工作的从始至终。大模型会把提出的任务进行一些切分,切分成若干个流程,有了这样一些规划之后,再去获取信息。然后需要记忆的功能,有了记忆之后,再调用大模型对这些信息进行分析,再给出一个行动方案,最终来执行。

资料来源:瀛赐基金整理

当然,如果我们要调用 AI Agent,其实离不开交互的功能。我们要跟Agent 对话,比如说文字对话、语音对话或者视觉上的交互。所以从功能上来看,它最基础的功能,就包括交互,语音、视觉还有语言。它离不开对各种语言的理解,所以这是最基础的四大支柱。

资料来源:瀛赐基金整理

OpenAI 发布生成式 AI 模型 o1,提到一个叫思维链的技术。思维链其实就是把整个任务进行一个深入的思考。比如说,最开始跟 GPT 聊天的时候,我们提一个问题, GPT做的事情类似于打字机,做一个文字兼容的游戏,它在整个过程中,不会思考这个问题。而思维链的模式,它会站在整个问题的角度,来思考这个问题该怎么回答。它会把这个问题进行分解,然后按照不同的步骤来做。由于按照不同的步骤来做,中间在内部需要调用很多次大模型,这种结果就是要增加算力的消耗。如果把一个问题思考越深,他回答结果的准确性和可参考性都越强。从思维链模式上来看,它给出一个更好的答案,但需要消耗更多的算力。

  

资料来源:瀛赐基金整理

思维链的模式也意味着Post Train的Scaling Law仍然有效。在当前大型模型发展的背景下,o1 表现出的 Inference Scaling Law,即推理(Inference)过程中的scaling law成为了业界的关注焦点。黄仁勋在CES上持续看好后续算力需求,Scaling Law从预训练、到后训练,再到推理(Test-Time)生命周期不断延长叠加。所以 AI Agent的出现,为这个行业发展提供了更好的一个方向。

从整个市场空间上来看,因为2024年作为刚提出的一年,那么在2025年可能开始在产业化会有一些更多的应用,从未来看,它会成为一个非常重要的驱动源。到2035年的话,就是未来十年,整个行业的CAGR增速能够达到百分之四十左右,是一个增速非常高的产业。

资料来源:瀛赐基金整理

02

AI Agent训练和推理算力增长持续



第二部分主要介绍下AI Agent的基础设施。因为AI Agent的运行离不开基础设施,对比移动互联网时代,移动互联网的发展离不开基站,离不开数据中心。这些基础设施提供跑道,在跑道之上,AI Agent才可以运行。

在这一部分,我们主要汇报四个方面:1、AI训练的芯片到算力集群,追求更强的性能;2、AI推理的定制化芯片,带来更高性价比;3、数据通信:低功耗需求推动技术变革;4、国产算力:海外限制带来的机遇。

1、 AI训练:从芯片到算力集群追求更强的性能

首先看芯片,训练芯片离不开通用的 GPU。英伟达作为AI训练芯片最核心的一个供应商,实际上从2022年开始就加快了产品迭代速度。2022年之前英伟达GPU 的迭代速度基本上每两年迭代一次。目前来看,它加快迭代速度,每年会升级一下这个芯片。它升级的方向,简单来理解,就是一方面要增加 GPU 的面积,然后另外一方面,就是要增加这个 GPU 周围的计算单元密度,同时增加 周围HBM也就是存储的容量。把芯片做大这种思路效果还是挺明显的,过去每一代芯片运算效率都有一个大幅的提升。过去八年的话,运算芯片的算力也能够实现上千倍的提升。

资料来源:NVIDIA,瀛赐基金整理

从运算效果上来看,每一次迭代之后,计算的效率提升还是非常明显。

另外,英伟达 GPU 采购的主要客户是北美的大云厂商,大云厂商之间也有竞争。如果某一家率先运用这种效率更高的新一代芯片,那么就意味着它对竞争对手来说会有能力和性价比的跃升。所以英伟达加速产品的迭代速度,会导致竞争对手更加积极的去采购,产生竞争焦虑。而对英伟达的地位来说,可以进一步巩固。

资料来源:瀛赐基金整理

2025年我们还要关注一个非常重要的变化,在半导体产业里,新一代2nm的先进制程开始投产,主要是台积电新的工艺。一旦2nm制成投产之后,对于半导体来说就是会带来一个新的技术变革的机会。也就意味着单位面积上能够放的晶体管数量更多了。我们看到英伟达,它主要思路是把整个芯片面积扩大,那么台积电的思路就是把单个晶体管占的空间缩小,提高单位面积的晶体管的数量,通过提高密度、增加面积这两种方式相结合,就能够实现算力芯片,单颗芯片算力的持续提升。

有了GPU之后,要把芯片用起来,就是要先把芯片放到服务器,然后把很多服务器再连接起来,实现芯片内部的互通。从目前来看,全世界最大的数据中心的算力集群可能已经超过十万卡,XAI的10万卡集群在2024年投入运行,XAI明确会把它这个数据中心从十万卡进一步扩充到30万卡。在博通的季报和投资者交流中也提到,未来至少有三家客户会建立一个百万卡的集群,相当于目前最大的数据中心算力集群的十倍。百万卡集群确实非常震撼,因为如果按照单个芯片耗电,2000到4000瓦的话,建一个百万卡集群,也就意味着一小时要耗电200万度到400万度电。这么庞大的算力集群在全世界能够承担得起的厂商,是屈指可数的。

2、 AI推理:定制化芯片带来更高性价比

下一个阶段是推理,推理阶段,AI模型需要和客户进行交互。庞大规模用户群体的交互需求,对芯片的计算速度和能效的要求会比较高。很多的云厂商他会采用一些定制化的芯片,也就是ASIC。比如谷歌,根据自己所需要的功能直接去和芯片设计厂商合作,定制一款谷歌自有的芯片。从效果上来看,像谷歌 TPU,它的cost performance ratio明显超过英伟达的H100、B200的芯片。所以在推理端,ASIC具有更加明显的性价比,所以未来它的应用空间是非常广的。目前来看,除了谷歌,还包括亚马逊,META,微软,特斯拉这样公司,都会有自己的定制化芯片,满足更多个性化需求。从供应链的角度来看,台积电也已经明确把它的产能预留一部分给到 ASIC芯片。从时间维度上来看,在 ASIC 芯片定制化方面未来几年都会更加密集。

资料来源:Morgan Stanley Research,瀛赐基金整理

以上就是训练芯片和推理的算力,这些算力的采用离不开主要云厂商的资本开支。在2024年,云厂商在总资本开支里,大概有50%用来采购AI相关的半导体。再往后来看,这个比例还有进一步的提升空间。一方面,云厂商资本开支在未来几年预期还会持续增长;同时,AI 芯片在资本开支里所占的比例也会进一步提升。另外一个角度,从供给端来看,包括像台积电的产能,因为它代表了 AI 芯片一个增长的趋势,2025年相对于2024年还会有一个翻倍的增长。所以供需两端来看,算力的需求还保持一个强劲的增长,但算力的需求结构会发生一些变化。最主要的就是推理的增速会超过训练端。字节的火山引擎开发者会议上提出,2028年推理的算力会超过训练的算力。所以在总体的算力结构上会发生一些趋势性的变化。

资料来源:瀛赐基金整理

资料来源:瀛赐基金整理

3、数据通信:低功耗需求推动技术变革

有了 GPU 之后,我们要考虑把 GPU 连起来,形成一个更庞大的算力集群,离不开数据中心的数据传输通讯。通信随着 AI 训练和 AI 推理这样一个工作量的提升,他们对带宽的需求也是持续攀升的。但是随着数据中心带宽提升,网络设备在整个数据中心里面所占的功耗也会有一个显著的提升。如果一个数据中心,它的功耗持续提升的话,意味着整个数据中心的运营成本是非常高的。在这种高成本之下,就一定要想办法通过技术手段来解决这种高耗。通过一些更集成化的方式减少能耗的损失,那比如说采用硅光芯片。在光模块中采用硅光芯片,硅光意味着更低的信号损失。通过这样一种方式减少功耗。所以硅光技术在2025年会得到一个更大范围的应用,从2022年到2028年,产业的增速也能达到40%以上。

资料来源:瀛赐基金整理

资料来源:瀛赐基金整理

另外一个技术就是 CPO 的技术。传统的可插拔光模块在交换机一端,光模块接收到光信号之后来把光信号转换成电信号,转换成电信号之后,电信号在交换机的 PCB 上,要传输到交换机的处理器上,中间大概有20到30厘米的传输距离,但是20到30厘米的传输距离,对于信号损耗是非常大的。电信号传输,随着传输速率的提升之后,它这个损耗会提升非常明显。所以在未来,带宽要求进一步提升,那也就意味着带宽的损耗,即信号损耗更大。那想办法要解决这个损耗,就是要把20到30厘米的在交换机中电信号传输进一步压缩。所以把光模块中的光引擎直接集成在交换机处理器的旁边可以减少这种信号传输,这个集成就是被称为CPO 。有了这种 CPO 之后,它功耗下降非常明显的。那么随着 CPO技术的成熟之后,未来可能在服务器端,也就是在 GPU 的信号传输中可能也会和光引擎直接进行一些封装,这个被称为 optical I/O。2025年 CPO 的交换机会推出,2026年放量,到2028年左右, GPU 端的这种OIO 技术开始应用。所以,未来如果展望5-10年,CPO产业趋势还是非常强。而CPO 如果一旦发展的话,不可否认的就是光模块,传统的可插拔光模块,在技术路线上还是受到一定的负面影响。

资料来源:瀛赐基金整理

4、国产算力:海外限制带来的机遇

回到国内来看,国内的算力目前也遇到了一些更好的发展机遇。前几天美国推出了各种,对中国的一些出口限制措施。这些限制措施,其实是从整个半导体产业链,从上游的设备,到晶圆厂,到 AI 的芯片,再到 AI 的云端算力,全方位、全球范围内进行管控。目标只有一个,就是限制中国 AI的发展。这样就倒逼中国自己必须发展自己的 AI 算力。从需求端来看,国内有非常强劲的需求。国内为算力买单主要有两类厂商,一类就是互联网这些大厂,另一类就是运营商。2024年这些大的买家都大幅增加了自己的资本开支力度,所以会有更多的资金投入到 AI 算力上。从算力本身的技术条件上看,至少跟海外,我们能买到的海外这种芯片的技术差距在缩小。但和海外最先进的芯片来比,这个差距缩小难度还是比较大。

资料来源:瀛赐基金整理

03

AI Agent应用从性价比到创新



第三部分,我们汇报下 AI Agent 的应用。应用端来看,核心驱动因素就是成本的下降,只有性价比提升,大家才会去用这些东西。应用的话又分为两个方面,一类就是 TO B 端,另外一种就是 TO C 端。

1、成本下降推动应用崛起

首先,AI 推理的价格在持续下降。据 Artificial Analysis,Open AI 在 2023 年6 月发布 GPT 4,每百万 tokens 的 API 输入/输出价格分别为 30/60 美元;横向对比 2024 年5 月发布的 GPT4o,其每百万 tokens 的 API 输入/输出价格分别下降至 5/15 美元(截至 2024年 5 月 Artificial Analysis 测算价格),下降速度是非常快的。像火山引擎推出这个豆包的 API,这个价格跟行业价格对比,直接砍掉了85%。所以目前来看,各大模型厂商,他们的 API,数据输入和输出这两项成本都在急剧下降。这种成本的下降带来整个行业应用的蓬勃发展。以豆包为例,豆包每天处理token 的量,在过去半年多的时间里,增加了几十倍。另外,像 GPT 它每周的用户数量也在持续创新高。所以意味着,这种性价比提升带来的需求的暴增。

资料来源:瀛赐基金整理

2、B端生产工具升级,目标是成本优化

在 B 端来看,像海外的 Salesforce、ServiceNow、Workday这样一些公司都推出了 AI Agent的产品。Agent的应用从两个角度来看,一类就是它用来干什么,比如说生成代码,然后包括聊天机器人的作用占比是最高的;另外一类,从应用的具体领域来看,企业哪些部门在用,首先用的最多的就是 IT 部门,因为他们要写代码。另外像客服,然后还有一些产品部门,用的比例也会比较高。B 端来看,应用的领域还是非常广泛的,能够做的事比较多。我们来看两个例子,一类就是软件开发的 AI Agent。以微软的GitHub的统计,采用 GitHub的帮助,开发者在写代码过程中,错误率非常低。一次性通过的概率是从完全人工做的39%提升到了60%。这个很明显就表现出 AI 在辅助人去写代码过程中,它错误率是大幅下降。

资料来源:瀛赐基金整理

另外, Agent 能够完全替代人去做一些软件工程的事情。比如向Agent 下达一个编写一个工具的任务,这个 Agent 它会根据开发者提供的一些信息,进行一些上下文的搜集之后进行分析,把这个工具的功能,进一步进行拆分之后再进一步表述出自己的这样一个流程。这个流程之后,它会去把每一个流程里边需要的代码进行填充,然后自动完成这样的软件工程任务。AI完全替代了一个人工,它不光是帮人工去写一段代码,而是直接完成了一个软件的任务。所以,以后人人都可以去写一个软件。

另外一个案例, AI 语音的营销助手给一个潜在的客户打电话,向人推荐一款手机,并且帮助这个人在电话里边下单,完成了整个手机的购买。他整个过程中会根据这个客户的潜在风格、潜在特征,给他推荐不同颜色,不同价格带的手机,然后最终完成这样的交易。完成这个交易之后,他还会进一步学习,通过这个学习进一步优化他的营销策略。

这两种其实只是诸多 AI Agent 中的两个范例。AI Agent已经能够从某方面完全替代人工。像微软,它推出了非常多的 AI Agent,涵盖了营销、运营,财务对账,然后还有时间管理,会议管理各个领域。在一些功能上,比如说像销售团队能够实现收入9.4%的提升,成交数量也有20%的增加。通过这种方式能够大幅提高员工的工作效率。所以从 B 端来看的话,长期的目标就是实现降本提效的作用。

资料来源:瀛赐基金整理

根据 Salesforce 的统计,假如说一个公司有20个客服在每天打电话,每天打电话30次。如果按照20个客服每人的成本,年薪就是6万美金。假如说他工作量中10%交给这个 Agent,那么三年下来,就可以节省大概20万美金的成本,也就相当于完全减少一个人员的三年的资本开支,相当于直接砍掉了一个员工的成本。在这种降本增效的趋势之下,Agent 在 B 端应用的空间还是非常大的。

3、C端侧硬件作为入口,产品百花齐放

我们再来看 C 端,C端主要商业模式,比如说像字节,它通过建立自己的一个云端的算力后,再推广自己端侧的一些产品。比如说产品之后,一定要让客户去用,那客户怎么去用,又怎么去接入他的产品。所以一定要掌握 AI的进入口。过去很多 APP 的厂商要分发 APP,然后一定要在手机上占领一个位置一样,有了这样一个 AI 进入口之后,这些大云厂商他们才能够实现一些增值服务,订阅服务,实现一些商业模式的落地,这样就形成一个商业模式的闭环。所以对大厂商来说,核心一定要掌握这个 AI Agent 的一个入口。

资料来源:瀛赐基金整理

现有的价值量最大的一个入口,其实就是手机。从功能机到智能机,其实从单一的一个搜索框,演变到了一个很多 APP 共同的应用,我们可以通过界面去接触很多应用。比如说订机票应用,订餐的应用,或者一些办公的应用。这些应用,我们都是通过一些图形化界面来操作的。那未来,通过 Agent 的介入之后,很多功能可以直接通过语音来解决,通过语音直接告诉手机去做什么。那么更进一步的话,远期来看,很多 APP 可能是直接隐藏为背后的一些功能,Agent 会调用哪个功能,完全是 Agent 说了算,手机厂商会成为一个单一的超级入口。以 iPhone 为例,iPhone 会变成一个超极大入口,背后所有的应用可能都离不开这样一个入口。那么背后的应用,比如说我们要去订个餐,这个应用可能是美团,也有可能是饿了么,到底是用哪个,其实我们也不知道。那背后它总有一种选择的机制,在这种选择机制之下,这个入口的价值会进一步提升。

资料来源:联发科技,瀛赐基金整理

资料来源:联发科技,瀛赐基金整理

掌握这个超级入口,就是他们的价值量。就是说他们的附加值会有一个极大的变化。所以我们可以看到,苹果前一段时间,它的估值出现一个极大的提升,就是难以理解的一种提升。背后隐藏了一个逻辑,就是苹果,它可能会掌握未来的超级入口,它会获得更强大的附加值。

资料来源:中金公司研究部,瀛赐基金整理

除了手机之外, AR 眼镜也可以做一个入口。它可以帮我们去识别一些产品,然后可以帮我们做翻译,或者帮我们去扫二维码,通过摄像头,通过麦克对话来解决。耳机其实也类似,通过语音对话实现更多的功能。更广泛来看,像戒指、玩具,还有应用到教育,应用到机器人方方面面,其实都可以通过这样一些入口来渗透。Agent在整个人的生活中可能会遍布各个领域。所以这些巨头都在想尽各种办法去抢占这样一些入口,像豆包它会接入到耳机模型,也会接入到眼镜里,也会接入到很多玩具和教育的应用上。因为只有掌握这些入口之后,客户才会去用。那么对于这些大厂商来说,他们才有自己的商业模式,才能实现更多的变现。

资料来源:中金公司研究部,瀛赐基金整理

如果展望下一个 AI Agent的时代,硬件终端会有一个极大的变革。回顾过去70年,基本上每隔 15-20 年,创新的积累就会导致计算行业发生结构性转变。目前,我们已经从手机、服务器时代向物联网/并行处理时代的转变。参照历史经验,每个时代的单位规模都是前一个时代的 10 倍左右,AI agent时代,多种智能硬件终端具备交互功能,智能终端的数量将远超手机时代。因为它会遍布我们生活的各个角落,只要有一个终端端侧的 SOC 算力芯片,再加上通信模组,再加上一些语音图像传感器,它就可以解决很多问题。总体来看,整个 AI Agent时代,可以让我们的生活变得更加美好。

资料来源:瀛赐基金整理

最后,从投资上来看,AI发展的大趋势下,需要紧密跟随技术的细微变化,在受益程度上,会存在此消彼长的情况,需要及时调整布局方向,才能够在投资中实现更好的收益。



风险提示:

本文件非基金宣传推介材料,仅作为本公司旗下基金的客户服务事项之一。本文件所提供之任何信息仅供阅读者参考,既不构成未来本公司管理之基金进行投资决策之必然依据,亦不构成对阅读者或投资者的任何实质性投资建议或承诺。基金有风险,投资需谨慎。本文所载的意见仅为本文出具日的观点和判断,在不同时期,瀛赐基金可能会发出与本文所载不一致的意见。本文未经瀛赐基金书面许可,任何机构和个人,不得以任何形式转发、翻版、复制、刊登、发表或引用。



END


瀛赐基金

    海纳百川

    瀛在净值


复制搜一搜分享收藏划线




恭喜解锁12个月手机L2专属领取资格,立即领取>>

追加内容

本文作者可以追加内容哦 !