$东华软件(SZ002065)$   

自2023年落地首个大模型项目开始,我们就在团队内部设立了目标:在有限时间与有限信息的前提下,用最高效率、尽量少的算力,达成最低错误率的结果,以此保证可控成本与效益最大化。

为达到这一目标,我们在模型结构、数据质量、Prompt Engineering、Agent 等多个环节投入了大量精力,力求在参数规模相对较小、用户数据不完全达标的情况下,依然满足预期并实现成本可控。

即便如此,有些AI大模型应用项目的算力成本依然占总成本的一半以上。正如我常戏称:“应用厂商成了给GPU厂商的打工的”,这绝非正常现象,这个世界不应该这样!

天下苦英伟达久矣!

DeepSeek-V3 展示出的新技术路径至少证明,通过架构优化和精度改进,能显著降低对算力资源的需求,从而为未来大模型的发展带来更加可持续的选项。

当基础设施处于起步阶段时,单位成本往往高得惊人,阻碍市场的广泛撬动;一旦基础设施成本下降,触发网络外部性或规模经济,便能催生更多产业升级与创新。

DeepSeek 的推理能力做到与GPT 4o 和 Claude 3.5 Sonnet 相当,但是算力仅用了前两者十分之一,如果是这样的话,算力还会紧缺吗?这对算力市场可能会有很大的影响 。

硬件优化、算法创新以及政策扶持,都可视为降低算力开销、激活市场潜力的有力抓手。DeepSeek V3 的出现,为行业提供了一种更高效的工程化思路,让我们看到了兼顾技术突破和成本控制的可能性。当基础设施的成本下降时,其服务的可及性、普遍性都会显著提升;这会降低创新者的进入门槛,从而带动大量新产品、新模式、新场景的涌现。

摩尔定律的启示

我们可以参考摩尔定律,摩尔定律带来的芯片性能飙升与成本下降,让计算机与互联网技术迅速普及,逐渐演变为数字经济的基石。同时摩尔定律不仅是技术命题,也是产业分工的结果:从设备商(如 ASML)到晶圆代工厂(如台积电)再到设计公司(如英特尔、AMD 等),整个产业链形成了一整套标准化、专业化的协同模式,通过量产规模来摊薄研发和生产成本。即得益于行业大规模化协同与又得益于投资驱动。

2023年黄仁勋曾说:“ChatGPT是通用人工智能的iPhone时刻”,但经过一年多的情况来看,黄仁勋“过于乐观”了,他的表述更多是“愿景”,而非事实,AI大模型根本不具备 iPhone当年在基础设施、技术标准、开发者生态等相当的环境。

2007 年的 iPhone 时代的移动网络与操作系统等基础设施相对成熟,而当前的AI 算力与模型训练仍在快速演化阶段,硬件与框架尚未形成事实标准。且iPhone 推出后移动网络、开发者生态和消费者习惯很快就大规模融合;ChatGPT 虽然引爆了AI热潮,但其后续的大规模落地仍需更长的技术迭代周期。移动应用门槛相对低,任何开发者或公司都可在标准化硬件上开发 App,面对海量消费者。模型训练与部署对算力和数据要求极高,大规模普及的速度与路径更复杂。

我们认为,在这样的生态碎片化的情况下,要想打破英伟达的技术壁垒和生态壁垒举步维艰。如果构建开源的标准化的共享软件框架技术生态体系,可能更有利于国产GPU产业的快速推进。

场景是未来算力投资的重中之重

前段时间,在与某地市主要领导沟通智算中心落地事项和与一些潜在大客户交流时,出人意料的是不管是政府领导还是企业负责人,都十分关注一个问题:落地智算中心的未来应用场景是什么?

智能中心投资逻辑将较前几年会发生转变,但这是好的转变。基础设施的建设驱动力开始考虑“需求驱动"因素,只有基于真实需求,才避免制造“虚假繁荣”,AI产业链上的企业和平台才会获得正向、可持续的发展循环。

从真实需求场景落地,就要尊重市场规律,就要考虑客户预算和成本。如果仅仅依赖投资驱动而无产业需求落地,没有清晰可行的可落地的商业化路径,仅用“融资额”“估值”来衡量项目成功往往不靠谱,可能会沦为金融资本的击鼓传花的游戏。

AI产业需要投资驱动与需求驱动两大动力的相互作用。产业协同与生态共建,政府-企业-科研机构-风投等多方联动,共同形成一个良性生态体系,才能将初期的投资驱动有效衔接到后期的需求爆发与产业升级。

Agent智能体是不错,但不足以撑起AI大模型应用

从2024这一年的论文还是产品路线来看,AI Agent的是有发展前景的,是备受关注的,但可能没有一些宣传的那么神奇。

AI Agents(智能体) 现在市面对它的定义也很乱套,实际上AI Agent应该叫 LLM Agent(大模型代理)更合适。“Agent”一般会翻译成“代理”,把Agent翻译叫“智能体”的人真是个天才。


为了克服这些挑战,需要从多维度入手。我们团队已经在Agent产品的研发上投入了不少精力,从近一年实际产品研发的情况来看,Agent恐怕并不是AI大模型应用的杀手级技术解决方案。

在算力成本居高不下、大模型尚未成熟且缺乏杀手级应用的当下,创业的核心是“价值耦合”,即在合适的垂直场景中,用精巧或差异化的方式,将现有大模型/AI 技术与行业需求精准结合,形成可见的商业价值。

AI 大模型的未来仍充满变数,但可以肯定的是,以用户价值为导向、深度融合行业场景、构建可持续商业模式,才有望在这场“下一次技术革命”中屹立潮头、行稳致远。

追加内容

本文作者可以追加内容哦 !