2026年2月,中国AI产业迎来历史性时刻:中国大模型的周Token调用量首次超越美国,并在随后一周进一步扩大领先优势。根据全球最大的AI模型API聚合平台OpenRouter的数据,2月16日至22日当周,中国模型周调用量高达5.16万亿Token,三周内暴涨127%,而同期美国模型则跌至2.7万亿Token。更引人注目的是,在全球调用量前五的大模型中,中国产品占据四席,标志着中国AI正从“追赶者”变为“领跑者”。

  中国AI集群崛起:四款大模型霸榜全球前五

  这次超越并非依赖单一明星产品,而是中国AI厂商的集体爆发。在2026年2月第三周的OpenRouter榜单上,MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5和DeepSeek的V3.2四款国产模型强势包揽前五中的四个席位,合计贡献了Top5总调用量的85.7%。

  其中,MiniMax于2月13日发布的M2.5模型上线不足一周便登顶榜首,在2月9日至15日那一周,仅这一款模型就为平台贡献了1.44万亿Token的增量,占当周总增长量的近一半。月之暗面的Kimi K2.5凭借原生多模态架构和可调度多达100个“Agent分身”的并行处理能力,效率提升3到10倍,发布不到一个月的收入已超过其2025年全年总收入。智谱的GLM-5则以200K超长上下文窗口和对长程Agent任务的优化,上线次周调用量即达0.8万亿Token。

  值得注意的是,尽管阿里千问单个模型上榜频率不高,但其全系列模型的总调用量在过去一年达到5.59万亿Token,位居全球第二。在中国B端市场,千问系列的日均Token调用量占比在2025年下半年已达32.1%,相比上半年几乎翻倍,领先字节豆包和DeepSeek。

  上海财经大学特聘教授胡延平将这种格局称为“AI中国团”,认为多家头部企业形成的宽广技术群落,有利于创新竞争和人才生态建设,也增强了中美AI竞争中的集群优势。

  成本碾压:中国模型价格不到美国1/10

  中国AI之所以能迅速席卷全球开发者,除了性能比肩国际顶尖水平外,极具竞争力的成本是核心杀手锏。以OpenRouter平台价格为例,MiniMax M2.5和智谱GLM-5的输入成本仅为0.3美元/百万Token,而美国主流模型Claude Opus4.6高达5美元,是中国模型的约16.7倍。

  在输出环节差距更为惊人:MiniMax M2.5输出价为1.1美元/百万Token,智谱GLM-5为2.55美元,而Claude Opus4.6高达25美元,分别是前者的22.7倍和9.8倍。

  这一成本优势源于两大关键因素:一是算法层面的“混合专家(MoE)架构”,通过只激活与任务相关的部分“专家网络”,大幅降低计算量,使显存占用减少60%,推理量提升高达19倍;二是“垂直整合”模式,如阿里巴巴的“通义-云-芯”体系,实现算法、云计算与AI芯片的一体化协同优化,最大化硬件利用率,进一步压缩基础设施成本。

  a16z合伙人Martin Casado观察到,如今硅谷80%寻求融资的AI初创公司,其路演所用的核心模型都基于中国的开源模型。

  Token正在成为AI时代的“燃料”

  Token消耗量的激增背后,是AI使用模式的根本转变。国联民生证券提出“Token通胀”概念——用户单位时间内的Token消耗结构性上升,源于三大趋势:从“问答”转向“干活”、AI Agent普及、以及推理强度上升。

  编程、文档生成等场景天然消耗大量Token,而Agent会主动规划、执行、反思,多次调用模型,导致Token按步骤累加。用户愿意“增加Token投入来换取效率”,因为这往往意味着更高成功率和更少返工。

  英伟达CEO黄仁勋在2月26日业绩会上强调:“计算即收入”“推理即收入”。他指出,没有算力就无法生成Token,没有Token就无法带来收入。在全球电力瓶颈凸显的背景下,“性能/瓦特”已成为衡量AI服务效率的关键指标。

  弗若斯特沙利文李庆预测,未来AI商业模式将向“燃料+成果”混合模式演进:Token单价持续下降,但企业更愿为直接成果付费,催生订阅制与多维度动态定价体系。摩根大通预计,2025至2030年,中国Token消耗量年复合增长率将达330%,五年内增长370倍。

追加内容

本文作者可以追加内容哦 !