在东方财富看资讯行情,选东方财富证券一站式开户交易>>

作者 | 雷教授

来源 | 路边消息社
导语:技术创新很难复制,否则,拥有技术的大模型六虎,怎么还在挣扎融资和降低成本中不可自拔?

这帮做量化的,捅了大模型的老巢了?


笔者了解到一个最新消息,梁文锋的幻方量化老对手、量化巨头九坤,携手微软团队成功复现DeepSeek-R1,还首次发现了语言混合(例如中英文夹杂)会显著降低推理能力等问题。


怎么又是做量化的?


这还没完,另一量化巨头宽则在2月24日发布了智能学习实验室人才招聘通知,宣称该实验室将朝着整个人工智能启航。

这真是量化人才捅了大模型的老巢?

笔者问了身边的投资人朋友,“难道以后要去量化机构投资大模型团队了?”一些关注AI领域的投资人的第一反应都是:什么?难道我们要找关系拜访王琛了?

一个评论一针见血:见不到梁文锋,还见不到王琛吗?

这个评论提及的王琛,就是九坤的创始人。

介绍王琛之前,分享一个趣事。其实在梁文锋(浙大毕业)之前,大多数做大模型的都是清华系的,去年下半年,月之暗面在内的大模型六虎估值飞上天的时候,不少投资人想要看类似的、便宜一点的项目,不论是深圳投资人还是上海的,绝对会来北京,去中关村、清华周边挖一挖。

就算是梁文锋在北京的办公室,也距离清华不远,为的就是招聘相关的算法人才。

好像只有清华,才是大模型根红苗正的老家。

但这个王琛,还真又是清华人!不仅清华毕业,还是数学物理学士、理论计算机博士。他曾就职于华尔街对冲基金千禧年,2010年前后,恰逢国内股指期货上市,身在美国的王琛认为国内机会千载难逢,同年和姚齐聪(北京大学数学学士、金融数学硕士)一起回国创业。

其实,之所以这些做量化的纷纷进入大模型领域,有两个原因,其一是做量化本身就需要算法支持,比如九坤内部,设置了三大内部实验室(Data Lab、AI Lab、水滴实验室)和一个外部联合实验室(九坤—IDEA联合实验室),算是有了一些基础。

但更重要的一个原因是,就是做量化的时候,他们已经囤积了一些高性能芯片。

按照笔者的了解,在云算力端,当时除了几家互联网公司(商汤、百度、腾讯、字节、阿里),就只有幻方有超过1万张A100芯片储备。

一家需要GPU做量化的金融机构,囤积一些显卡很正常,但买了1万张,比肩国内头部互联网大厂,甚至还自己建起了集群,就很魔幻了。

而九坤这边,同样也有自己的囤货。

再分享一个好玩的故事,去年11月的时候,黄仁勋到港大参加活动,为了迎接他,香港特区政府财政司长陈茂波组局,邀请了英伟达 CEO黄仁勋、香港科技大学校长叶玉如院士、校董会主席沈向洋、红杉中国沈南鹏等人。

当时,很多人看到了香港最火的大排档爱文生,也关注到了许久未露面的沈南鹏,但其实,九坤的王琛也在其中。

一家量化公司的老板出现在黄仁勋的旁边,面带笑意,也足以说明,对于量化公司,算力的重要性。

而这也是为什么九坤能杀入大模型领域的重要原因。

当然,除了内核的驱动之外,还有一个浅显的原因,就是梁文锋太火了,大家都想要复制他的成功路径,但技术创新很难复制,否则,拥有技术的大模型六虎,怎么还在挣扎融资和降低成本中不可自拔?

但业内的这一反应也足见,当前的一级市场,不追大模型,就是错失一个时代。

谈到一级市场,业内有个名字FOMO,指的是fear of missing out,大意就是害怕错失项目投资机会,从而漏掉一些顶级项目。但充满悖论的是,错过项目又是风险投资行业的必然。

上百家一线投资机构集体错过DeepSeek并不可怕,他们可能最担心的是,当出现了另一个有力的竞争者时(且这个竞争者估值没有DeepSeek那么昂贵),仍然没有投进去。

虽然量化领域跑出了梁文锋,但并不意味着其他机构也能复制这样的成功,更多的量化机构入局,大多数仍然停留在刚起跑和宣传层面。

但路边消息社也想提醒一句,大模型虽好,但目前仍在发展的较早阶段,未来,还是要看大模型和行业结合孕育而出的产品。要不然,烧了钱、投了资,最后距离商业化太远,还是不靠谱。

最后提一句,九坤的总部在北京。这下北京也能放松一下了,终于不用被杭州压着脑袋打了。


恭喜解锁12个月手机L2专属领取资格,立即领取>>

追加内容

本文作者可以追加内容哦 !