导语:ChatGPT让Meta乱了阵脚。 金融时报ft访谈了杨立昆(Yann LeCun): 2025年初的巴黎大皇宫,马克龙正在主办一场国际AI峰会。 会场外不远处的米其林星级餐厅Pavyllon里。 Yann LeCun坐在两棵塑料圣诞树之间,戴着标志性的黑色雷朋眼镜,看起来精神不错。 这位被称为现代AI"教父"之一的科学家,刚刚结束了在巴黎一周的密集行程。 过去这些天里,他不是在策划什么"世界统治",用他自己的话说,是在推进"全球辅助",或者叫"智能放大"。 毕竟,"统治"这个词放在AI语境下,听起来确实有点吓人。
一条新闻打乱的节奏 上次公开露面时,LeCun还是Meta的首席AI科学家,正在展示他对超级智能机器的最新构想。 现在,他准备离开这家工作了十多年的公司,为一家新创公司融资,要把那个构想真正做出来。 英国《金融时报》抢先报道了他的离职消息。 "这基本上逼着我们把时间表往前赶了," LeCun说。 消息出来后,马克龙给他发了WhatsApp。 虽然LeCun不愿透露总统说了什么,但能看出来,对方挺高兴这家新的"全球性"公司会跟法国保持紧密关系。 LeCun不会去当新公司的CEO,而是做执行主席。 这个安排能让他像在Meta时那样,保持做研究的自由度。 "我是个科学家,算是有点远见的那种。我能让人们对有意思的事情产生兴趣,也挺会判断哪种技术靠谱。但让我当CEO真不行,"他说,"我这人太没条理,年纪也大了。" 服务员端来香槟。记者点了无酒精的白中白,这位葡萄酒爱好者也好奇地想尝尝。两人碰杯。 聊天中,记者提到自己怀孕了,开玩笑说也在培养自己的超级智能。 "那确实是最高效的方式," LeCun笑着回应。
大语言模型这条路走不通 说到培养智能,LeCun确实有发言权。 几十年来,他一直在琢磨怎么让机器产生智能。 他也一直毫不客气地表达对大语言模型(LLM)的看法:这玩意儿到不了超人类智能那一步,尽管硅谷现在对此痴迷得不行。 他的逻辑很清楚:LLM有用,但本质上被语言框死了。要达到人类水平的智能,得理解物理世界怎么运转。 他的解决方案是一种叫V-JEPA的架构,也就是所谓的"世界模型"。 世界模型通过学习视频和空间数据来理解物理世界,不只是语言。 它们还能规划、推理,有持久记忆,他把这种智能叫做"高级机器智能"(AMI)。 1960年出生在巴黎郊区的LeCun,从小就对人类智能怎么来的这个问题着迷。 八九岁时看的《2001太空漫游》,把他送上了今天这条路。 说到这里,他做了个脑袋炸开的手势。 LeCun父亲是航空工程师,"有点发明家气质",让他从小爱上了造东西和修修补补。 LeCun造模型飞机,吹木管乐器,竖笛和克鲁姆管这种"奇怪的文艺复兴乐器"。 他还在一个文艺复兴舞曲乐队里演奏过。 两人都选了四道菜的"香榭丽舍"午餐套餐。 LeCun的前菜是软煮蛋、金枪鱼鞑靼配烟熏白斑狗鱼子和油煎面包块,记者的是根茎蔬菜清汤和辣根馄饨配查特酒汁。 LeCun讲起自己的故事。 有个老师觉得他数学太差,不适合学数学,所以他去学了工程。 服务员过来询问,LeCun点了杯勃艮第的Chassagne-Montrachet。 "美国人管这个叫霞多丽," 他打趣道。 所有东西都是学出来的。 LeCun的顿悟发生在1980年代。 当时他在巴黎高等电工电子工程师学院读书,读到一本书,讲语言学家乔姆斯基和心理学家皮亚杰关于先天和后天的争论。 乔姆斯基认为人类天生就有语言能力,皮亚杰则说虽然有些结构是天生的,但大部分靠学习。 "说这话可能得罪人……但我当时读着就觉得,乔姆斯基说的肯定不对,因为我们什么都是学来的。智能说到底就是学习这回事。" 那个年代,AI研究,或者说神经网络研究,基本是个死领域,被学术圈视为禁区,因为早期技术让人失望透顶。 但LeCun找到了其他研究神经网络的学者,在Geoffrey Hinton这些人身上找到了知音。 后来他以博士后身份加入了Hinton在多伦多大学的团队。 两人和Yoshua Bengio一起,为深度学习和现代AI打了地基。 2018年,三人因此拿到了计算机科学界最高荣誉图灵奖。 服务员端上第二道菜,用法语热情介绍。记者一脸茫然地点头。 "听懂了吗?" LeCun问,然后帮忙翻译:这是鹅肝,这是康泰奶酪舒芙蕾,奶酪陈了18个月。 入乡随俗,记者咬了口鹅肝。
贝尔实验室的好时光
LeCun搞出过一些重要的早期AI技术。 1980年代末到1990年代,他在新泽西的AT&T贝尔实验室当研究员,开发了卷积神经网络,这种架构后来被广泛用在图像识别上。 他把它做成一个系统,被银行拿来读支票。 这个研究的想法在多伦多时就有了,但能真正落地,靠的是贝尔实验室看似花不完的钱和最前沿的技术。 LeCun记得刚加入时,老板Larry Jackel跟他说的话:"他说,知道吗,在贝尔实验室,你不会因为省钱出名。" 主菜上来了,裹着香草面包屑的鳕鱼配炸刺山柑。 LeCun兴致很高,讲起AI研究早年的故事,记者听得入神。 贝尔实验室的好日子没能一直持续。 公司重组,实验室资金大幅缩水,被拆分到不同子公司。 LeCun回到学术界,在纽约大学启动了研究神经网络的新项目,课后常去格林威治村的爵士俱乐部。 到2013年,深度学习明显要成了,图像识别应用效果惊人。 谷歌刚启动Google Brain,一年后收购了英国AI实验室DeepMind。 也是那时候,扎克伯格打来了电话。
Facebook的白板时代
扎克伯格想在Facebook搞个AI部门,为了挖LeCun,把他请到加州家里吃饭。 私人厨师准备了"鸡肉 + 挺不错的白葡萄酒",LeCun回忆道。 LeCun答应加入,但提了三个条件: 不用辞掉纽约大学的工作;不用搬去加州;新实验室的研究成果必须公开。 扎克伯格全答应了。 LeCun就这样加入Facebook,在这家全球最大的科技公司之一建立了专注基础研究的新AI实验室,叫Facebook人工智能研究院(Fair)。 Facebook当时就是"一块有无限授权的白板",LeCun说。"钱肯定不是问题。" 服务员端来甜点,苹果薄饼。"太棒了," LeCun说。 ChatGPT带来的震荡 话题转向更动荡的时期。 2022年初,ChatGPT出现之前,各大AI实验室手里都有类似技术,但基本当实验品看。 结果一个相对不知名的小实验室 OpenAI,悄悄把这技术做成好用的聊天机器人推出来,引爆了今天的AI热潮。 ChatGPT让Meta乱了阵脚。 公司高层决定全力开发Llama,一个大语言模型。 扎克伯格重组了架构,成立生成式AI部门,要加速把研究变成产品,LeCun坚持模型要开放。 Llama 2以开放权重发布,所有人都能免费下载调整。 LeCun说这是个 "分水岭" 时刻,"改变了整个行业"。 这个模型成了强大开放LLM的标杆,走的路线跟谷歌和OpenAI那种权力高度集中的做法完全相反。 Meta一度被看研究里的好人。 去年,Meta在AI上猛踩油门。 扎克伯格给生成式AI部门施加更大压力,要求加速开发和部署,结果导致沟通出了问题。 "我们有很多新想法,真正酷的东西,他们应该去做。但他们就盯着那些已经被验证过的东西,这么搞,只会越落越远。"
年轻的新上司 后面几代Llama表现平平。 2025年4月发布的 Llama 4 砸了,公司被指控操纵测试数据让它看起来更厉害。 LeCun承认 "结果确实被美化了一点",团队在不同测试里用了不同模型来刷分。 "Mark 真的很生气,对参与的所有人都失去了信心。基本上把整个生成式AI组织晾在一边了。很多人已经走了,还没走的估计也会走。" 去年6月,Meta 砸150亿美元投资数据标注公司Scale AI,还聘了它28岁的CEO兼联合创始人Alexandr Wang。 Wang接手了公司在AI上的新赌注和研究部门TBD实验室,负责开发新的前沿AI模型。 Meta 因为试图用1亿美元签约费从竞争对手那里挖顶尖研究员上了新闻。 "这主意好不好,以后就知道了 " LeCun面无表情地说。 LeCun说Wang "年轻","没什么经验"。 "他学得快,知道自己哪里不懂……但没做过研究,不知道研究怎么搞,怎么开展。也不知道什么东西对研究人员有吸引力,什么会让他们反感。" Wang还成了LeCun的上司。 记者问他对这种层级变化怎么看。 他一开始轻描淡写,说习惯跟年轻人共事。" Facebook工程师平均年龄27岁。我是他们年龄的两倍。" 但那些27岁的人不会指挥他干活,记者指出。 "Alex也不会指挥我干什么,"他说。 "你不能指挥研究人员该做什么。更不能指挥像我这样的研究人员该做什么。" LeCun对自己为什么最终决定离开待了十多年的Meta说得很直白。 留下来在政治上变得困难了。 虽然扎克伯格喜欢LeCun的世界模型研究,但公司为超级智能项目新招的那帮人 "完全被 LLM 洗脑了"。 这明显让LeCun感到格格不入。 "我敢肯定Meta有很多人,也许包括Alex,希望我别到处说 LLM 在超级智能这条路上基本是死胡同” “但我不会因为某个人觉得我错了就改口。我没错。作为科学家的诚信不允许我这么做。" 下一站 另一个促使他离开的原因是。 他在世界模型和AMI上的工作被证明能用在Meta不感兴趣的领域,比如喷气发动机和重工业。 而LeCun不愁找不到愿意押注下一代AI技术的投资人。 在下个阶段,LeCun认为建立"新实验室",也就是做基础研究的创业公司,是新的沃土。 他提到OpenAI前首席技术官 Mira Murati的Thinking Machines("希望投资人知道自己在干什么")和OpenAI联合创始人兼首席科学家Ilya Sutskever的Safe Superintelligence("那边的投资人我知道肯定搞不清状况")都是好例子。 他的新架构用视频让AI模型理解物理世界的规律,这样它们就能更好地预测接下来会发生什么。 这个模型还依赖"情绪",也就是过去的经验和评估,来指导预测。 "比如我掐你一下,你会疼。但你对我的印象会因为我掐了你而改变。下次我把手伸向你时,你会躲开。这就是你的预测,它引发的情绪是恐惧,或者说想避免疼痛," 他解释。 LeCun说,12个月内就能看到这个技术的"婴儿版",几年内会有更大规模的版本。 这还不算真正的超级智能,但是通往那里的路。 "也许还有我们没看到的障碍,但至少有希望。" 三个半小时后,餐厅里只剩他们两个客人。 记者问他想留下什么遗产。 增加世界上的智能总量,他想都没想就回答。 "智能真的是我们应该拥有更多的东西。" 有了更多智能,人类的痛苦会减少,决策会更理性,对世界和宇宙的理解会更深。 "我们吃的亏,都是因为蠢。"(FT) #LLM #大语言模型 #Meta #Facebook #AI
本文作者可以追加内容哦 !