$新易盛(SZ300502)$ deepseek天塌了,李飞飞团队用不到50美金训练出媲美deepseek
害羞de铅笔
20小时前
来自江苏优质游戏领域创作者
今天,AI届爆出了一颗重磅炸弹,有个李飞飞的团队发布了S1模型,推理能力媲美deepseek ri成本居然不到50美金。
内容图片
据《科创板日报》2月6日消息,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型,该模型在数学和编码能力测试中的表现与DeepSeek的R1等尖端推理模型不相上下。
研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。
注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。
李飞飞何许人也?有AI教母之称,美国国家工程院院士。
作为外行人,我不懂什么叫蒸馏,但是如果这个消息是真的话,不光是deepseek的天要塌了,英伟达更是要哭晕在厕所。
因为deepseek花了600万美元,李飞飞团队才花了50美元,说出来怎么那么让人不信呢?毕竟一个人一天的工资都不止50美元。
不知道大家怎么看呢?
内容来源:一点号
追加内容
本文作者可以追加内容哦 !