现在的量化镰刀太可怕了!不光在场内割韭菜,甚至连大模型厂家也一块割。
知道为什么周五算力和服务器大跳水吗?
对,就是因为幻方的DeepSeek v3——号称AI界的拼多多。
v3的服务价格有多低?每百万输入token 只要0.5元,每百万输出token 8元,号称市面上“最便宜”的旗舰大模型。
这是什么概念?美国那些根本不用比,太贵,光国内这些旗舰大模型:
通义千问max,每百万输入token 20元,每百万输出token 60元。
豆包pro 128k,每百万输入5元,每百万输出9元。
那v3是如何做到如此低价的呢?
很牛逼,通过技术优化。
v3在278.8万个英伟达H800 GPU小时内,就完成了整个训练,总成本只有557万美元。
而Meta的Llama-3.1,光预训练成本,就超过了5亿美元,为DeepSeek v3的100倍!
此外,v3还通过算法和工程创新,使生成吐字速度,从20TPS大幅提高至60TPS。
所有这一切,就是v3喜提“AI拼多多”称号的由来,卷到最低价,居然还能挣钱。
关键v3的性能,也很牛逼。
除了在Aider多语言编程测试中排行第二,仅次于OpenAI o1,还在多项测试中,领先Meta、阿里等一众开源模型,甚至部分超越了OpenAI的闭源模型GPT-4o。
又便宜又好用,你说其他厂家该怎么办?除了卷价格卷成本,还能怎么办?这不都成常规套路了吗?
关键幻方通过实践证明:AI大模型的训练,不需要堆那么多算力,至少现在不需要了,完全可以通过架构和算法优化,来实现极低成本的训练过程。
你说这把镰刀快不快?内割韭菜,外割厂家,这就是AI算力和服务器大跌的直接原因。
关键是幻方这条路跑通后,意味着未来哪怕大模型升级,理论上也会存在通过架构和算法,来降本增效的路径,这样相关板块的想象空间,一下就被压缩了,故事出现了瑕疵,而估值又在高位。
所以大家还是要理性一点,千万别太格局,更不要自我洗脑。
本文作者可以追加内容哦 !