DeepSeek发布的 FlashMLA有哪些意义?
(1)使英伟达H800推理性能提高2-3倍,内存带宽提升2-3倍(3000GB/s vs 1000-1500GB/s);
(2)推理速度提升 30%-50%;
(3)显存利用率提升20%-30%…
总结:FlashMLA是能让LLM在 H800跑得更快、更高效的优化方案,尤其适用于高性能AI任务。
DeepSeek这种不断开源新技能,都是告诉大家如何极限挖掘英伟达算力卡的性能潜能,其性价比又又提升了。
这会让全球一众友商怎么活啊!
现在国内最开心的一批人是谁?是这些有渠道把海外的达子卡搞进国内加价卖出的二道贩子们!
难怪最近国内一些达链企业股票被一些大户抛售,股价持续被打压。原来这些人把股票都换成现金去倒卡去了啊!国内算力建设迎来新一轮高潮,国内达子的卡又涨价了啊!他们赚的盆满钵满!
$英伟达(NVDA)$ $淳中科技(SH603516)$ $数据港(SH603881)$
追加内容
本文作者可以追加内容哦 !