DeepSeek 出现后,短期内算力需求有所降低,但中长期来看需求依然旺盛。
短期降低
- 模型优化技术:DeepSeek 通过一系列创新优化技术,如采用 “思维链” 方法、8 位低精度计算代替标准 32 位计算、多令牌系统、专家模块系统等,极大地提高了模型效率,降低了对硬件的要求。例如,DeepSeek 将训练语言模型的成本从 1 亿美元降低到 500 万美元,GPU 需求从 10 万枚降低到 2000 枚,大大降低了 AI 训练和推理的门槛,使得在相同任务下,短期内对算力的需求明显减少。
- 开源与普及:DeepSeek 是开源的,可在个人计算机上运行,这使得更多的人能够在自己的设备上进行 AI 相关的开发和应用,而无需依赖大规模的数据中心和高性能计算设备,从而减少了对专业算力资源的短期需求。
长期旺盛
- 模型扩展与应用拓展:虽然 DeepSeek 本身的模型在训练和推理时对算力的要求有所降低,但随着 AI 技术的不断发展,更大的训练数据和模型参数能够增强模型的智能,会有更多的开发者基于 DeepSeek 进行模型的改进和扩展,或者开发新的应用场景,这将导致对算力的需求不断增加。
- 技术普及与用户增多:DeepSeek 加速了大模型的普惠,使更多的企业和开发者能够进入 AI 领域,随着 AI 技术的普及,应用场景会不断丰富和深化,如智能客服、智能驾驶、医疗影像分析等,这些都会推动算力需求的增长。
追加内容
本文作者可以追加内容哦 !
另外合力泰什么时候介入算力,仍是未知数,但将自己原领域加持算力,也能有扩展,谁知道呢。。。。