3月24日晚间,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。
目前已在Hugging Face上开源,并迅速登上了Trending榜单。据悉,其开源版本模型体积为6850亿参数。
同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,该版本的最新模型也已经同步至官网、App 和小程序,关闭“深度思考”就可体验。
此次发布的版本更新,在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3-0324生成前端代码的能力大大提升。
DeepSeek-V3-0324 编程与数学能力大幅提升
【基准测试提升显著】
根据国外开源评测平台kcores-llm-arena的最新测试数据,V3-0324的代码能力达到了328.3分,超过了普通版的Claude 3.7 Sonnet(322.3分),接近思维链版本的334.8分。
这一成绩意味着,新版V3已成为目前编程能力最强的开源模型之一。
【Web前端开发能力优化】
代码生成准确率提升
生成的网页与游戏前端更加美观
【中文写作能力升级】
风格与内容优化
实现与R1写作风格对齐
中长篇写作内容质量提升
多轮交互式改写能力提升
翻译质量与书信写作优化
AI新技术发展迅猛!投资者应如何布局?
DeepSeek新模型的改变对于业内来说也具有重大意义,一方面其大大降低了大模型的能耗及计算成本,进一步动摇了华尔街对于顶级模型基础设施的投资规模假设;另一方面,中国人工智能行业对开源的广泛共识又迅速推动国内AI行业的发展,不断缩短其与世界顶尖对手的距离。
【数据中心】:中国移动、中国联通、中国电信、首都在线、云赛智联、润泽科技、杭钢股份、拓尔思、汉得信息、青云科技、浙大网新
【算力】:拓维信息、神州数码、浪潮信息、紫光股份、中科曙光;
【AI芯片】:中芯国际、寒武纪、海光信息、中兴通讯;
【2C应用】金山办公、三六零、合合信息、福昕软件、万兴科技;
【2B应用】汉得信息、泛微网络、鼎捷数智、用友网络、金蝶国际、新致软件、能科科技、中软国际;
【AI智能体】: 汉得信息、鼎捷数智、普联软件、金财互联、视觉中国;
本文作者可以追加内容哦 !