在东方财富看资讯行情,选东方财富证券一站式开户交易>>

$DeepSeek概念(BK1188)$   

DeepSeek,突传大消息!高盛发声!

时谦券商中国
2025年03月26日 09:54广东听全文
图片

最新进展!



3月25日晚,DeepSeek又有大消息传来。该公司在官方账号上正式宣布V3模型完成小版本升级的消息,并介绍了新版本DeepSeek-V3-0324模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。另据海外专业AI模型评测机构最新排名,新版V3模型现在是得分最高的非推理模型,超过xAI的Grok3和OpenAI的GPT-4.5(preview)。


值得注意的是,北京时间昨天晚上,人工智能大模型“暗战”不断。当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。谷歌也发布Gemini 2.5系列人工智能推理模型,其首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分。


再度引爆:又变强了!


3月25日晚间消息,DeepSeek宣布V3模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。


据悉,DeepSeek-V3-0324 API接口和使用方式保持不变。如非复杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。


模型推理任务表现提高,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。


DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_on(tool calls相关变动)。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。


不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。


DeepSeek方面表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。

恭喜解锁12个月手机L2专属领取资格,立即领取>>

追加内容

本文作者可以追加内容哦 !