从幻方第二代MoE模型DeepSeek来看浙大网新OpenBuddy大模型!
国产大模型DeepSeek在全球火了!AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。其性能相当强悍,已经和海外领军的闭源模型接近。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。
DeepSeek-V3在Aider多语言测试排行榜中,以48.4分排名第二,仅次于OpenAI o1的61分。而在LiveBench的测评中,DeepSeek v3是最强的开源大语言模型,并在非推理模型中,排名第二。
如此厉害的大模型,竟然来自金融领域的头部量化——幻方量化。 其上一代模型DeepSeek-V2.5于9月6日正式发布,迭代速速不可谓不快。
在国产开源语言大模型开发这一块,浙大网新早已走在了前面!
OpenBuddy大模型诞生于浙江大学计算机系统结构实验室( ARClab 实验室),OpenBuddy模型主要强化了认知能力,包括逻辑推理、代码生成和深入的语言理解。此外OpenBuddy还具备中、日、韩、英、法、德的多语言能力,能够执行跨语言学习以及双语对话等任务。可以广泛应用于智能客服、在线教育、智能编程助手等场景,帮助企业和开发者提高效率和用户体验。
公司与OpenBuddy的主要开发团队合作投资了自研大模型科技企业——杭州沧海观止科技有限公司, 基于OpenBuddy的训练技术,目前该开源大模型正推进工程化落地,在教育教学场景推出观止垂类大模型。
- 浙大网新OpenBuddy模型的特点:
- 技术创新:是业界首个规模高达22Bx8(约1400亿参数)的开源中文MoE跨语言模型。
- 多语言支持:具备卓越的中英理解能力,还支持日、韩、法、德等多种语言的跨语言任务。
- 应用场景广泛:长文理解能力出色,在长文本概要总结、问答等场景表现良好,可应用于智能客服、在线教育、智能编程助手等场景。
- 开源可商用:基于Apache2.0协议发布,无需许可即可商用,且在GitHub和ModelScope等平台上有活跃的社区支持。
浙大网新:公司正推进与浙大共研的“观止”系列大模型应用落地
每经AI快讯,有投资者在投资者互动平台提问:请问当前openbuddy的研发进展和水平如何?公司是否考虑进一步入股,以提高公司在杭州沧海观止科技有限公司的股权比例?
浙大网新(600797.SH)9月20日在投资者互动平台表示,答:尊敬的投资者,公司正推进与浙大共研的“观止”系列大模型应用落地,强化大模型技术攻关,在教育、交通、人社、监管、金融等领域探索落地,并着重培育大模型的工程化部署能力。感谢您的关注。
浙大网新在Agentic AI领域有诸多探索与应用,主要体现在以下方面:
- “浙大先生”智能体应用开发平台:依托浙江大学自研的openbuddy模型以及豆包大模型等,创建多个大模型校园应用场景,如AI科学家、慧学外语、AI百事通和数字教师等。还具备构建不同复杂度大模型智能体应用的平台支持能力,通过门户及课堂问答、教务咨询、本地生活助手等智能体场景应用,满足高校落地大模型应用的需求。
- 全链条AI大模型服务体系:算力服务提供高性能及高性价比的计算资源,满足不同规模的计算需求。模型服务利用最新的AI及大模型技术,为客户提供模型的工程化布署、定制化的模型训练和优化服务,在教育、交通、人社、监管、金融等领域探索落地。数据服务提供全方位的数据解决方案,助力数据要素在可信认证、金融服务等领域中的流通,赋能数据要素市场化、价值化。
- 脑机接口与“双脑”科技应用:与浙江大学合作开发基于人工智能AGI算法的脑机接口产品Dreamgear绘梦仪,利用先进的脑机接口技术,结合浙江大学研发的Dreamer模型,实现梦境的可视化和永久保存。推动“双脑”科技在脑疾病诊治、智能医疗和智慧城市等多个领域的创新应用。
本文作者可以追加内容哦 !