银河证券计算机行业点评报告:商汤日日新5.0对标GPT,4 Turbo,打造”云、边、端“全栈大模型矩阵

核心观点

事件:4月23日,商汤科技SenseTime在上海、深圳等多地举报技术交流日活动,发布行业首个“云、边、端”全栈大模型产品矩阵,并全新升级“日日新SenseNova 5.0”(以下简称“日日新5.0”)大模型体系。

Turbo。去年4月商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,截止目前已经升级迭代到第五个版本今年2月发布的“日日新4.0”参数在百亿量级,最高支持上下文本长度128K(约12万以上中文字),本次发布的“日日新5.0”,模型采用MoE(混合专家架构),基于超过10TBokens中英文训练、覆盖大量合成数据集,模型参数量在6000亿左右,推理时上下文窗口长度超过GPT-4 Turbo(支持128K上下文),可以有效达到200K左右,同时拥有端侧扩散和语言模型,在知识推理、数学、代码等综合能力全面对标GPT-4 Turbo。

文理双修能力大幅提升,多模态能力测试排名榜首。“日日新5.0”主要聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。1)文科能力:创意写作能力、推理能力以及总结能力均大幅提升,为教育、内容产业等垂直应用场景提供有力辅助;2)理科能力:数理能力、代码能力及推理能力达到业内领先水平,在数学方面的提升,比GPT-4提升了100%,比Llama2、3提升了400%,为金融、数据分析等场景落地提供坚实基础。3)多模态能力:其图文感知能力达到全球领先水平,根据国模太大模型权威综合基准测试体系MMbench,综合得分排名首位,在其他多模态榜单如MathVista、AI2D、ChartQA、TextVQA、DocVQAMMMU等均取得领先成绩。我们认为,“日日新SenseNova”发布节奏超预期综合能力大幅提升,处于国内行业领先水平,推动国内通用大模型厂商加速迭代,有望降低应用端成本和门槛,进一步拓宽应用端场景,推动AI商业化进程提速。

国内首个建立“云、端、边”全栈大模型矩阵,下沉终端及垂直新场景。除“日日新”大模型系列之外,公司还发布了“商量”2.0和小模型商量S版(SenseChat S)等不同参数量级模型版本,可适配移动端等不同终端及场景的应用需求;公司推出18亿参数规模的SenseChat-Lite版本端侧模型,以适配在智能手机、电脑、VR眼镜等智能终端设备领域;针对金融、医疗、政务等企业级大模型应用需求,公司推出企业级大模型一体机,支持千亿模型急速和知识检索硬件加速,实现本地化部署、开箱即用。我们认为,未来通用大模型领域可能会更加集中在头部厂商,更多厂商需要向行业专业化转型寻求赋能行业以及终端应用突破,垂类大模型以及端侧大模型将是未来主战场,市场空间广阔。

风险提示:投资人应当认真阅读《基金合同》、《招募说明书》等基金法律文件,了解基金的风险收益特征,并根据自身的投资目的、投资期限、投资经验、资产状况等判断基金是否和投资人的风险承受能力相适应。基金的过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证。基金有风险,投资需谨慎。

免责声明:转载内容来自机构研报摘要、公开权威媒体报道,仅供读者参考,版权归原作者所有,内容为作者个人观点,版权归原作者(机构研究员、媒体记者)所有,内容仅代表作者个人观点,与建信基金管理有限公司无关;不作为对上述所涉行业及相关股票、基金的推荐,也不构成投资建议。对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本公司不作任何保证或承诺,请读者仅作参考。如需购买相关基金产品,请关注投资者适当性管理相关规定,做好风险评测,选择与之相匹配风险等级的产品。本文只提供参考并不构成任何投资及应用建议。如您认为本文对您的知识产权造成了侵害,请立即告知,我们将在第一时间处理。

#计算机八白马入围MSCI#$建信信息产业股票A(OTCFUND|001070)$$建信互联网+产业升级股票(OTCFUND|001396)$

追加内容

本文作者可以追加内容哦 !