$商汤-W(HK|00020)$  






商汤生成式AI业务飙涨256%,投建AI算力集群有5.4万块GPU


和讯网

09-09 14:27

编辑 康嘉林


如果说2023年是国内基础大模型的元年,那2024年则是大模型应用的元年。相比于刚开始各方去买卡堆算力、卷模型、卷参数,现在大家的目光都转向了对场景落地和商业应用,让企业或用户真正在生产实践中用得顺畅。


肉眼可见的,大量的应用和场景开始融入AI的能力,无论从搜索入口到办公软件,从手机到电脑等硬件终端,从电商到金融产业,无一不是看中了生成式AI带来的巨大价值。


身处其中,生成式AI也成为商汤最快速度从无到有、进而拥有一定体量的业务。


8月27日,商汤科技发布半年报。2024年上半年,集团总收入为17.4亿元,同比增长21%。三大业务中,生成式AI收入超10亿元,同比大幅增长256%,占集团收入比跃升至6成。


这些增长数字的背后,是一道内容宏大的考题:AI大航海时代下,创新企业该如何做出AI的爆款应用,教育、汽车、金融、工业等细分领域如何在真实场景中寻找AI的创新应用,以及这些能力背后,大模型生态和工具链又该如何建设。


现在,商汤都给出了自己的答案。


从大装置到大模型,基础设施打好底座


数据、算力无疑是大模型的本质。过去几年,大模型参数量以年均400%的复合增长率增长,AI算力需求的增长也翻了15倍。如此庞大的数据量,只有拥有能够运行多AI模型的算力基础设施,才能促成如今大模型应用的百家争鸣。


商汤先市场一步,提前打底基础设施。从2018年开始,商汤就开始每年投入更多资源到SenseCore大装置,同时致力于AI大模型的研发,并在上海建设了临港AIDC(人工智能计算中心)。2021年,商汤正式推出新型AI基础设施——商汤大装置SenseCore。商汤大装置管理的算力实现了全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地都拓展了新的计算节点,截止2024年7月,总算力规模高达20000 petaFLOPS ,已有超5.4万块GPU,在支持商汤自身大模型研发的同时,也支持外部客户训练大模型和应用部署。强大算力可支撑超过20多个千亿超大模型同时训练,并支持万亿参数大模型的全生命周期生成。


市场的认知没那么及时,更何况,豪赌大装置不仅需要重金投入,这也是一个需要长投资、且短期内不一定能看到回报的事情,但在商汤看来却是必须要做得事,即使商汤会需要更长周期才能走向盈利。


财报数据显示,商汤的智算服务规模化效应逐渐展露,截至2024年8月运营总算力规模已突破20000 PetaFLOPS,相较今年3月提升约70%。


2024年4月,日日新5.0的发布实现了国产大模型的一项里程碑,它在SuperCLUE评测中成为首个超过GPT-4 Turbo的模型,并且阿里达摩院的Auto Arena评测中位列大模型中文能力第一名,同样超越GPT-4 Turbo。2024年7月,日日新进一步升级为5.5版本,相较5.0综合能力提升约30%,多模态能力全面加强,实现了对标GPT-4o的实时性交互体验,成为中国第一个多模态的实时交互大模型。


现在的商汤已经能提供AI基础设施,为客户提供模型训练、微调和推理等服务,也同时拥有了完整的企业客户服务体系和能力,提供最具性价比的生成式AI解决方案。


日日新调用量增长400%,一线听得见炮火


大模型虽百舸争流,但最终仍需“落到实处”,而商汤始终将AI技术在实际应用场景中的落地作为发展的重心。


正如商汤集团董事长兼CEO徐立所言,唯有不断深入垂直行业,大模型才能创造出全新应用格局,最终助力“人工智能+”步入黄金时代。


实际上,2024年被认为是生成式AI在企业落地的关键之年。和讯获悉,从去年底到今年年中,大模型在行业的落地活跃度十分惊人。正如IDC的预测,到2027年,中国2/3的企业将利用生成式AI和RAG的组合,将决策效率提高55%。为此,到2026年,中国500强企业将把30%以上的核心IT支出用于AI。


回望历史,此前中国互联网行业能够在全球范围内脱颖而出,也正是因为和产业做了深度融合,造就了手机支付、电商、直播、物流业等跨越式发展。人工智能时代亦是如此,应用为王,发挥中国AI力量在应用上的创新试验场和引领作用,促进千行百业的创新,一直是商汤科技的初心。


在实现生成式AI落地的过程中,端侧的部署和积累尤为重要。


商汤在这个领域的入局可以追溯到2015年,开始和全球主要的安卓手机厂商和主流车企合作,将感知与决策类的AI模型植入至数亿台手机和数百万台汽车中,实现端侧推理的落地与优化。


商汤的服务范围广泛,据财报披露,商汤已与互联网行业的重要玩家如京东、小米、金山办公等互联网公司、内地三大电信运营商、以吉利为代表的车企、以清华为代表的高等院校、以及头部大模型创业公司等展开合作。


基于这一深厚积累,商汤还率先推出了业界性能优、推理速度快的端侧大模型,例如商量端侧模型SenseChat-Lite,不但全面领先所有开源2B的同级别模型,并在测评上部分超越Meta Llama-2 7B模型的效果,帮助商汤有效地满足市场对高效、低成本AI解决方案的需求。


在端侧部署领域的成功实践,增强了商汤在技术竞争中的议价能力和市场影响力,为其在生成式AI业务领域的扩张奠定了基础。


也正因如此,商汤还基于日日新5.5蒸馏出不同尺寸的模型,以提供全面的企业级生成式AI解决方案,覆盖云端、本地数据中心和终端设备。也从互联网行业客户,逐渐扩展至智能硬件、电动汽车、机器人、医疗、金融等行业。日日新报告期内整体调用量实现400%的增长,客户数和客户平均调用规模均大幅增长。


一线已经听得见炮火。以中国银行、招商银行、海通证券为代表的企业客户使用金融大模型能力构建出各种金融垂类应用,涵盖员工助手、合规风控、编程助手、数字人、营销等业务场景。上海瑞金医院、新华医院等大型医院将“大医”医疗大模型建设为医院智能化中枢,实现智能导诊、预问诊、陪诊、诊后随访、用药咨询、多模态数据治理等功能;代码助手、办公助手产品“小浣熊”成为内地增长最快的Copilot产品之一,个人用户和开发者达数十万;拟人大模型支持新浪微博、阅文集团筑梦岛、爱奇艺、想法流等互联网应用,日调用量在半年内爆发式增长近22倍。


通过这些细分模型与工具,商汤向产业完整地展示出大模型技术在实际工作场景中的高效性和创新性,报告期内,3000多家行业头部企业使用商汤的大模型及智算服务,而众多企业积极地推广和应用,也标志着商汤在AI的商业化落地方面上走在了前列。


智算服务市占率跻身前三,生成式AI展现势头


预计到2026年,全球AI市场规模将达到3000亿美元,这孕育了想象空间,谁能在此时率先摸到业务转型的“根茎与脉络”,更容易在AI的大航海时代抓住机遇。


身处其中,商汤科技的商业化模式已被市场验证奏效,在市占率方面率先展现出优势。


根据IDC近期发布的市场份额报告《中国大模型平台市场份额,2023:大模型元年——初局》,商汤的大模型平台及应用以16%市场份额排名行业第二,智算服务以15.4%市场份额跻身行业前三。在生成式AI爆发的关键节点,商汤率先完成了业务转型,在AI黄金时代占到了先机。


如果翻看年中报,不难发现从市占率、客户扩容、调用量等维度来说,商汤在AI商业化方面取得了显著进展,但商汤的脚步并未停下,相反在应用和场景上的深耕,正在让商汤成为连接不同产业需求与AI技术能力的桥梁。


现在,通过商汤多模态大模型出色的分析与推理能力,“绝影”不仅能实现更加安全的智驾体验,还可以打造更加丰富且自然的人机交互体验。财报数据显示,在量产交付方面,商汤绝影智能汽车业务上半年新增交付70.5万辆,按年增长80%,累计交付车辆数达到260万辆、覆盖104个车型。


在智能座舱领域,基于日日新多模态大模型、文生图模型等能力组合,绝影与奥迪、大众、本田、宝马、上汽智己、吉利等10余家海内外车厂建立车舱大模型的合作。;在智能网联领域,深圳前海、江苏无锡、陕西西咸新区、上海临港等多个城市均开通了商汤绝影自动驾驶小巴的运行路线。绝影自动驾驶小巴的行驶总里程累计突破300万公里。


生成式AI热潮下,数字人被视作未来使用自然语言与机器交互的关键入口级产品,在数字人的开发周期、成本、形象打造、AIGC化都存在一定挑战的背景之下,产业中需要的是一家有能力、有经验的AI技术提供商,而商汤也没有错过这一波浪潮。数字人视频生成平台如影,仅需一段5分钟的真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。


展望未来,尽管AI大潮已经是确定性的时代机遇,但具体到微观层面的实操,仍在考验着头部玩家的领头羊能力,在这个最生动的AI世代,商汤科技的价值也将进一步得到释放,并拥有无限的遐想空间。

追加内容

本文作者可以追加内容哦 !