大家上午好!字节豆包大模型相关调研纪要
2024年12月29日
字节豆包大模型相关调研纪要20241223
字节跳动AI布局的重要性
字节跳动布局AI力度大,是力度最大的公司之一,不会错失下一代入口级机会。
有助于拉动云计算,如推动火山引擎实现弯道超车。
未上市使得其在新业务拓展上容错率高。
字节基础大模型的情况
字节基础模型日均token使用量相比于七个月前增长了33倍,已达4万亿,使用量不仅来自C端,也有来自to b场景,如智能终端和汽车等下游。 发布多模态产品,视觉理解模型现场发布会效果佳,达到去年GPT4V刚发时的效果,具有多种实用新功能,如多张图片关联问答等,是做眼镜、智能终端等的重要能力基础。
具有复杂推理能力,如解答数学题,综合效果在一些中文场景中超过GPT4,尤其是涉及中国传统文化方面。
技术模型的语言文字生成能力、推理能力达到4以上水平,在国内处于第一梯队,与海外差距缩小。
模型价格超低,相比于海外同行如cloudy、gbt价格低85%左右,相比于国内同行如通义千问等价格低25%到30%左右。
字节跳动的应用及模型
与英伟达合作的3D模型,核心应用场景为MRARVR内容及游戏,具有广泛应用场景和商业化潜力。
发布AI音乐模型和视频,集梦平台更新新一代AI视频大模型,未来可能比豆包助手更重要,因其对于创作者降低创作门槛,提升内容生成质量,具有更高用户粘性和商业价值。
端侧AI应用于耳机、眼镜、玩具等场景,字节的火山引擎与乐心等发布AI加硬件制约计划,合作领域广泛,包括互动娱乐、教育产品等。
AI玩具在东亚国家有强大需求和良好付费习惯,满足情绪价值、陪伴和教育作用,市场前景广阔。
传媒领域中,与字节跳动有合作的公司众多,如视觉中国等数据公司,以及盛天网络、游族网络等应用和生态公司,买字节AI时择时远重要于择股。
AI耳机与AI眼镜的情况
AI耳机:字节发布新款AI耳机欧拉friend,采取开放式挂耳结构,舒适感强,耳机重量轻,单支仅6.6克,佩戴时长更长,集成豆包AI大模型,可语音交互,功能围绕随时问答、英语陪练、旅行导游、音乐控制、情绪沟通五大方面,为用户提供随时随地的陪伴。
AI眼镜:可集成AI耳机全部功能,还能结合视觉交互模型,提供物体识别分析、第一视角直播等功能,后续想象空间大。目前消费电子眼镜主流有VR、AR、AI眼镜三大方向,VR眼镜发展最成熟,全球年出货量800到1000万台;AR眼镜重量较轻,使用场景集中在大屏观影、骑行导航、旅游展馆等,年出货量50万台左右;AI眼镜重量更轻,舒适度好,主打轻便时尚,代表产品如meta和雷朋合作的智能眼镜,全球累计销量已突破100万台,市场对其全年出货量预期在150万付上下。字节在AI眼镜方面进行全方位布局,pico在VR领域竞争地位高,市占率全球第二、国内第一;字节投资李瑞可科技,其专注于AI眼镜和AR眼镜,已推出相关产品并接入AI智能开发平台。
推荐关注AI耳机及AI眼镜相关标的,如兆易创新、中科蓝讯、歌尔股份等。
通信在字节上的启示及投资机会
字节在火山引擎大会上强调推理网络的PD分离架构,将推理拆成预填充和解码两步,提高效率。该架构可通过GPU直接访问缓存提升效率,缓存本身也可进行优化,进一步降低时延、提升性能。
该架构穿透到硬件层面的启示:降低组建10万卡甚至更大规模集群的难度,支持易购分离式架构,可根据不同计算需求选择芯片,优化集群架构成本;该架构后续两个阶段的优化方向分离,prefer阶段需要更强计算能力,decode阶段需要多次大量读取缓存,侧重点在于通信网络或调配能力。
通信领域的投资机会:算力底座数据中心,润泽科技是字节密切相关的核心算力底座,智算中心供不应求,处于上行周期,字节作为优质客户需求大且待建,给对应的IDC在价格和生产节奏上带来较大弹性;智算中心的产品,如光模块、交换机、液冷、光纤光缆等,25年国内400G放量节奏确定,产业链各环节得到验证;端侧AI玩具对应的通信标的,如乐心科技,与字节有深度合作,提供带连接属性的处理芯片,可实现语音识别等功能,通过wifi连接调用豆包大模型,实现低延时高可靠,价值有较大提升。
问答环节
字节跳动在AI产业布局上的重要性体现在哪些方面?今天分享的内容有哪些重点部分?
字节跳动在AI产业布局上的重要性主要体现在几个方面:
首先,字节跳动将像海外的Meta一样,在人工智能领域投入巨大的力度,不会错失下一代入口级别的机会;其次,通过布局AI拉动云计算,特别是火山引擎的快速发展;
再者,由于未上市,字节跳动在新业务拓展上的容错率较高。今天的分享将涵盖多个方面,包括豆包的基础大模型的重大变化、字节跳动在偏软应用上的创新(如3D音乐、视频更新、硬件AI端侧应用以及AI玩具、耳机和眼镜等),最后还会讨论字节跳动整个算力产业链的投资机会。
字节跳动为何选择布局AI?目前字节跳动的基础模型有哪些关键数据和进展?
字节跳动选择布局AI是因为它有望成为力度最大的大厂,在算力算法到应用层面搭建起生态,并且通过多领域的布局,如豆包APP的DAU达到900万,以及极梦AI(视频生成平台)和教育领域答题助手等,展现出了其在应用环节的显著进展。字节跳动的基础模型日均token使用量相比七个月前增长了33倍,达到了4万亿次,不仅在C端豆包场景有增长,还在to b领域,尤其是智能终端和汽车场景中实现广泛应用。
此外,字节跳动还重点发布了多模态产品——视觉理解模型,该模型在关联场景理解、数据标注及复杂推理等方面表现出优秀效果,综合来看,在中文场景中已超过GPT4水平。
字节跳动的基础模型在价格方面有何优势?
字节跳动公布的新技术模型在语言文字生成能力和推理能力上达到四以上水平,其价格相比海外同行低约85%,相比国内同行如通义千问和其他腾讯模型的价格低25%至30%,已能做到行业内最低价,对于常见应用场景如文字生成和简单图片生成,一个月的正常使用费用仅几十块钱,未来还会进一步降价,尤其是为初创企业训练数据提供超低价格。
字节跳动旗下火山云低价策略的主要原因是什么?
火山云低价策略的原因主要有三点。
首先,字节跳动希望通过抢占市场份额并提高现有公有云芯片利用率来降低成本。
其次,可能是为了抢占丰富的数据资源以构建数据闭环,特别是在海外一些行业如教育、旅游、电商营销等领域,由于数据缺失问题严重,提前布局数据获取尤为重要。
最后,虽然火山云在毛利率上可能未亏损,但考虑到营销和研发费用的巨大投入,其定价更多以抢占市场为主,而非追求高盈利。
字节跳动发布的AI模型有哪些具体应用?AI硬件在端侧应用场景中有哪些发展趋势?
字节跳动发布了一些具体应用场景的AI模型,其中重点包括3D模型,尤其是与英伟达合作的项目,主要面向MR/AR/VR内容和游戏行业,这与我们预测的AI生成式AI在游戏和MR内容中的广泛应用相吻合。此外,还推出了AI音乐模型和视频,特别是集梦平台新一代AI视频大模型的更新,预示着AI视频在未来有巨大潜力,特别是在商业化方面,字节跳动凭借其短视频巨头地位、庞大的创作者和用户基础以及丰富的运营经验,有望将集梦打造成AI时代的抖音。AI硬件在端侧应用场景中,如耳机、眼镜和玩具等领域,呈现出多元化发展的态势。
国内企业如字节跳动及其火山引擎与乐心医疗、toy CT follow toy和魂伴科技等合作伙伴,共同发布了AI加硬件的制约计划,旨在拓展智能玩具、互动娱乐及教育产品市场。
其中,AI陪伴玩具不仅适用于低幼市场,还逐渐向成年用户和老年人市场延伸,提供情绪价值、陪伴作用及教育功能,形成良好的商业化场景,并且在东亚国家市场需求强劲,付费习惯良好。
AI技术如何影响内容平台和创作者生态?
AI技术对于内容平台而言,关键在于提供能降低内容生产门槛的工具,例如AI视频编辑工具,这有助于提升内容质量并吸引用户创作,从而增强用户粘性和商业价值。字节跳动通过AI工具赋能创作者,可实现人人都是电影导演的时代愿景,同时,AI视频作为平台核心产品将有助于进一步积累用户和提高用户活跃度。
对于AI视频的商业化前景有何看法?
目前AI视频在数字创意场景中已展现出广泛应用趋势,随着Sora VR等产品的发布以及字节跳动等巨头的加入,未来AI视频如何实现商业化,尤其是类似AI短剧的场景,具有较大看点。同时,AI在3D和MR内容中的应用也逐渐增多,预计将成为游戏和互动娱乐领域的重要发展方向。
在传媒领域中,有哪些公司与字节跳动有深度合作,特别是围绕AI技术的应用?
在传媒领域,与字节跳动有深度合作并涉及AI技术应用的公司众多。例如视觉中国、盛天网络、游族网络、石峰文化、居然之家、智文互联、掌阅科技、博纳影业等。几乎所有的传媒公司都与字节跳动在流量等方面有过合作。
AI耳机方面有哪些热门产品或技术亮点?
AI耳机方面,字节跳动发布的欧拉friend耳机是近期的热门产品。该耳机采用开放式挂耳结构,舒适度更高,单支重量仅6.6克,佩戴时长更长。此外,它集成了豆包AI大模型,支持语音交互,唤醒词为“豆包”,并能实现随时问答、英语陪练、旅行导游、音乐控制和情绪沟通五大功能,主打为用户提供随时随地的陪伴体验。
VR眼镜、AR眼镜和AI眼镜的主要区别是什么?
VR眼镜主打虚拟现实体验,提供沉浸式、立体效果的感受,重量较重(约500克),使用体验较为封闭;AR眼镜重量相对较轻(约60-80克),能够在现实场景中叠加虚拟信息,应用场景更多元,如大屏观影、骑行导航等;AI眼镜更轻便(约50克),外观时尚,舒适度更高,主要侧重于日常使用,并且能够实现AI语音交互及多种智能功能。
AI眼镜相较于其他类型眼镜有何特点及应用场景?
AI眼镜相比VR眼镜和AR眼镜具有更轻便、外观时尚的特点,重量约50克左右,舒适度更好,适合长时间佩戴。AI眼镜不仅具备AR眼镜的功能,还添加了摄像头以提供第一视角拍摄和直播功能。应用场景上,AI眼镜可以结合视觉交互模型,进行眼前的物体识别分析,尤其在户外活动、旅游展馆等领域有较大潜力。
目前VR眼镜、AR眼镜和AI眼镜在全球市场的出货量情况如何?
VR眼镜市场较为成熟,全球年出货量约800-1000万台;AR眼镜发展稍晚,年出货量约为50万台;AI眼镜今年异军突起,以meta与雷朋合作的智能眼镜为例,截至今年五月份累计销量已突破100万台,全年出货量预期在150万台上下。
字节跳动在AI眼镜领域的布局情况如何?
字节跳动在AI眼镜领域进行了全方位布局,包括VR眼镜(如Pico系列)和AR/AI眼镜。其中,Pico在全球和国内的竞争地位较高,市占率仅次于Meta;在AR/AI眼镜方面,字节跳动投资了李瑞可科技,持股约20%,该公司专注于研发AI眼镜和AR眼镜,并于今年四月份推出了一款支持多种功能的AI智能眼镜。
在AI技术方面,有哪些公司正在积极布局并可能成为关注焦点?
近期,小米、三星和苹果等大厂都在密切关注并投入VR/AR及AR眼镜产品的发展。在AI耳机和AI眼镜两条线中,我们推荐关注兆易创新,它是字节跳动存储芯片的主要供应商,并为字节的AI耳机提供存储芯片;中科蓝讯则与火山引擎深度合作,其迅龙三代芯片已完成与火山方舟平台对接,可提供适配豆包大模型的软硬件解决方案;最后是歌尔股份,它是VR整机代工领域的市占率最高的公司,不仅为meta和pico等品牌的热销机型提供代工服务,还具备AI眼镜相关的组装代工能力,同时也在声学模组方面为AirPods进行代工。
通信领域中,字节跳动火山引擎大会强调的PD分离架构是什么?在PD分离架构下,有哪些可能的硬件层面启示?
PD分离架构是一种将推理过程拆分为预填充(prefer)和解码(decode)两个步骤的架构设计。在预填充阶段,接收用户请求并利用高性能计算将结果写入显存或缓存,并推出第一个token。而在解码阶段,则调用之前处理过的token与缓存中的结果结合再次计算,最终得到输出结果。这种分离架构的目的是通过让不同的GPU分别处理预填充和解码步骤,从而提高效率,实验数据显示相较于一体化架构,采用PD分离架构的三卡架构总量可达到两倍以上。
首先,该架构降低了构建大规模集群的难度,支持易购分离式架构,每一步骤可对应使用不同性能或能耗比突出的芯片,例如在预填充阶段使用性能强的N卡或其他国产GPU,而在解码阶段则使用能耗比更优的卡。
此外,该分离架构使得两个阶段的优化方向也有所区别,预填充阶段瓶颈在于计算能力,而解码阶段则侧重于通信网络和缓存读写调配能力。
为什么选择采用PD分离架构而不是一步到位?
采用PD分离架构主要是为了解决资源分配问题。在一体化架构中,计算和数据取用两种资源争夺内部资源,主动采用分离架构后,可将预填充和解码这两步交给不同的GPU处理,有效提升了资源利用率和整体效率。
推理阶段对硬件性能要求的变化如何?
尽管推理阶段对硬件性能要求可能不像训练阶段那样高,但差异化程度会加大,并且网络设计相比训练场景会更为复杂。同时,字节跳动在财务上对AI投入力度巨大,形成了一种AI军备竞赛的局面,这对整个算力底座和硬件端带来了积极影响。整体而言,字节跳动通过自身努力提升内功并优化集群架构,同时也与其他CSP形成竞争,推动行业持续发展。
在通信领域中,最底层的算力底座数据中心有哪些关键内容和相关公司?
最底层的算力底座数据中心中,核心标的润泽科技与字节跳动关系紧密,其中润泽科技约70%的收入来自字节跳动。上周我们发布了润德科技深度报告,分析了智算中心的供需情况及润泽的投建节奏,得出结论:整个行业正处于明显的供需拐点,智算中心供不应求且处于上行周期。润泽科技披露的200兆瓦智算中心采用4乘4模块化设计,每个模块能耗约为3兆瓦,这种架构与字节跳动的PD分析架构相似,表明对客户需求跟进密切。如果后续不是字节跳动领头,而是第三方CSP参与竞争,整个IDC受益范围将进一步扩大。
智算中心的产品线有哪些,并且在2025年有哪些发展趋势?
在智算中心产品方面,2025年国内400G放量节奏较为确定,产业链各环节已得到验证。例如,在光模块领域,主流互联网公司市场份额中,华工等内地厂商占据重要位置;交换机芯片方面,除了博通外,还有国产的盛科通信;液冷解决方案由英维克提供;此外还有DC互联的光纤光缆等产品。
在端侧硬件方面,有哪些公司或产品值得关注?
在端侧硬件方面,以乐心科技为例,它在AI玩具领域提供了带连接属性的处理芯片,具备语音识别等能力,并可通过WiFi连接调用大模型实现低延时高可靠的服务。乐心科技通过与大模型协同,提升了自身价值,并将成为AI玩具后续落地过程中的重要标的。
总结来说,哪些方向是投资者应该持续关注的,并且为什么?
投资者应持续关注三个方向:一是智算中心及其内部的IT和非IT产品;二是端侧硬件,如物联网相关标的及乐心科技等;三是AI应用的落地铺开和CSP厂商可能发起的军备竞赛,这些都有望从硬件到软件为行业带来新的风貌,并为投资者创造新的投资机遇。申万TMT团队将密切关注并跟踪这些领域的边际变化和进展。祝大家周摸女快!
追加内容

本文作者可以追加内容哦 !