国联证券传媒行业报告:谷歌Gemini全新升级,交互式场景应用加速落地

北京时间5月15日凌晨,谷歌举办了I/O开发者大会,谷歌基础大模型Gemini全新升级,展示了多款产品以及升级。

Genimi全面升级,长文本和多模态迎突破

(1)基础大模型:发布升级版的Gemini1.5 Pro和轻量级Gemini 1.Flash。升级版Gemini 1.5 Pro上下文长度突破200万token,超过目前所有大模型。Gemini 1.5 Flash转为响应速度要求较高的特定或频繁任务优化,支持多模态以及100万token的长文本,同时实现了轻量化、低延迟和高效推理,每百万个token的价格仅为Pro版的二十分之一。此外,规模更大的开源模型Gemma 2 27B有望在6月份推出。(2)多模态模型:图像生成模型Imagen 3显著优化,可生成更多细节、光影丰富且干扰伪影更少的图像,能够准确的渲染图像细节;视频生成模型Veo可生成1080高质量视频,支持文本、图像、视频等多种格式的用户提升,还能捕捉视觉效果和影像风格的各种细节描述,而且通过“扩展”按钮,用户可生成超越Sora最长达1分10秒的视频。

Gemini全面赋能谷歌应用

(1)谷歌AI搜索:Gemini赋能谷歌搜索,总结概括能力大幅增强,搜索信息呈现更加鲜明,同时支持多步推理,可以将用户复杂问题分解,大幅提升搜索效率,给予用户全新的搜索体验。(2)谷歌Workspace:Gemini全面集成Gemini 1.5 Pro,Gmail邮箱、日历、文档、幻灯片、云盘等应用有望全新升级。(3)Project Astra:谷歌通用AI智能体,支持更加拟人的实时交互,能够很好的理解上下文并在交谈中快速做出反应,此外还支持广泛的语调变化,语音输出效果显著增强。(4)原生多模态Gemini App谷歌原生多模态应用,可同时支持文本、音频和视频内容。发布GenimLive,让用户与Genimi更加自然的交互,可随时打断Gemini的回答。

交互方式有望被重塑,重点关注社交、游戏、教育领域

我们认为具备真实世界感知的输入以及低延迟语音输出的超级智能助手,已经成为下一阶段行业竞争核心。谷歌Project Astra有望助推语音交互类AI应用的落地进程,其中在社交、游戏、教育领域有望率先落地。(1社交:落地门槛来看,陪伴类场景的任务简单、容错率高,因此成为最快落地的AI C端应用场景;从用户需求来看,AI智能体“更像人”是AI社交用户的核心需求。Project Astra有望从多模态、拟人化等方面大幅提升用户体验,从而推动AI社交类产品进一步破圈、提升商业化能力。(2)游戏:AI+NPC已在网易《逆水寒》等产品中落地,但仅限于文字类交互。随着Project Astra应用落地,游戏内NPC有望与用户实现实时的语音交互拟人化程度有望进一步提升,大幅提升用户的沉浸感,进而提升活跃度及付费意愿。(3)教育:Project Astra有望赋能“AI 教师”,使其交互更加快速和拟人,进一步提升教学、培训效率和用户体验。

风险提示:投资人应当认真阅读《基金合同》、《招募说明书》等基金法律文件,了解基金的风险收益特征,并根据自身的投资目的、投资期限、投资经验、资产状况等判断基金是否和投资人的风险承受能力相适应。基金的过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证。基金有风险,投资需谨慎。

免责声明:转载内容来自机构研报摘要、公开权威媒体报道,仅供读者参考,版权归原作者所有,内容为作者个人观点,版权归原作者(机构研究员、媒体记者)所有,内容仅代表作者个人观点,与建信基金管理有限公司无关;不作为对上述所涉行业及相关股票、基金的推荐,也不构成投资建议。对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本公司不作任何保证或承诺,请读者仅作参考。如需购买相关基金产品,请关注投资者适当性管理相关规定,做好风险评测,选择与之相匹配风险等级的产品。本文只提供参考并不构成任何投资及应用建议。如您认为本文对您的知识产权造成了侵害,请立即告知,我们将在第一时间处理。

#游戏传媒大涨,能否布局?#$建信互联网+产业升级股票(OTCFUND|001396)$$建信消费升级混合(OTCFUND|000056)$

追加内容

本文作者可以追加内容哦 !