$北信源(SZ300352)$  

1、数据宝:KAUST和哈佛大学研究团队发表的论文中提出MiniGPT4-Video框架——专为视频理解而设计的多模态大模型。该模型能够处理时间视觉和文本数据,使其能够熟练地理解视频的复杂性。MiniGPT4-video不仅考虑视觉内容,还集成了文本对话,允许模型有效地回答涉及视觉和文本组件的查询。据悉,该模型优于现有的最先进的方法,在MSVD、MSRVTT、TGIF和TVQA基准上分别提高了4.22%、1.13%、20.82%和13.1%,模型和代码已公开。但目前的缺陷在于上下文窗口限制。下一步,团队将研究模型能力扩展到处理更长视频的能力。

A股市场的多模态大模型概念股共计13只。从净利润变动来看,大华股份和万兴科技2023年净利润同比翻倍,增幅依次为217.1%、112.1%。另有拓维信息、佳都科技、北信源等实现扭亏为盈。近期,大华股份在互动平台表示,公司在通信能力方面,围绕网络连接技术、数据交换技术和前沿网络技术三个方面,打造融合连接能力体系,通信和连接技术的持续进步,有助于支撑物联网向视联网升级。公司发布了星汉大模型,融合图像、点云、文本、语音等多模态数据,实现了准确性和泛化性的跃升,大幅提升视觉解析能力。万兴科技旗下“天幕”大模型以音视频生成式AI技术为基础,由视频、音频、图片和语言大模型组成,涵盖文生视频、文生3D视频、视频AI配乐、数字人播报等近百项音视频原子能力,同时支持全球不同语言,相关能力已在Wondershare Filmora、Wondershare Virbo

追加内容

本文作者可以追加内容哦 !