在人工智能技术的浪潮中,商汤科技再次以技术创新引领行业潮流。7月4日,于上海举行的2024世界人工智能大会(WAIC)上,商汤科技正式发布了其首个面向C端用户的可控人物视频生成大模型——Vimi。这一创新成果不仅展示了商汤在AI视频生成领域的深厚积累,更为广大用户开启了全新的视频创作与娱乐体验。

Vimi大模型的亮相,标志着人物视频生成技术迈入了一个全新的阶段。据商汤科技介绍,Vimi凭借其强大的生成能力,仅需用户上传一张任意风格的照片,便能快速生成与目标动作一致的人物类视频。这一特性极大地降低了视频创作的门槛,使得即便是非专业用户也能轻松创作出高质量的人物视频内容。

更为令人瞩目的是,Vimi不仅支持通过单张照片生成视频,还提供了多种驱动方式,包括已有人物视频、动画、声音、文字等多种元素。这种多元化的驱动方式,使得用户可以根据自己的需求,灵活选择适合的素材进行视频创作,极大地丰富了视频内容的多样性和创意性。

在技术层面,Vimi大模型基于商汤科技的日日新大模型构建而成,依托其强大的计算能力和算法优化,实现了对人物表情、肢体动作乃至背景变化的精准控制。与以往的图片表情控制类技术相比,Vimi不仅能够控制人物的头部表情动作,还能在半身区域内实现自然肢体变化的精准控制,并自动生成与人物相符的头发、服饰及背景变化。这种全方位的控制能力,使得Vimi生成的视频人物更加生动自然,画面效果更加和谐唯美。

此外,Vimi大模型还具备极强的稳定性,能够稳定生成长达1分钟的单镜头人物类视频,且画面效果不会随着时间的变化而劣化或失真。这一特性对于需要长时间稳定视频生成的应用场景来说,无疑是一个巨大的福音。

商汤科技在AI领域的持续创新和突破,不仅为用户提供了更加丰富的娱乐体验,也为广告、电影制作等行业提供了高效便捷的工具。随着Vimi大模型的发布和应用推广,我们有理由相信,人物视频生成技术将迎来更加广阔的发展空间和应用前景。

作为人工智能行业的领军企业之一,商汤科技始终致力于推动AI技术的研发与应用。天眼查数据显示,商汤科技在技术研发、产品创新和市场拓展等方面均取得了显著成就,其业务范围覆盖多个领域,为众多行业提供了智能化的解决方案。未来,随着AI技术的不断发展和应用场景的不断拓展,商汤科技将继续发挥其技术优势和市场影响力,为用户带来更多创新的产品和解决方案。(数据支持:天眼查)

追加内容

本文作者可以追加内容哦 !