7月30日,生数科技国产纯自研视频大模型Vidu()全球上线。自四月底首次亮相以来,Vidu凭借媲美Sora的视频生成效果,迅速在国内外引起广泛关注。此次Vidu面向全球正式上线,开放文生视频、图生视频两大核心功能,提供4s和8s两种时长选择,分辨率最高达1080P。

在效果上,Vidu不仅延续了四月份展示的高动态性、高逼真度、高一致性等优势,还新增了角色一致性(Character To Video)、动漫风格、文字与特效画面生成等特色能力。更令人惊叹的是,Vidu实现了业界最快的实测推理速度,生成一段4秒片段只需30秒。目前Vidu无需申请,用户直接使用邮箱注册即可上手体验。

上线两大新功能:动漫风格、角色一致性

除了文生视频和图生视频的两大基础功能外,Vidu上线动漫风格和角色一致性两大新功能,旨在为用户提供更多样化和个性化的视频创作体验。

通过使用Vidu,万物皆可二次元。目前市面上的AI视频工具大多局限于写实风格或源于现实的想象。Vidu除了能实现常见的写实等多元风格外,还新增动漫风格选项。这一功能不仅保持动漫风格的一致性,还显著提高了画面的稳定性,避免了其他视频生成工具“动漫化”时常见的画面跳变和风格突变等问题。

其次在“图生视频”板块中,Vidu上线了角色一致性功能,用户可上传人像图或者自定义的角色图,然后通过文字描述指定该角色在任意场景中做出任意动作。例如,可以上传埃隆·马斯克的照片,通过输入描述词,让这位科技巨头化身宇航员遨游太空,或者变身钢铁侠。这一功能简化了视频制作流程,节省了设计和调整角色形象的时间,同时提供了极大的创作自由度。

理解力高、画面更美、动幅更大

目前业界对类Sora视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态的一致性,Vidu很好的平衡了三方面的表现。

Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可大幅提升视频的可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。

在画面质感上,Vidu在构图、叙事和光影等方面,能达到接近电影级的画面标准。无论是科幻、西部还是浪漫、动画等类型的电影,Vidu都能生成符合对应风格的画面片段。此外,Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG特效等。

实测推理速度业界最快,仅需30s即可生成片段

Vidu在推理速度上也取得了突破,4秒视频片段的生成时间实测仅需30秒,比业内最快水平的Gen-3工具快一倍,实测推理速度业界最快。这样的推理速度为用户提供了接近无缝的创作体验,加速了从构思到成片的转化过程,不仅提升了用户体验,也大大增强了Vidu的竞争力。

Vidu的这些创新功能和卓越性能,无疑将为视频制作领域带来革命性的变化,让创意和个性化表达变得更加容易和高效。

(首都在线)

追加内容

本文作者可以追加内容哦 !