杨龚轶凡介绍，中昊芯英用一个包含5.8亿个视频片段的庞大数据库，通过级联切换检测_财富号

杨龚轶凡介绍，中昊芯英用一个包含5.8亿个视频片段的庞大数据库，通过级联切换检测

杨龚轶凡介绍，中昊芯英用一个包含5.8亿个视频片段的庞大数据库，通过级联切换检测等手段筛选出一个包含约1.5亿个高质量视频片段的数据库；构建了扩散模型和transform相结合的混合模型；然后通过图像预训练、视频预训练、微调等分层的训练架构，对模型进行了预训练和架构创新调整，显著提升了高保真视频的生成能力。目前，最新版本V-Gen XT已经实现了每秒24帧的高清视频生成。

“当前，算力供应紧张是AI大模型发展的瓶颈之一。”比起业界担心大模型性能，杨龚轶凡则更关注算力供应。他认为，在国内算力支撑存在瓶颈、数据量也相对较小的情况下，以V-Gen为代表的国内AI大模型，在各个细分赛道上，正不断逼近Sora的性能。当前，如何构建具有性价比的智能算力集群，是AI产业界面临的一大挑战。

追加内容

本文作者可以追加内容哦 !

代码	名称	最新价	涨跌幅
查看更多

代码

名称

总收益	20日收益	日收益
--	--	--

最新操作
-	-	-