$科德教育(SZ300192)$   

杨龚轶凡介绍,中昊芯英用一个包含5.8亿个视频片段的庞大数据库,通过级联切换检测等手段筛选出一个包含约1.5亿个高质量视频片段的数据库;构建了扩散模型和transform相结合的混合模型;然后通过图像预训练、视频预训练、微调等分层的训练架构,对模型进行了预训练和架构创新调整,显著提升了高保真视频的生成能力。目前,最新版本V-Gen XT已经实现了每秒24帧的高清视频生成。




“当前,算力供应紧张是AI大模型发展的瓶颈之一。”比起业界担心大模型性能,杨龚轶凡则更关注算力供应。他认为,在国内算力支撑存在瓶颈、数据量也相对较小的情况下,以V-Gen为代表的国内AI大模型,在各个细分赛道上,正不断逼近Sora的性能。当前,如何构建具有性价比的智能算力集群,是AI产业界面临的一大挑战。


追加内容

本文作者可以追加内容哦 !