近日,AI“孙燕姿”爆火,其翻唱的《发如雪》《下雨天》短短几天就突破百万播放量,一度登上各大平台热搜榜首位,成为“新晋顶流”。在B站在搜索框输入“AI”后,第一个词条就是“AI孙燕姿”。除了孙燕姿外,还有周杰伦、王心凌、许嵩、Lady Gaga等歌手也被网友制作出了「AI替身」。有人说,这是2023年最火的声音,有人说,这是对真人歌手赤裸裸的侵权,还有人说,这是AI技术的新高度,AI将成为音乐创作的新工具。

元境科技人工智能专家解读“AI孙燕姿”背后原理

    “AI孙燕姿”凭什么能够如此爆火,让网友们喜爱不已,又是怎么做到如此拟真,实现接近原唱效果的呢?为了搞明白背后的技术原理,小编特意请教了元境科技人工智能方面的专家。了解到“AI孙燕姿”正是利用了当下最热门的人工智能技术,通过建立神经网络模型,经过大量音乐数据集训练,使得AI虚拟歌手的声音与真人歌手无异。

    “AI孙燕姿”使用的核心技术来源于Sovits4.0歌声转换模型,基于so-vits-svc的开源项目制作。歌声转换模型通过SoftVC内容编码器提取歌曲的音调、音高等特征,然后将每段音频做成几秒到十几秒不等的切片,然后将翻唱者的声音数据丢给算法拾取出来,再和歌曲的切片对应。最后,再对生成的歌曲进行后期优化,比如加入混响或简单修音,一首AI翻唱歌曲就制作完成了。

「MetaSurfing-元享智能云平台」华语AI音乐最佳选择

    要说最了解咱们华语音乐的,那自然还得是咱们中国人自己。正好最近元境科技的「MetaSurfing-元享智能云平台」免费开放,其内置的AI音频模块集成了元境科技自研的声学模型,该模型学习了大量中文曲目,针对华语音乐做了海量优化,把使用门槛降低到了“有手有嘴就行”(为此算法工程师小哥哥的头发都快掉光了)。表现效果达到了世界第一梯队水平。用了元享智能云平台,AI版的你说不定就是下一个华语乐坛“新晋顶流”。

    

追加内容

本文作者可以追加内容哦 !