$中原传媒(SZ000719)$  3月30日凌晨,OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。


用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。


除了能合成音频之外,OpenAI还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。

OpenAI并非展示了一些简单的demo,而是一些实际场景化用例,这也就是说Voice Engine的技术已经非常成熟。

Age of Learning 是一家儿童教育公司,他们一直在使用Voice Engine生成各种有声读物。同时还通过与GPT-4的相结合使用,创建实时、个性化的回答与学生互动。

除了语音合成之外,Voice Engine还能提供视频翻译功能,可以将一种视频语音无差别的翻译成多国语言。

HeyGen是一家AI视频合成平台,主要帮助企业开发商品展示的“数字人”。

他们通过使用Voice Engine进行视频翻译,扩展至多国语言来扩大全球覆盖受众帮助声音受损的人恢复声音:诺曼-普林斯生命科学研究所正在测试一项实验,正通过Voice Engine帮助那些因肿瘤或神经系统病因,导致语言障碍的患者恢复声音。

目前,他们已经帮助一位因血管性脑肿瘤,而失去流利语言表达能力的年轻女患者恢复了声音。

追加内容

本文作者可以追加内容哦 !