Real-Time Voice Cloning 介绍
Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to
Multispeaker Text-To-Speech
Synthesis(SV2TTS)”论文的实现,这是一个三阶深度学习框架,允许从几秒钟的音频中创建一个数字化的语音,并使用它来调节训练的“文本转语音”模型,以推广到新的声音。
此项目中带有一个实时工作的声码器。
程序名称:Real-Time Voice Cloning
授权协议: MIT
操作系统: 跨平台
开发语言: Python
Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to
Multispeaker Text-To-Speech
Synthesis(SV2TTS)”论文的实现,这是一个三阶深度学习框架,允许从几秒钟的音频中创建一个数字化的语音,并使用它来调节训练的“文本转语音”模型,以推广到新的声音。
此项目中带有一个实时工作的声码器。