近日据外媒报道称,谷歌已经把人工智能技术运用在了图像搜索以及机器人对话等应用领域,此外,谷歌还把此项技术运用在了如何逼真地模仿人类声音上。
据了解,这个名为WaveNet的系统能够通过神经网络来生成语音波形元数据,从而能够使得机器人和计算机系统能够生动的模仿人类的各类声音,十分逼真。
>
根据研究人员透露,“参数式”文本语音转换(parametric TTS)则可通过语音编码器、合成分析和再现语音输入,但听起来还是太像机器,相比之下,真人在说话的时候,会有很多更加零碎的声音/语气相助,而WaveNet则是一个可以更好地学习模仿真人说话的AI。
WaveNet能够对原始声波模式进行建模,每秒分析16000个样本,然后生成一个基于之前声音的预测模型,结果就是惊人的高仿真度。