使用八度音程进行字母语音识别

问题描述

我正在尝试从音频文件中识别所有字母。 音频文件 (26) 是我说字母表的录音。 所以我正在尝试实现一个语音转文本程序,其中输入是我的声音说一个字母,我试图预测它是什么。

我想我将不得不对声音进行某种转换,例如 fft、频谱图。收集一些声音信息,如过零率、最大频率等。 然后尝试找到最相似的一个,比如欧几里得距离。

我正在尝试仅使用八度音程来执行此操作。 我不想要完整的代码,我只想知道从哪里开始。你会怎么做?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)