在移动设备上进行声音识别训练是否可行？

问题描述

有很多关于声音分类的文献，其中可能的匹配是现代世界中发现的任何声音（例如：http://projects.csail.mit.edu/soundnet/）。这个问题的不同之处在于，它仅限于搜索少数本地录制和训练的特定声音。这个问题是关于编码移动应用程序的可行性，该应用程序将录制并转换少量声音（例如少于10个），然后能够“收听”并识别这些声音。

在类似的unanswered SO question中，作者以门铃的声音为例。我想对狗的发声进行分类，这与我的示例有所不同。我可能会定义“ fido bark”，“ rover bark”，“ fido whine”，“ rover whine”，所以当应用程序处于训练模式时，有四个按钮。然后，狗将发出声音，而人类使用者将对每种声音进行分类。然后，该应用程序将更改为收听模式，如果某个狗发出了一定的发声，则该应用程序将匹配声音并显示哪只狗和发生了什么发声。

在不进行外部处理的情况下，在典型的移动设备上对上述应用程序进行编码是否可行？如果可以，怎么办？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

android android fft pearson-correlation