问题描述
有很多关于声音分类的文献,其中可能的匹配是现代世界中发现的任何声音(例如:http://projects.csail.mit.edu/soundnet/)。这个问题的不同之处在于,它仅限于搜索少数本地录制和训练的特定声音。这个问题是关于编码移动应用程序的可行性,该应用程序将录制并转换少量声音(例如少于10个),然后能够“收听”并识别这些声音。
在类似的unanswered SO question中,作者以门铃的声音为例。我想对狗的发声进行分类,这与我的示例有所不同。我可能会定义“ fido bark”,“ rover bark”,“ fido whine”,“ rover whine”,所以当应用程序处于训练模式时,有四个按钮。然后,狗将发出声音,而人类使用者将对每种声音进行分类。然后,该应用程序将更改为收听模式,如果某个狗发出了一定的发声,则该应用程序将匹配声音并显示哪只狗和发生了什么发声。
在不进行外部处理的情况下,在典型的移动设备上对上述应用程序进行编码是否可行?如果可以,怎么办?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)