问题描述
我正在开发自己的虚拟助手,并取得了很多令我满意的进步。
当前,您按下一个按钮即可通话并释放以发送消息,但是我正在使用唤醒字开始监听。
使用Picovoice-Porcupine,我已经知道了,所以当说了唤醒字时,会打印出python脚本。目前,这意味着说“蓝莓”会显示“检测到唤醒字”。我可能会在这里开始录制(或者更可能使用最后几秒钟),但是就知道何时停止收听(因此,当用户停止讲话时)而言,我正在努力确定最佳选择
到目前为止,选择似乎是:
-
说出唤醒字后,听x秒钟。
- 一致而简单
- 长期效果不佳
-
听沉默
- 长度更灵活
- 但是,在任何嘈杂的环境中或有音乐的环境中,
-
也许某种算法正在检测房间中的音量并跟踪最近几秒钟的平均“音量”。当说出唤醒字时,它会在再次达到此音量后停止收听?
- 这是一个非常复杂的实现,需要大量的测试/配置
- 理论上可以产生最好的结果
如果任何人有任何输入,或者也许有一些图书馆提供我想要的东西,我将非常感激,谢谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)