如何知道用户何时停止在私人助理中收听?

问题描述

我正在开发自己的虚拟助手,并取得了很多令我满意的进步。

当前,您按下一个按钮即可通话并释放以发送消息,但是我正在使用唤醒字开始监听。

使用Picovoice-Porcupine,我已经知道了,所以当说了唤醒字时,会打印出python脚本。目前,这意味着说“蓝莓”会显示“检测到唤醒字”。我可能会在这里开始录制(或者更可能使用最后几秒钟),但是就知道何时停止收听(因此,当用户停止讲话时)而言,我正在努力确定最佳选择

到目前为止,选择似乎是:

  • 说出唤醒字后,听x秒钟。

    • 一致而简单
  • 听沉

    • 长度更灵活
    • 但是,在任何嘈杂的环境中或有音乐的环境中,
  • 也许某种算法正在检测房间中的音量并跟踪最近几秒钟的平均“音量”。当说出唤醒字时,它会在再次达到此音量后停止收听?

    • 这是一个非常复杂的实现,需要大量的测试/配置
    • 理论上可以产生最好的结果

如果任何人有任何输入,或者也许有一些图书馆提供我想要的东西,我将非常感激,谢谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)