不断在后台android中进行语音识别

问题描述

我想要开发一种应用程序，只要它识别出关键字就可以执行某项操作。它需要一直处于聆听模式，也必须处于背景。我接触过this和this。我吓跑了它，但是在我讲话时它不起作用。实际上，我阅读它仍然不支持我的母语。那是原因吗？我想知道它是如何工作的？它正在对文本进行语音处理并将其保存在资产文件中吗？它在后台运行吗？它是使用过的AI模型吗？当两个应用并行需要麦克风资源时，它的行为如何？噪音？与Neural Networks API兼容吗？我该如何开始开发这种东西？

谢谢！

解决方法

尝试Vosk offline speech recognition on Android很高兴，以下是您问题的一些答案：

实际上我读到它仍然不支持我的母语。

如果您是希伯来语的支持者，我们将来可能会支持它，您可以自己构建。

那是原因吗？

您没有提供足够的信息来回答这个问题，请多解释一下什么是“不起作用”

我想知道它是如何工作的？

有关语音识别的大量文档可用于讲座，课程和书籍。您可以在这里找到一些介绍，例如：https://www.youtube.com/watch?v=q67z7PTGRi8

它是否正在对文本讲话并将其保存在资产文件中？

它可以对文本进行语音转换，但不会将结果保存到资产中，而只是显示它们。您无法修改资产，它们是静态的。

它在后台运行吗？

是

是否使用过AI模型？

当然

当两个应用并行需要麦克风资源时，它的表现如何？

在android中，无法同时录制两个应用的音频，第二个将被阻止。

噪音？

它对噪音很强。

它可以与神经网络API一起使用吗？

不，它是便携式的

我如何开始开发这样的东西？

获得一些基本的理解并开始编写代码。如果您还有其他疑问，可以在Telegram chat

中提问

android android java java voice-recognition vosk