不断在后台android中进行语音识别

问题描述

我想要开发一种应用程序,只要它识别出关键字就可以执行某项操作。它需要一直处于聆听模式,也必须处于背景。 我接触过thisthis。我吓跑了它,但是在我讲话时它不起作用。 实际上,我阅读它仍然不支持我的母语。那是原因吗? 我想知道它是如何工作的?它正在对文本进行语音处理并将其保存在资产文件中吗?它在后台运行吗?它是使用过的AI模型吗?当两个应用并行需要麦克风资源时,它的行为如何?噪音?与Neural Networks API兼容吗?我该如何开始开发这种东西?

谢谢!

解决方法

尝试Vosk offline speech recognition on Android很高兴,以下是您问题的一些答案:

实际上我读到它仍然不支持我的母语。

如果您是希伯来语的支持者,我们将来可能会支持它,您可以自己构建。

那是原因吗?

您没有提供足够的信息来回答这个问题,请多解释一下什么是“不起作用”

我想知道它是如何工作的?

有关语音识别的大量文档可用于讲座,课程和书籍。您可以在这里找到一些介绍,例如:https://www.youtube.com/watch?v=q67z7PTGRi8

它是否正在对文本讲话并将其保存在资产文件中?

它可以对文本进行语音转换,但不会将结果保存到资产中,而只是显示它们。您无法修改资产,它们是静态的。

它在后台运行吗?

是否使用过AI模型?

当然

当两个应用并行需要麦克风资源时,它的表现如何?

在android中,无法同时录制两个应用的音频,第二个将被阻止。

噪音?

它对噪音很强。

它可以与神经网络API一起使用吗?

不,它是便携式的

我如何开始开发这样的东西?

获得一些基本的理解并开始编写代码。如果您还有其他疑问,可以在Telegram chat

中提问

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...