问题描述
我想要开发一种应用程序,只要它识别出关键字就可以执行某项操作。它需要一直处于聆听模式,也必须处于背景。 我接触过this和this。我吓跑了它,但是在我讲话时它不起作用。 实际上,我阅读它仍然不支持我的母语。那是原因吗? 我想知道它是如何工作的?它正在对文本进行语音处理并将其保存在资产文件中吗?它在后台运行吗?它是使用过的AI模型吗?当两个应用并行需要麦克风资源时,它的行为如何?噪音?与Neural Networks API兼容吗?我该如何开始开发这种东西?
谢谢!
解决方法
尝试Vosk offline speech recognition on Android很高兴,以下是您问题的一些答案:
实际上我读到它仍然不支持我的母语。
如果您是希伯来语的支持者,我们将来可能会支持它,您可以自己构建。
那是原因吗?
您没有提供足够的信息来回答这个问题,请多解释一下什么是“不起作用”
我想知道它是如何工作的?
有关语音识别的大量文档可用于讲座,课程和书籍。您可以在这里找到一些介绍,例如:https://www.youtube.com/watch?v=q67z7PTGRi8
它是否正在对文本讲话并将其保存在资产文件中?
它可以对文本进行语音转换,但不会将结果保存到资产中,而只是显示它们。您无法修改资产,它们是静态的。
它在后台运行吗?
是
是否使用过AI模型?
当然
当两个应用并行需要麦克风资源时,它的表现如何?
在android中,无法同时录制两个应用的音频,第二个将被阻止。
噪音?
它对噪音很强。
它可以与神经网络API一起使用吗?
不,它是便携式的
我如何开始开发这样的东西?
获得一些基本的理解并开始编写代码。如果您还有其他疑问,可以在Telegram chat
中提问