问题描述
所以我正在为印地语(印度次大陆使用的语言)音频进行语音到文本的项目。 在 Facebook 发布的 wav2vec 上看到了这篇精彩的论文。
我能够使用提到 here 的预训练模型运行该版本。 然而,正如预期的那样,这不会为非英语语言提供良好的结果。
然后我遇到了这个 repo,它实现了越南语的半监督学习位。不幸的是,这个似乎让我很难复制。
我也找不到任何其他为非英语语言实现 wav2vec 的资源。
- 谁能帮我找到一个博客/资源,它实现了它的半监督部分(最好在 python、windows 操作系统中完成)?
-或者,是否有任何其他新的 Python 语音到文本库/模型/API 提供印度语言支持(不包括 Google 的语音到文本 API)
提前致谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)