问题描述
我正在尝试对文本数据进行域适应,以改进 Google Cloud Speech-to-Text 的语音转文本结果。 我已经使用 Azure 和 AWS 语音转文本系统完成了这项工作。在那里,您只需将包含领域特定语言的庞大文本语料库扔给系统,然后通常会获得更好的结果。
对于 Google 语音到文本系统,我还没有找到类似的东西。我发现的是这个教程:https://cloud.google.com/speech-to-text/docs/speech-adaptation
遗憾的是,这仅允许非常具体的改编(手动添加应该更好识别的单词)。
我曾尝试对我的文本语料库进行关键字提取并将提取的单词放入 speech_contexts[{"phrases": []}]
参数中,但这并没有改变我的结果。
有没有什么方法可以训练 Google 语音到文本服务(语言模型),并具有用于领域自适应的大型文本语料库?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)