问题描述
我有一个日语文本,我正在使用Google Cloud Text to Speech功能将其转换为mp3。
我还想提供Google传回的mp3的字时间戳。
Google Speech to Text提供了此功能,但是当我提交从TTS到STT的文件时,结果并不总是很好。
解决方法
Google Cloud Speech-to-Text是一项基于ML的服务,因此,预期结果并不总是像您期望的那样“好”,这是有局限性的。
我可以建议看一下他们关于该主题的相关文档,例如best practices,guide和讨论它们的基础知识page。此外,您可以查看其问题跟踪平台中的问题,例如此issue,以获取有关其的更多信息,即使您在服务中发现可复制的问题,也可以在其中发布,因此其团队可以可以意识到这一点。