获取TTS的单词时间戳

问题描述

我有一个日语文本,我正在使用Google Cloud Text to Speech功能将其转换为mp3。

我还想提供Google传回的mp3的字时间戳。

Google Speech to Text提供了此功能,但是当我提交从TTS到STT的文件时,结果并不总是很好。

同时获取TTS mp3字词时间戳的最佳方法是什么?

解决方法

Google Cloud Speech-to-Text是一项基于ML的服务,因此,预期结果并不总是像您期望的那样“好”,这是有局限性的。

我可以建议看一下他们关于该主题的相关文档,例如best practicesguide和讨论它们的基础知识page。此外,您可以查看其问题跟踪平台中的问题,例如此issue,以获取有关其的更多信息,即使您在服务中发现可复制的问题,也可以在其中发布,因此其团队可以可以意识到这一点。