为自定义数据集训练 Wav2Vec-U

问题描述

我找到了 Wav2Vec-U 的 github 存储库,但没有很好的文档记录。我想知道是否有任何火车程序。我正在尝试在常见的语音音频上对其进行训练。但它需要我无权访问的 wrd、ltr 和 phn 文件

解决方法

目前最好的(唯一的?)相关文章是 this notebook 托管在 Kaggle 上。在该笔记本的评论部分,有一个指向 another notebook 的链接,该链接与您问题的 wrd,ltr,and phn files 部分特别相关。