为 Windows 设置 kenlm

问题描述

官方 website 明确表示 Windows 不支持 kenlmgithub repository 处有一个 Windows 标记,但似乎当时和那里的少数随机贡献者维护它。

然后如何为 Windows 设置 kenlm?

解决方法

新的 DeepSpeech PlayBook 还包括设置 Docker 映像和从 Docker 容器内运行训练的说明。如果您在 Windows 上使用 Docker,这可能是另一种解决方案。

构建新 Scorer 的信息是 still in a PR,但也可能有用。

,

解决方案是通过Windows Subsystem for Linux在Windows下使用Ubuntu

  1. Get Windows 版 WSL
  2. 从您的 ubuntu bash 导航到您要进行设置的文件夹。您可以从位于根目录下的 /mnt/c/ 文件夹访问 Windows 文件系统。
  3. 从那里只需遵循 official instructions,即克隆 git 存储库,然后运行 ​​cmake .. & make -j2 以构建项目(在您的 Ubuntu 中首先进行必要的安装之后系统)。

显然,您必须使用 Linux bash 训练模型或 scorers。您还可以使用 kenlm python library 在 Windows 中使用这些模型。

例如

应从您的 Ubuntu 系统中执行为 deepspeech-model 描述的 here 构建记分器的两个步骤。但是在你有了记分员之后,你应该能够运行命令

deepspeech --model deepspeech-0.9.3-models.pbmm --scorer kenlm.scorer --audio audio.wav

来自 Windows。但是,一旦您拥有 WSL,就无需从 Windows 执行此工作。 @您的 Ubuntu 系统一切正常。