问题描述
我正在尝试使用Mozilla DeepSpeech构建语音到文本的算法,但是在安装该软件包时遇到了麻烦。
首先,我在Anaconda中创建了一个名为deepspeech-venv
的新虚拟环境,并使用以下命令通过deepspeech
在Anaconda Powershell中安装了pip
软件包的最新版本(v0.8.1): pip install deepspeech --upgrade
。
接下来,我使用命令pbmm
和tflite
从Mozilla的GitHub下载了wget https://github.com/mozilla/DeepSpeech/releases/download/v0.8.1/deepspeech-0.8.1-models.pbmm
版和wget https://github.com/mozilla/DeepSpeech/releases/download/v0.8.1/deepspeech-0.8.1-models.tflite
版的预训练英语模型。
最后,我想检查并确保所有内容都正确安装,因此我在命令行中键入了deepspeech -h
,这产生了以下错误语句:
Traceback (most recent call last):
File "c:\users\zachary.holden\anaconda3\envs\deepspeech_venv\lib\runpy.py",line 193,in _run_module_as_main
"__main__",mod_spec)
File "c:\users\zachary.holden\anaconda3\envs\deepspeech_venv\lib\runpy.py",line 85,in _run_code
exec(code,run_globals)
File "C:\Users\zachary.holden\Anaconda3\envs\deepspeech_venv\Scripts\deepspeech.exe\__main__.py",line 4,in <module>
File "c:\users\zachary.holden\anaconda3\envs\deepspeech_venv\lib\site-packages\deepspeech\__init__.py",line 23,in <module>
from deepspeech.impl import Version as version
File "c:\users\zachary.holden\anaconda3\envs\deepspeech_venv\lib\site-packages\deepspeech\impl.py",line 13,in <module>
from . import _impl
ImportError: DLL load failed: The specified module could not be found.
据我了解,这意味着我缺少deepspeech
库的某些依赖项;但是,我不太确定需要安装哪些其他DLL,甚至不确定该过程如何进行。 (当然,除非问题出在我的安装过程中,而我只需要添加另一个库即可。)
注意:我正在Windows 10 64位系统上运行Python v3.7.7。
解决方法
您缺少一些依赖项,请按照以下步骤进行操作-您会很好的。
您可以使用conda虚拟环境代替python virtualenv。
# Create and activate a virtualenv
virtualenv -p python3 $HOME/tmp/deepspeech-venv/
source $HOME/tmp/deepspeech-venv/bin/activate
# Install DeepSpeech
pip3 install deepspeech
# Download pre-trained English model files
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.8.1/deepspeech-0.8.1-models.pbmm
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.8.1/deepspeech-0.8.1-models.scorer
# Download example audio files
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.8.1/audio-0.8.1.tar.gz
tar xvf audio-0.8.1.tar.gz
# Transcribe an audio file
deepspeech --model deepspeech-0.8.1-models.pbmm --scorer deepspeech-0.8.1-models.scorer --audio audio/2830-3980-0043.wav
注意-如果可能,请尝试使用新的虚拟环境。