在 AWS Lambda 中找不到 NLTK 模块

问题描述

我已成功安装了一个名为 pronounceable 的软件包，可用于 Lambda 函数。然而，NLTK 语料库 cmudict 似乎是一个无法定位的依赖项。这意味着使用命令 import pronounceable 会导致以下错误。

>  Resource [93mcmudict[0m not found.   Please use the NLTK Downloader
> to obtain the resource:
> 
>   [31m>>> import nltk
>   >>> nltk.download('cmudict')   [0m   For more information see: https://www.nltk.org/data.html
> 
>   Attempted to load [93mcorpora/cmudict[0m
> 
>   Searched in:
>     - './nltk_data'
>     - '/home/sbx_user1051/nltk_data'
>     - '/var/lang/nltk_data'
>     - '/var/lang/share/nltk_data'
>     - '/var/lang/lib/nltk_data'
>     - '/usr/share/nltk_data'
>     - '/usr/local/share/nltk_data'
>     - '/usr/lib/nltk_data'
>     - '/usr/local/lib/nltk_data'

我尝试了什么

1.这是我用来安装包的代码，通过创建一个层应用到我的 Lambda 函数。

# STEP 1 
mkdir folder
cd folder
virtualenv v-env
source ./v-env/bin/activate
pip install pronounceable
deactivate 


# STEP 2
mkdir python
cd python
cp -r ../v-env/lib64/python3.6/dist-packages/* .
cd ..
zip -r pronounceable_layer.zip python
aws lambda publish-layer-version --layer-name pronounceable --zip-file fileb://panda_layer.zip --compatible-runtimes python3.6

然后我简单地选择并将结果层添加到 Lambda 函数。然后，根据 this suggestion，我将 cmudict 的内容（我已手动下载到本地计算机）放入文本文件中，位于 Lambda 根文件夹中名为 nltk_data 的文件夹中. 我还尝试通过添加具有键/值 NLTK_DATA & ./nltk_data 的环境变量来缓解该问题，并在函数顶部添加了 nltk.download('cmudict',download_dir="/var/task/nltk_data")，但无济于事。