问题描述
我正在处理从本地系统到云作曲家的迁移任务,问题是,云作曲家是气流的完全托管版本,实际上限制了我在本地系统上对文件系统的访问对于某些路径,我们有很多环境变量,例如/opt/application/folder_1/subfolder_2/...
。
在查看Cloud Composer文档时,他们说您可以访问数据并将其保存在/home/airflow/gcs/data/
映射的 data 文件夹中,这意味着如果我继续前进,映射时,我应该将我的env变量值更改为类似/home/airflow/gcs/data/application/folder_1/folder_2
的东西,因为我正在运行许多依赖于这些值的bash脚本,这可能会有些痛苦。
有什么办法解决这个问题?
解决方法
您可以在Composer创建/更新过程[1]中指定环境变量。然后,这些变量存储在YAML文件中,这些文件创建了托管Composer的GKE集群。如果通过SSH进入运行Composer GKE集群的VM,然后输入一个工作容器并运行env
,则可以看到您指定的env变量。
[1] https://cloud.google.com/composer/docs/how-to/managing/environment-variables