问题描述
我正在寻找仅使用Python作为工具以经济高效的方式将RDBMS数据导入AWS Athena的方法。我可以使用PySpark进行上述操作,但是现在我只需要使用Python。 有人可以为此建议一些教程吗?
解决方法
我建议研究AWS Lake Formation,这是他们去年推出的一项服务,旨在帮助人们从本地RDBMS到Athena / EMR / Redshift收集数据。
我正在寻找仅使用Python作为工具以经济高效的方式将RDBMS数据导入AWS Athena的方法。我可以使用PySpark进行上述操作,但是现在我只需要使用Python。 有人可以为此建议一些教程吗?
我建议研究AWS Lake Formation,这是他们去年推出的一项服务,旨在帮助人们从本地RDBMS到Athena / EMR / Redshift收集数据。