用于触发数据更新和转换的 Linux 工具低端 ETL/数据仓库工具

问题描述

我有一堆脚本从互联网和本地服务收集数据,将它们写入磁盘,脚本转换数据并将其写入数据库,脚本从数据库读取数据并生成新数据等,用 bash 编写, Python、SQL、...(Linux)。

除了一些时间触发的脚本之外,脚本之间的粘合剂目前是我,不时运行脚本以特定顺序更新所有内容。

用观察依赖关系并在满足前提条件后立即触发下一步的工具来代替我的最简单方法是什么?

我发现了很多 ETL 和数据仓库工具,但对于我的简单设置来说,这些工具似乎太重了。我更喜欢具有基于文本的配置的 CLI 解决方案(也许能够可视化依赖关系图)。有什么建议吗?

解决方法

尝试气流:airflow.apache.org

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...