使用 Azure 数据工厂将 JSON blob 文件合并到 SQL 表的最佳方法

问题描述

我有一堆 JSON 文件进入 Azure 数据湖第 2 代,JSON 文件包含新数据和更新。

需要将数据合并到 sql 表中,以便我可以开始做一些报告。我解决这个问题的方法是创建一个看起来像这样的 Azure 数据工厂

enter image description here

创建并复制到临时表: 首先,我使用复制数据获取 JSON 并从架构中创建一个表并将内容转储到表中。

创建交付表: 如果表不存在,则创建一个具有正确架构的表

将温度与交付合并: 这里我使用了一个 merge 子句来转换和合并步骤 1 中创建的表中的数据和步骤 2 中的表。

删除临时数据: 从步骤 1 中删除

每当数据湖中有一个文件时,就会触发这个数据工厂。

管道解决了我的问题,但我觉得每次处理文件时都创建和删除一个新表会产生很多不必要的开销。

有没有办法优化这个流程,也许是通过将 JSON 直接合并到“交付”表?

提前致谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)