将不同类型的文件加载到数据库中

问题描述

在我的工作中,我们每天都会收到数千封包含附件(xlsx,csv,xml,html,pdf等)的电子邮件。这些电子邮件由程序处理,文件被下载并过滤到不同的文件夹中,具体取决于发送者。

这些文件中的数据随后由专有软件加载到我们的MS SQL Server数据库中,为此,我们每年要为此支付巨额费用。

现在,我确定这对企业来说是一个非常普通的过程,因此可能有一些开源工具可用来替代该软件。

大多数人是怎么做到的?有单独的脚本吗?正确的方法是什么?

非常感谢您!

编辑:所有电子邮件附件在移动到各自的文件夹之前都已转换为xlsx。

解决方法

“正确”的方法是不使用Excel作为交换格式-数据类型(例如数字与文本)的模糊概念会造成很多问题。

Excel提要仍然是生活中的事实,因此至关重要的是采用一种全面可靠的方法来处理有时会失败的多个提要。我喜欢this approach;该示例使用了我公司的商业广告cross-platform .NET ETL library,但是我之前也使用了与其他几种ETL工具相同的方法。

干杯, 克里斯蒂安

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...