如何使用Pentaho Data Integration-SpoonK​​ettle从HTTPS URL将CSV下载到文件?

问题描述

谷歌搜索这个问题时,似乎有人问了它,并且部分(而且效果很差)回答了很多次,主要是旧版本。

问题:在以下约束下,如何将CSV下载到本地文件?我正在Spoon中进行设计。

URL :将始终相同。 How to apply CSS to iframe?。网站准备了csv,并在大约4-5秒后将其作为文件下载提供给Web客户端。在浏览器中,这意味着它以.csv格式下载,而不显示。

身份验证:该网站不需要身份验证即可访问。数据不敏感。

本地文件路径:下载的CSV文件将覆盖现有的csv。例如:d:\ data \ my.csv。即,我可以将其设置为计时器,并使其每小时大约下载最新的csv。

代理:我很可能需要遍历网络代理。例如badproxy.mynetwork.internal:8080,该代理需要用户名和密码。如果我可以在一个位置设置此密码,这样更好,以后创建的任何东西都可以引用它。也不十分确定该如何处理。

我的其余过程集中于解决csv的内容,并且已经可以正常工作了。

我在google上找到的过程使用Http Client组件显示,尽管并不是特别简单,它如何转换为将文件本地保存到已知位置的文件。

感谢任何指针。

PDI v9.0.0.0-423

解决方法

需要触发 HTTP 客户端步骤。使用行生成器步骤生成例如1 个空行并将其与一个跃点链接到 HTTP 客户端步骤。 对于您的解决方案,试试这个: 数据网格-->HTTP 客户端-->CSV 文件输入->文本文件输出(用 csv 扩展)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...