Pentaho Kettle:将两个Unix日期时间列转换为一个

问题描述

我正在尝试使用Pentaho Kettle读取具有以下结构的Json文件,并将数据插入DW(Redshift)。

{
  "_id": {
    "_data": "11111111111111"
  },"operationType": "insert","clusterTime": {
    "$timestamp": {
      "t": 1599495064,"i": 1
    }
  },"ns": {
    "db": "abc","coll": "abc"
  },"documentKey": {
    "_id": {
      "$uuid": "abcabcabcabcabcabc"
    }
  },"fullDocument": {
    "_id": {
      "$uuid": "abcabcabcabcabcabc"
    },"orderNumber": "1234567","externalOrderId": "12345678","orderDateTime": "2020-09-11T08:06:26Z[UTC]","attraction": "abc","entryDate": {
      "$date": 1599523200000
    },"entryTime": {
      "$date": 1599472800000
    },"requestId": "abc","ticketUrl": "abc","tickets": [
      {
        "passId": "1111111","externalTicketId": "1234567"
      },{
        "passId": "222222222","externalTicketId": "122442492"
      }
    ],"_class": "abc"
  }
}

正如我们在上方看到的那样,“ entry_date”和“ entry_time”两栏均为Unix格式。我需要以某种方式从“ entry_date”中获取日期部分,并从“ entry_time”中获取时间部分,并将两者都转换为一个串联的唯一字段,这将为我提供以下输出:“ GMT:2020年9月7日,星期一4:11:04 PM”。

我也想为“ orderDateTime”字段实现相同的功能-有什么方法可以使用Pentaho将其转换为与上述“ GMT:2020年9月7日,星期一4:11:04下午”?

在下面,您可以看到当前如何为“选择值”步骤设置上方的3个字段(“ entry_time”,“ entry_date”和“ orderDatetime”)。然后从那里开始,通过Table Output步骤将数据放入DW,如下图所示。任何帮助表示赞赏。

enter image description here

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)