将String转换为JSON,以便在Kibana / Elasticsearch中进行搜索

问题描述

我有ElasticsearchFilebeatKibana在Windows机器上运行。 Filebeat日志具有正确的日志文件,正在监听路径。当我查看Kibana中的数据时,看起来不错。

我的问题是message字段是一个字符串。

一个日志行的示例:

12:58:09.9608 Trace {"message":"No more Excel rows found","level":"Trace","logType":"User","timeStamp":"2020-08-14T12:58:09.9608349+02:00","fingerprint":"226fdd2-e56a-4af4-a7ff-724a1a0fea24","windowsIdentity":"mine","machineName":"NAME-PC","processName":"name","processversion":"1.0.0.1","jobId":"957ef018-0a14-49d2-8c95-2754479bb8dd","robotName":"NAME-PC","machineId":6,"organizationUnitId":1,"fileName":"GetTransactionData"}

所以我现在想要的是将String转换为JSON,以便可以在Kibana搜索level字段。

我已经看过Filebeat。我在那里尝试启用LogStash。但是,这些数据不再提供给Elasticsearch。而且日志文件也不会生成LogStash文件夹中。

然后我通过install guide下载了LogStash,但不幸的是,我收到了以下消息:

C:\Users\name\Desktop\logstash-7.8.1\bin>logstash.bat 
Sending
Logstash logs to C:/Users/mine/Desktop/logstash-7.8.1/logs which
is Now configured via log4j2.properties ERROR: Pipelines YAML file is
empty. Location:
C:/Users/mine/Desktop/logstash-7.8.1/config/pipelines.yml usage:  
bin/logstash -f CONfig_PATH [-t] [-r] [] [-w COUNT] [-l LOG]  
bin/logstash --modules MODULE_NAME [-M
"MODULE_NAME.var.PLUGIN_TYPE.PLUGIN_NAME.VARIABLE_NAME=VALUE"] [-t]
[-w COUNT] [-l LOG]   bin/logstash -e CONfig_STR [-t] [--log.level
fatal|error|warn|info|debug|trace] [-w COUNT] [-l LOG]   bin/logstash
-i SHELL [--log.level fatal|error|warn|info|debug|trace]   bin/logstash -V [--log.level fatal|error|warn|info|debug|trace]  
bin/logstash --help
[2020-08-14T15:07:51,696][ERROR][org.logstash.Logstash    ]
java.lang.IllegalStateException: Logstash stopped processing because
of an error: (SystemExit) exit

编辑:

我尝试仅使用Filebeat。我在这里设置:

processors:
  - add_host_Metadata: ~
  - add_cloud_Metadata: ~
  - add_docker_Metadata: ~
  - add_kubernetes_Metadata: ~
  - dissect: 
      tokenizer: '"%{event_time} %{loglevel} %{json_message}"' 
      field: "message" 
      target_prefix: "dissect"
  - decode_json_fields: 
      fields: ["json_message"]

但这给了我

dissect_parsing_error

tokenizer删除“”的提示有所帮助。然后我得到了:

index issue

我只是刷新索引,消息消失了。很好。

但是现在的问题是,如何在新字段中过滤某些内容

kibana filter

解决方法

该消息说,您的管道配置为空。似乎您尚未配置任何管道。 Logstash可以解决问题(JSON filter plugin),但是Filebeat在这里就足够了。如果您不想引入其他服务,这是更好的选择。

它具有decode_json_fields选项,可将事件中包含JSON的特定字段转换为。这是documentation

在将来的情况下,如果您的整个事件都是JSON,则可以在filebeat中进行解析,以配置json.message_key和相关的json.*选项。

编辑-作为processors日志示例的dissecting示例,添加了文件拍点代码片段,分为三个字段(event_time,loglevel和json_message)。然后,最近提取的字段json_message(其值为一个编码为字符串的JSON对象)将被decoded转换为JSON结构:

 ... 

filebeat.inputs: 
  - type: log 
    paths: 
      - path to your logfile
  
processors: 
  - dissect: 
      tokenizer: '%{event_time} %{loglevel} %{json_message}' 
      field: "message" 
      target_prefix: "dissect"

  - decode_json_fields: 
      fields: ["dissect.json_message"]
      target: ""

  - drop_fields:
      fields: ["dissect.json_message"]


 ... 

如果您想练习filebeat处理器,请尝试设置正确的事件时间戳记,该事件时间戳记来自已编码的json,并使用timestamp processor写入@timestamp。