java – 读取文件并根据多个条件剪切每一行

我发现很难为这个问题提出一个合适的标题.因此,如果它具有误导性,我将不胜感激,如果你可以帮助改进它.

我已经提取了xml文件属性值,现在我有输出,如下面的示例行所示:

category:buffer overflow  analyzer:data flow analyzer:buffer

我需要将其拆分为

category:buffer overflow
analyzer:data flow
analyzer:buffer

我不知道如何使用Java,Perl或Python完成这项工作.

到目前为止,我所拥有的只是一个简单的Perl脚本,将其拆分为“:”.

所有建议都会有所帮助.

解决方法:

这个sed单行程在这里工作:

sed -r 's/ ([^ ]+:)/\n\1/g' input

测试:

kent$ echo "category:buffer overflow  analyzer:data flow analyzer:buffer" |sed -r 's/ ([^ ]+:)/\n\1/g'                                                                     
category:buffer overflow 
analyzer:data flow
analyzer:buffer

这个java行也在这里工作:

System.out.println("category:buffer overflow  analyzer:data flow analyzer:buffer".replaceAll("\\s([^\\s]+:)", "\n$1"));

还有另一条python线:

In [1]: import re

In [2]: s = 'category:buffer overflow  analyzer:data flow analyzer:buffer'                                                                                                 

In [3]: print re.sub(r"\s(?=[^\s]*:)",'\n',s)
category:buffer overflow 
analyzer:data flow
analyzer:buffer

相关文章

用的openwrt路由器,家里宽带申请了动态公网ip,为了方便把2...
#!/bin/bashcommand1&command2&wait从Shell脚本并行...
1.先查出MAMP下面集成的PHP版本cd/Applications/MAMP/bin/ph...
1、先输入locale-a,查看一下现在已安装的语言2、若不存在如...
BashPerlTclsyntaxdiff1.进制数表示Languagebinaryoctalhexa...
正常安装了k8s后,使用kubect工具后接的命令不能直接tab补全...