我发现很难为这个问题提出一个合适的标题.因此,如果它具有误导性,我将不胜感激,如果你可以帮助改进它.
我已经提取了xml文件的属性值,现在我有输出,如下面的示例行所示:
category:buffer overflow analyzer:data flow analyzer:buffer
我需要将其拆分为
category:buffer overflow
analyzer:data flow
analyzer:buffer
我不知道如何使用Java,Perl或Python完成这项工作.
到目前为止,我所拥有的只是一个简单的Perl脚本,将其拆分为“:”.
所有建议都会有所帮助.
解决方法:
这个sed单行程在这里工作:
sed -r 's/ ([^ ]+:)/\n\1/g' input
测试:
kent$ echo "category:buffer overflow analyzer:data flow analyzer:buffer" |sed -r 's/ ([^ ]+:)/\n\1/g'
category:buffer overflow
analyzer:data flow
analyzer:buffer
这个java行也在这里工作:
System.out.println("category:buffer overflow analyzer:data flow analyzer:buffer".replaceAll("\\s([^\\s]+:)", "\n$1"));
还有另一条python线:
In [1]: import re
In [2]: s = 'category:buffer overflow analyzer:data flow analyzer:buffer'
In [3]: print re.sub(r"\s(?=[^\s]*:)",'\n',s)
category:buffer overflow
analyzer:data flow
analyzer:buffer