我正在尝试使用CYGWIN的GAWK来处理csv文件.通过1找到最大值,通过2打印匹配最大值的记录.我正在使用.awk文件作为输入.当我使用手册中的文本时,它在两次传递中都匹配.我可以使用IF形式作为解决方法,但这迫使我在每个模式匹配中使用IF,这是一种痛苦.知道我做错了什么吗?
这是我的.awk文件:
pass == 1 { print "pass1 is",pass; } pass == 2 { if(pass == 2) print "pass2 is",pass; }
这是我的输出(输入文件只是“你好”):
hello pass1 is 1 pass1 is 2 hello pass2 is 2
这是我的命令行:
gawk -F,-f test.awk pass=1 x.txt pass=2 x.txt
我很感激任何帮助.
解决方法
(g)awk解决方案可能如下所示:
awk 'FNR == NR{print "1st pass"; next} {print "second pass"}' x.txt x.txt
(如有必要,请用gawk替换awk.)
比方说,你想搜索文件x.txt的第一列中的最大值,然后在第一列中打印所有具有此值的行,你的程序可能看起来像这样(感谢Ed Morton的一些提示,请参阅注释):
awk -F"," 'FNR==NR {max = ( (FNR==1) || ($1 > max) ? $1 : max ); next} $1==max' x.txt x.txt
x.txt的输出:
6,5 2,6 5,7 6,9
是
6,5 6,9
这是如何运作的?变量NR随着每个记录而不断增加,而在读取新文件时FNR重置为1.因此,FNR == NR仅适用于处理的第一个文件.