我把问题缩短了.实际上我的数据比这长得多.
aa,bb,cc,dd,ee,4 ff,gg,hh,ii,jj,5 kk,ll,mm,nn,oo,3 pp,qq,rr,ss,tt,2 uu,vv,ww,xx,yy,5 aa,2
现在我想使用awk选择最后一列中具有相同编号的每一行并将其重定向到一个新文件,这些新文件将根据最后一列中的数字而有所不同.
例如. t2.txt,t3.txt,t4.txt,t5.txt将分别保留最后一个数字为2,3,4,5的行.
在t2.txt中:
pp,2 aa,2
在t3.txt中:
kk,3
在t4.txt中:
aa,4
在t5.txt中:
ff,5 uu,5
我想我需要这样的东西:
BEGIN {FS=","} { for (n=2; n<=5; n++) if ($6 ~/\$n/) {print > "t\$n.txt"} }
但我只是不知道如何使它工作.
这个bash文件做我想要的,但问题是,每次它提取具有特定数字的行时,它必须读入所有行.如何仅查看文件的时间并提取所有数字的文件?
#!/bin/bash for num in {2..5}; do gawk --assign FS="," "\$6 ~/${num}/" infile >> t${num}.txt done