问题描述
|
在这里,我希望您对文本文件的修改有所帮助。
我想修改文件中的文本(数百万列,以制表符分隔)-删除除第一个以外的所有选项卡,并在最后一列后面添加新列。
文件(此处有4列,但
我的真实文件中有数百万列
制表符分隔)我现在有:
day1 1 3 7
day7 2 4 8
day3 2 5 6
我要的文件,删除分隔符
(从第二个开始),然后添加三个
新列(一个与
第一个,其他两个相同
所有同一列中的值,此处为x
和y)。
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y
我打算用awk和sed混合使用。但是,我尝试了许多不同的方法,但我仍然不这样做。
你能给我任何帮助吗?提前致谢。
最好,
解决方法
使用
gawk -f script.awk < input > output
,其中script.awk
包含:
{
old=$1;
$0 = substr($0,length($1)+1);
gsub(/[[:space:]]*/,\"\",$0);
print old,$0,old,\"x\",\"y\";
}
在此处观看现场演示(感谢belisarius向我展示此网站)
, 这个问题被标记为[perl],因此出于完整性考虑:
#! /usr/bin/perl -lan
BEGIN { $,= \"\\t\" }
$first = shift @F;
print $first,join(\"\",@F),$first,qw/ x y /;
该程序使用了几个便利功能来保持简洁。
将$,
设置为TAB字符,类似于awk中的FS
-l
开关会将\"\\n\"
隐式地添加到每个print
,其工作方式类似于awk中的ORS
-a
(自动分割或awk模式)开关
当与-n
或-p
一起使用时,打开自动分割模式。对@F
数组的隐式split
命令是由-n
或-p
产生的隐式while循环内的第一件事。
perl -ane \'print pop(@F),\"\\n\";\'
相当于
while (<>) {
@F = split(\' \');
print pop(@F),\"\\n\";
}
ѭ13开关隐式循环输入的所有行
使Perl在您的程序周围假设以下循环,从而使其遍历文件名参数,例如sed -n
或awk
:
LINE:
while (<>) {
... # your program goes here
}
, 这可能对您有用:
sed \'s/\\t//2g;s/\\(.*\\t\\)\\(.*\\)/&\\t\\1x\\ty/\' file
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y
我猜是因为它是一个制表符分隔的文件,所以您希望将新列用制表符分隔。如果不:
sed \'s/\\t//2g;s/\\(.*\\)\\t\\(.*\\)/& \\1 x y/\' file
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y