修改文件中的文本数百万列,制表符分隔-删除除第一个选项卡外的所有选项卡,并在最后一列之后添加新列

问题描述

| 在这里,我希望您对文本文件修改有所帮助。 我想修改文件中的文本(数百万列,以制表符分隔)-删除除第一个以外的所有选项卡,并在最后一列后面添加新列。 文件(此处有4列,但 我的真实文件中有数百万列 制表符分隔)我现在有:
day1 1 3 7
day7 2 4 8
day3 2 5 6
我要的文件删除分隔符 (从第二个开始),然后添加三个 新列(一个与 第一个,其他两个相同 所有同一列中的值,此处为x 和y)。
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y
我打算用awk和sed混合使用。但是,我尝试了许多不同的方法,但我仍然不这样做。 你能给我任何帮助吗?提前致谢。 最好,     

解决方法

        使用
gawk -f script.awk < input > output
,其中
script.awk
包含:
{
    old=$1;
    $0 = substr($0,length($1)+1);
    gsub(/[[:space:]]*/,\"\",$0);
    print old,$0,old,\"x\",\"y\";
} 
在此处观看现场演示(感谢belisarius向我展示此网站)     ,        这个问题被标记为[perl],因此出于完整性考虑:
#! /usr/bin/perl -lan

BEGIN { $,= \"\\t\" }

$first = shift @F;
print $first,join(\"\",@F),$first,qw/ x y /;
该程序使用了几个便利功能来保持简洁。 将
$,
设置为TAB字符,类似于awk中的
FS
-l
开关会将
\"\\n\"
隐式地添加到每个
print
,其工作方式类似于awk中的
ORS
-a
(自动分割或awk模式)开关   当与
-n
-p
一起使用时,打开自动分割模式。对
@F
数组的隐式
split
命令是由
-n
-p
产生的隐式while循环内的第一件事。
perl -ane \'print pop(@F),\"\\n\";\'
     相当于
while (<>) {
  @F = split(\' \');
  print pop(@F),\"\\n\";
}
ѭ13开关隐式循环输入的所有行   使Perl在您的程序周围假设以下循环,从而使其遍历文件名参数,例如
sed -n
awk
LINE:
while (<>) {
  ...  # your program goes here
}
    ,        这可能对您有用:
sed \'s/\\t//2g;s/\\(.*\\t\\)\\(.*\\)/&\\t\\1x\\ty/\' file
day1    137     day1    x       y
day7    248     day7    x       y
day3    256     day3    x       y
我猜是因为它是一个制表符分隔的文件,所以您希望将新列用制表符分隔。如果不:
sed \'s/\\t//2g;s/\\(.*\\)\\t\\(.*\\)/& \\1 x y/\' file
day1    137 day1 x y
day7    248 day7 x y
day3    256 day3 x y