修改文件中的文本数百万列，制表符分隔-删除除第一个选项卡外的所有选项卡，并在最后一列之后添加新列

问题描述

| 在这里，我希望您对文本文件的修改有所帮助。我想修改文件中的文本（数百万列，以制表符分隔）-删除除第一个以外的所有选项卡，并在最后一列后面添加新列。文件（此处有4列，但我的真实文件中有数百万列制表符分隔）我现在有：

day1 1 3 7
day7 2 4 8
day3 2 5 6

我要的文件，删除分隔符（从第二个开始），然后添加三个新列（一个与第一个，其他两个相同所有同一列中的值，此处为x 和y）。

day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y

我打算用awk和sed混合使用。但是，我尝试了许多不同的方法，但我仍然不这样做。你能给我任何帮助吗？提前致谢。最好，

解决方法

使用gawk -f script.awk < input > output，其中script.awk包含：

{
    old=$1;
    $0 = substr($0,length($1)+1);
    gsub(/[[:space:]]*/,\"\",$0);
    print old,$0,old,\"x\",\"y\";
}

在此处观看现场演示（感谢belisarius向我展示此网站） , 这个问题被标记为[perl]，因此出于完整性考虑：

#! /usr/bin/perl -lan

BEGIN { $,= \"\\t\" }

$first = shift @F;
print $first,join(\"\",@F),$first,qw/ x y /;

该程序使用了几个便利功能来保持简洁。将$,设置为TAB字符，类似于awk中的FS -l开关会将\"\\n\"隐式地添加到每个print，其工作方式类似于awk中的ORS -a（自动分割或awk模式）开关当与-n或-p一起使用时，打开自动分割模式。对@F数组的隐式split命令是由-n或-p产生的隐式while循环内的第一件事。

perl -ane \'print pop(@F),\"\\n\";\'

相当于

while (<>) {
  @F = split(\' \');
  print pop(@F),\"\\n\";
}

ѭ13开关隐式循环输入的所有行使Perl在您的程序周围假设以下循环，从而使其遍历文件名参数，例如sed -n或awk：

LINE:
while (<>) {
  ...  # your program goes here
}

, 这可能对您有用：

sed \'s/\\t//2g;s/\\(.*\\t\\)\\(.*\\)/&\\t\\1x\\ty/\' file
day1    137     day1    x       y
day7    248     day7    x       y
day3    256     day3    x       y

我猜是因为它是一个制表符分隔的文件，所以您希望将新列用制表符分隔。如果不：

sed \'s/\\t//2g;s/\\(.*\\)\\t\\(.*\\)/& \\1 x y/\' file
day1    137 day1 x y
day7    248 day7 x y
day3    256 day3 x y

一列之后之后修改分隔删除删除删除制表符并在文件文本文本最后添加添加添加第一个选项选项