在awk中以特定方式重命名第一列

问题描述

这是我的输入文件

900 mgdg molecules in water t= 953400.00000 step= 635600000
177255
    1BGL     C5    1   4.977  15.059   2.068
    1BGL     H5    2   5.025  15.020   2.158
    1BGL     O5    3   4.881  14.948   2.052
...(a lot of lines between)
...
    4LIN    HI216099   1.909  19.279   7.886
    4LIN    HI316100   1.849  19.417   7.987 (the last line,which I want to modify is 116102)
...
...
20389SOL    HW177254   0.325   8.307   3.850
20389SOL    HW277255   0.245   8.235   3.957
   5.75588  25.65343  12.14665

我的输出文件应该看起来像

900 mgdg molecules in water t= 953400.00000 step= 635600000
177255
    1MGD     C5    1   4.977  15.059   2.068
    1MGD     H5    2   5.025  15.020   2.158
    1MGD     O5    3   4.881  14.948   2.052
...(a lot of lines between)
...
  900MGD    HI216099   1.909  19.279   7.886
  900MGD    HI316100   1.849  19.417   7.987 (the last line,which I want to modify is 116102)
...
...
20389SOL    HW177254   0.325   8.307   3.850
20389SOL    HW277255   0.245   8.235   3.957
   5.75588  25.65343  12.14665

我只想修改100个文件中的第一列。每增加129行,我就会增加价值。例如,第一列的3-131行具有1MGD,然后132-260-2MGD行,直到116102行。

这是我的脚本,但是没有用

#!/bin/bash
for index in {1..100} 
do
    awk 'BEGIN { grp = 129 }
        {if (NR>=3 && NR<=116102) { 

        for (i=1; i<=116102; i++) {
                    $1 = (int($i/grp)+1)"MGD"
        }
        }; print $0}' eq15_$index.gro | tee eq2_15_$index.gro
done

你能帮我吗?

解决方法

awk 'NR>=3 && NR<=116102{ x=int((NR-3)/129+1); $1=x"MGD" }1' file

测试:

您必须设置起点NR和除数来定义它。例如,此测试文件:

900 mgdg molecules in water t= 953400.00000 step= 635600000
177255
    1BGL     C5    1   4.977  15.059   2.068
    1BGL     H5    2   5.025  15.020   2.158
    1BGL     O5    3   4.881  14.948   2.052
    1BGL     C5    1   4.977  15.059   2.068
    1BGL     H5    2   5.025  15.020   2.158
    1BGL     O5    3   4.881  14.948   2.052
    1BGL     O5    3   4.881  14.948   2.052
    4LIN    HI216099   1.909  19.279   7.886
    4LIN    HI316100   1.849  19.417   7.987 (the last line,which I want to modify
20389SOL    HW177254   0.325   8.307   3.850
20389SOL    HW277255   0.245   8.235   3.957
   5.75588  25.65343  12.14665

每3行修改3-11行:

> awk 'NR>=3 && NR<=11{ x=int( (NR-3)/3+1);$1 = x"MGD"}1' file
900 mgdg molecules in water t= 953400.00000 step= 635600000
177255
1MGD C5 1 4.977 15.059 2.068
1MGD H5 2 5.025 15.020 2.158
1MGD O5 3 4.881 14.948 2.052
2MGD C5 1 4.977 15.059 2.068
2MGD H5 2 5.025 15.020 2.158
2MGD O5 3 4.881 14.948 2.052
3MGD O5 3 4.881 14.948 2.052
3MGD HI216099 1.909 19.279 7.886
3MGD HI316100 1.849 19.417 7.987 (the last line,which I want to modify
20389SOL    HW177254   0.325   8.307   3.850
20389SOL    HW277255   0.245   8.235   3.957
   5.75588  25.65343  12.14665

此外,切勿对内部相同文件中的bash使用awk循环。可以用一个awk完成。