将发球区域分为3个不同的过程,然后将第二个匹配项抓紧

问题描述

我正在尝试创建一个bash脚本,向我显示有关德国和瑞士以及整个世界的电晕感染数量的最新统计数据。

corona () {
    curl -s https://corona-stats.online\?minimal\=true | tee >(head -n 1) > >(grep "(CH)\|(DE)")
    curl -s https://corona-stats.online\?minimal\=true | tail -n 20 | grep World
}

如您所见,要做到这一点,我必须创建一个非常丑陋的脚本,其中curl被调用了两次。我必须这样做,因为网站看起来像这样:

Rank World                               Total Cases  New Cases ▲ Total Deaths New Deaths ▲ Recovered  Active    Critical Cases / 1M pop
1    USA (US)                               7,497,256     2,585 ▲      212,694         34 ▲  4,737,369 2,547,193   14,190         22,617
2    India (IN)                             6,397,896     5,936 ▲       99,833         29 ▲  5,352,078   945,985    8,944          4,625
3    Brazil (BR)                            4,849,229                  144,767               4,212,772   491,690    8,318         22,773
4    Russia (RU)                            1,194,643     9,412 ▲       21,077        186 ▲    970,296   203,270    2,300          8,185
...
22   Germany (DE)                             295,943       413 ▲        9,586                 259,500    26,857      362          3,529
...
58   Switzerland (CH)                          54,384       552 ▲        2,075          1 ▲     45,300     7,009       32          6,272
...
     World                                 34,534,040    63,822 ▲    1,028,540      1,395 ▲ 25,482,492 8,023,008   66,092       4,430.85


Code: https://github.com/sagarkarira/coronavirus-tracker-cli
Twitter: https://twitter.com/ekrysis

Last Updated on: 02-Oct-2020 12:10 UTC

US STATES API: https://corona-stats.online/states/us
HELP: https://corona-stats.online/help
SPONSORED BY: ZEIT Now
Checkout fun new side project I am working on: https://messagink.com/story/5eefb79b77193090dd29d3ce/global-response-to-coronavirus

我只想显示表格(世界)的第一行,最后一行以及关于德国和瑞士的两行。我通过将curl的输出传递到head -n 1并重复输入国家/地区代码显示第一行以及两个国家。多亏了this的回答,我才能做到这一切。

现在,我想获得表中的最后一行,即显示整个世界当前情况的那一行。我尝试再次使用tee将其通过管道传递到第三进程tee >(head -n 1) > >(grep "(CH)\|(DE)") > >(tail -n 20 | grep World)。但这没有用。我的第一个问题是,如何使用tee将输出传递给3个不同的进程?

第二个问题围绕着我尝试重塑世界线的方式。我拖尾了最后20行,然后grep“世界”。之所以这样做,是因为如果我只是grep“ World”,它只会返回标题行,其中也可以找到“ World”。所以我的第二个问题是:我该如何只重复最后一次或第二次出现?

解决方法

您可以链接多个tee命令并只丢弃tee的最后输出:

curl -s ... | tee >( cmd1 ) | tee >( cmd2 ) | tee > >( cmd3 )

实际上,我们可以将其缩短为:

curl -s ... | tee >( cmd1 ) | tee >( cmd2 ) | cmd3

因为我们还是不使用最后一个tee的输出。

同时向终端写入多个命令可能会使输出混淆。一种更优雅的解决方案是仅使用一个grep,例如

curl -s ... | grep '(DE)\|(CH)\|World.*,'

表达式World.*,只会在World之后的同一行中查找逗号,以排除标题行。

,

我认为变量(至少在这种情况下)应该更适合您的需求,例如:

corona() {
  data="$(curl -s https://corona-stats.online\?minimal\=true)"
  echo "$data" | head -n 1
  echo "$data" | grep "(CH)\|(DE)"
  echo "$data" | tail -n 20 | grep World
}

如果您需要进行任何更改,它会更轻松地传达您要执行的操作,并且也更易于扩展。

,

您可以尝试以下方法:

curl -s https://corona-stats.online\?minimal\=true | grep -E "(Rank|^1[^0-9]|\(CH\)|\(DE\))"

使用grep仅显示包含“等级”,1 [非数字],(CH),(DE)的行