2015年08月27日作业-正则表达式使用

正则表达式:

(RegularExpression,在代码中常简写为rex、regexp或RE)

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。通常被用来检索、替换符合某个模式的文本。

正则表达式是指一类字符书写的模式(pattern)这些字符成为元字符,元字符不表示其字面意义,而用于表示通配或控制功能

正则表达式包括两类:基本正则表达式,扩展正则表达式

grep命令只支持基本正则表达式;

egrep支持扩展正则表达式("e" 表示扩展),

fgrep表示fast grep不支持正则表达式,所有的元字符都被当做普通字符处理,搜索速度很快。

<<========================================grep========================================>>

grep命令

功能

globalsearch regular expression(RE) and print out the line

全局搜索正则表达式,并把模式所匹配到的整行显示出来

格式:

grep[options] 'PATTERN' file,...

常用选项:

--color=auto 指定颜色

-v 反向匹配,显示不能被模式匹配到的行

-o 仅匹配被模式匹配到的字串,而非整行

-i 不区分大小写,ignore-case

-E 支持扩展

-A #显示模式下面的一行

-B #显示模式上面的一行

-C #前后各显示一行

元字符:

. 任意单个字符

* 匹配其前面的字符任意次;

.* 匹配任意长度的任意字符

\? 匹配其左侧0次或1次

\+ 其左侧字符至少出现1次

[]: 指定范围内的任意单个字符

[^]:指定范围外的任意单个字符

[0-9],[[:digit:]]

[a-z],[[:lower:]]

[A-Z],[[:upper:]]

[[:alpha:]]

[[:alnum:]]

[[:space:]]

[[:punct:]]

次数匹配:

\{m\}匹配m次

\{m,n\}匹配至少m次,至多n次

\{m,\}至少m次;多则不限

\{0,n\}至多n次;

位置锚定:

^ 锚定行首,用于模式的最左侧

^CHaraCTER

$: 锚定行尾,用于模式的最右侧

CHaraCTER$

\<CHaraCTER 锚定词首,\bCHaraCTER

CHaraCTER\> 锚定词尾,CHaraCTER\b

锚定单词:

\<KEYWORD\>

\bKEYWORD\b

^$: 锚定空白行

分组:

\(\)

\(ab\)*xy

引用:

\1: 后向引用,引用前面的第一个左括号以及与之对应的右括号中的模式所匹配到的内容

\2

...

<<========================================egrep========================================>>

egrep命令

grep-e PATTERN [FILE...]

egrep[OPTIONS] PATTERN [FILE...]

egrep和grep用法、选项、元字符都一样,

不同的地方就是匹配次数和分组的时候特殊字符无需再使用\转义

次数匹配:

* 匹配其前面的字符任意次;

? 匹配其前面的字符0或1次;

+ 匹配其前面的字符至少1次

{m}匹配其前面的字符m次;

{m,n}至少m次,至多n次

{m,}至少m次;

{0,n}至多n次;

位置锚定:

^ 锚定行首,用于模式的最左侧

^CHaraCTER

$: 锚定行尾,用于模式的最右侧

CHaraCTER$

\<CHaraCTER 锚定词首,\bCHaraCTER

CHaraCTER\> 锚定词尾,CHaraCTER\b

锚定单词:

\<KEYWORD\>

\bKEYWORD\b

^$: 锚定空白行

分组:

()

(ab)*xy

引用:

\1: 后向引用,引用前面的第一个左括号以及与之对应的右括号中的模式所匹配到的内容

\2

...

|: 或者,ac|bc

grep -E "s(C|c)hool"

结果是:sChool,或school


fgrep:f=fast快速匹配,不解析正则表达式

作业:

显示/etc/passwd文件中以bash结尾的行

wKiom1XgTq7T-1TRAACwtLOxiU0418.jpg


显示/etc/passwd文件中的两位数或三位数

wKioL1XgUMmjoZylAAKK1HMVH7Y120.jpg


显示`netstat-tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行

wKiom1XgTq6iUKkmAACJjqo9VJE967.jpg


添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin);

而后找出/etc/passwd文件用户名与其shell名相同的行

wKioL1XgUMmj4qxQAADhbm3WszA973.jpg


显示当前系统上root、centos或者user1用户认shell和UID (请事先创建这些用户,若不存在)

//这里为了效果,先显示了整行信息

wKiom1XgTq7ijLepAADJwX_cmtY644.jpg


找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行

wKioL1XgUMmSKPIXAADyZ1pFjdw117.jpg


使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名

wKiom1XgTq-jpHAlAADj4ctQkmk894.jpg


找出ifconfig命令执行结果中1-255之间的数字

wKioL1XgUMmjyU03AAFZkR0KCFo823.jpg

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...