在 linux 中经常需要对文本或输出内容进行过滤,最常用的过滤命令是 grep
|
|
grep
按行检索输入的每一行,如果输入行包含模式 PATTERN
,则输出这一行。这里的 PATTERN
是正则表达式 (参考前一篇,本文将结合 grep 一同举例)。
输出文件 /etc/passwd
中包含 root
的行:
|
|
或者从标准输入获得:
|
|
需要注意的地方是:当 grep 的输入既来自文件也来自标准输入时,grep 将忽略标准输入的内容不做处理,除非使用符号 -
来代表标准输入:
|
|
此时,grep 会标明哪些结果来自于文件哪些来自于标准输入。
输出文件 /etc/passwd 和文件 / etc/group 中以 root 开头的行:
|
|
输出文件 /etc/passwd 中以 / bin/bash 结尾的行:
|
|
注意以上两个例子中 PATTERN
被双引号引用起来以防止被 shell 解析。
输出文件 / etc/passwd 中不以 a-s 中任何一个字母开头的行:
|
|
这里需要理解两个 ^
间不同的含义,第一个 ^
表示行首,第二个在 []
内部的首个字符 ^ 表示取反。
输出文件 / etc/passwd 中字符 0
连续出现 3 次及以上的行 (注意转义字符’\’):
|
|
如输出文件 /etc/passwd 中以字符 r
或 l
开头的行:
|
|
选项 -i
使 grep 在匹配模式时忽略大小写:
|
|
选项 -o
表示只输出匹配的字符,而不是整行:
|
|
选项 -c
统计匹配的行数:
|
|
选项 -v
表示取反匹配,如输出 / etc/passwd 中不以 / sbin/nologin 结尾的行:
|
|
选项 -f FILE
表示以文件 FILE 中的每一行作为模式匹配:
|
|
选项 -x
表示整行匹配:
|
|
选项 -w
表示匹配整个单词:
|
|
选项 -h
表示当多个文件时不输出文件名:
|
|
选项 -n
表示显示行号:
|
|
选项 -A N
、-B N
、-C N
表示输出匹配行和其’周围行’
|
|
选项 -F
视 PATTERN
为它的字面意思匹配 (忽略字符的特殊含义),等同于执行命令 fgrep
:
|
|
命令无输出
选项 -E
可以使用扩展的正则表达式,如同执行 egrep
命令:
|
|
使用扩展正则表达式意味着不需要转义就能表示字符的特殊含义,包括?
,+
,{
,|
,(
和)
。
选项 -P
表示使用 perl 的正则表达式进行匹配
如:
|
|
perl 正则中 “\d” 表示数字,+ 表示匹配一到多次 (同 vim)。
选项 -a
将二进制文件当成文本文件处理:
|
|
选项 --exclude=GLOB
和 --include=GLOB
分别表示排除和包含匹配 GLOB 的文件,GLOB 表示通配符 (find 及 xargs 用法见基础命令介绍三):
|
|
grep
强大的过滤能力来自于各种选项以及正则表达式的配合,在今后的文章中还有更多的例子。