时代Java，与您同行！关注微信公众号，关注前沿技术，微信搜索：nowjava或时代Java，也可点击这里扫码关注

时代Java

京东自营 + 国补 iPhone 历史最低价国家补贴享8折

Linux Shell 文本 grep 文本搜索详解

欢马劈雪

工程师 (已认证)

原创分享签约作者

发表于教程文章

1468

grep 文本搜索

grep命令（缩写来自Globally search a Regular Expression and Print）是一种强大的文本搜索工具，它能使用特定模式匹配（包括正则表达式）搜索文本，并默认输出匹配行。Unix的grep家族包括grep、egrep和fgrep。

grep match_patten file //默认访问匹配行

常用参数:

-o 只输出匹配的文本行 VS -v 只输出没有匹配的文本行
-c 统计文件中包含文本的次数

grep -c "text" filename

-n 打印匹配的行号
-i 搜索时忽略大小写
-l 只打印文件名

1 在多级目录中对文本递归搜索(程序员搜代码的最爱）：

grep "class" . -R -n

2 匹配多个模式

grep -e "class" -e "vitural" file

3 grep输出以作为结尾符的文件名：（-z）

grep "test" file* -lZ| xargs -0 rm

4 xargs 命令行参数转换

xargs 能够将输入数据转化为特定命令的命令行参数；这样，可以配合很多命令来组合使用。比如grep，比如find；

将多行输出转化为单行输出

cat file.txt| xargs

是多行文本间的定界符

将单行转化为多行输出

cat single.txt | xargs -n 3

-n：指定每行显示的字段数

xargs参数说明

-d 定义定界符（默认为空格多行的定界符为）
-n 指定输出为多行
-I {} 指定替换字符串，这个字符串在xargs扩展时会被替换掉,用于待执行的命令需要多个参数时

eg：

cat file.txt | xargs -I {} ./command.sh -p {} -1

-0：指定为输入定界符

eg：统计程序行数

find source_dir/ -type f -name "*.cpp" -print0 |xargs -0 wc -l

完整命令选项

同时显示匹配行上下的？行，如：grep -2 pattern filename同时显示匹配行的上下2行。

-a, --text

等价于匹配text,用于（Binary file (standard input) matches）报错

-b，--byte-offset

打印匹配行前面打印该行所在的块号码。

-c,--count

只打印匹配的行数，不显示匹配的内容。

-f File，--file=File

从文件中提取模板。空文件中包含0个模板，所以什么都不匹配。

-h，--no-filename

当搜索多个文件时，不显示匹配文件名前缀。

-i，--ignore-case

忽略大小写差别。

-o, --only-matching

只显示正则表达式匹配的部分。（show only the part of a line matching PATTERN）

-q，--quiet

取消显示，只返回退出状态。0则表示找到了匹配的行。

-l，--files-with-matches

打印匹配模板的文件清单。

-L，--files-without-match

打印不匹配模板的文件清单。

-n，--line-number

在匹配的行前面打印行号。

-s，--silent

不显示关于不存在或者无法读取文件的错误信息。

-v，--revert-match

反检索，只显示不匹配的行。

-w，--word-regexp

如果被\

-R, -r, --recursive

递归的读取目录下的所有文件，包括子目录。比如grep -R 'pattern' test会在 test 及其子目录下的所有文件中，匹配 pattern。

-V，--version

显示软件版本信息。

-A6

查找某些字符的内容,并下延伸6行

-B6

查找某些字符的内容,并上延伸6行

-C1

查找某些字符的内容,并上和向下各延伸1行

这几行后面的数字直接影响延伸数量，并以--符号分割搜索行的结果

表达符集

锚定行的开始如：'^grep'匹配所有以grep开头的行。

锚定行的结束如：'grep$'匹配所有以grep结尾的行。

匹配一个非换行符('\n')的字符如：'gr.p'匹配gr后接一个任意字符，然后是p。

匹配零个或多个先前字符如：' *grep' (注意*前有空格)匹配所有零个或多个空格后紧跟grep的行，需要用egrep 或者grep带上 -E 选项。 .*一起用代表任意字符。

[]

匹配一个指定范围内的字符，如'[Gg]rep'匹配Grep和grep。

[^]

匹配一个不在指定范围内的字符，如：'[^A-FH-Z]rep'匹配不包含A-F和H-Z的一个字母开头，紧跟rep的行。

$..$

标记匹配字符，如'$love$'，love被标记为1。

锚定单词的开始，如:'\

x\{m\}

重复字符x，m次，如：'o\{5\}'匹配包含5个o的行。

x\{m,\}

重复字符x,至少m次，如：'o\{5,\}'匹配至少有5个o的行。

x\{m,n\}

重复字符x，至少m次，不多于n次，如：'o\{5,10\}'匹配5--10个o的行。

匹配文字和数字字符，也就是[A-Za-z0-9]，如：'G\w*p'匹配以G后跟零个或多个文字或数字字符，然后是p。

\w的反置形式，匹配一个或多个非单词字符，如点号句号等。

单词锁定符，如: '\bgrep\b'只匹配grep。

用于egrep和 grep -E的元字符扩展集

匹配一个或多个先前的字符。如：'[a-z]\+able'，匹配一个或多个小写字母后跟able的串，如loveable,enable,disable等。

展开阅读全文

本文系作者在时代Java发表，未经许可，不得转载。

如有侵权，请联系nowjava@qq.com删除。

编辑于 2019-10-17 12:57:222019-10-17 12:57:22

教程文章

文章订阅