grep 命令查找文件中的文本字符串
上一篇 /
下一篇 2011-12-15 15:05:44
/ 个人分类:Linux
grep命令用于搜索由Pattern参数指定的模式,并将每个匹配的行写入标准输出中。这些模式是具有限定的正则表达式,它们使用ed或egrep命令样式。grep命令使用压缩的不确定算法。
如果在File参数中指定了多个名称,grep命令将显示包含匹配行的文件的名称。对shell有特殊含义的字符($, *, [, |, ^, (, ), \ )出现在Pattern参数中时必须带双引号。如果Pattern参数不是简单字符串,通常必须用单引号将整个模式括起来。在诸如[a-z]之类的表达式中,-(减号)cml可根据当前正在整理的序列来指定一个范围。整理顺序可以定义等价的类以供在字符范围中使用。如果未指定任何文件,grep会假定为标准输入。
注:
请勿对特殊文件运行grep命令,这样做可能产生不可预计的结果。
输入行不应包含空字符。
输入文件应该以换行符结束。
换行符不会与正则表达式匹配。
虽然一些标志可以同时被指定,但其中的某些标志会覆盖其他标志。例如,-l选项将优先于所有其他标志。另外,如果您同时指定了-E和-F标志,则后指定的那个会有优先权。
标志
-b在每行之前添加找到该行时所在的块编号。使用这个标志有助于通过上下文来找到磁盘块号码。-b标志不能用于来自标准输入和管道的输入。
-c仅显示匹配行的计数。
-E将每个指定模式视作扩展的正则表达式(ERE)。ERE的空值将匹配所有的行。
注:带有-E标志的grep命令等价于egrep命令,只不过它们的错误和使用信息不同以及-s标志的作用不同。
-e PatternList指定一个或多个搜索模式。其作用相当于一个简单模式,但在模式以-(减号)开始的情况下,这将非常有用。模式之间应该用换行符分隔。连续使用两个换行符或者在引号后加上换行符("\n)可以指定空模式。除非同时指定了-E或-F标志,否则每个模式都将被视作基本正则表达式(BRE)。grep可接受多个-e和-f标志。在匹配行时,所有指定的模式都将被使用,但评估的顺序没有指定。
-F将每个指定的模式视作字符串而不是正则表达式。空字符串可匹配所有的行。
注:带有-F标志的grep命令等价于fgrep命令,只不过它们的错误和使用信息不同以及-s标志具有不同的作用。
-f PatternFile指定包含搜索模式的文件。模式之间应该用换行符加以分隔,空行将被认为是空模式。每种模式都将被视作基本的正则表达式(BRE),除非同时指定了-E或-F标志。
-h禁止在匹配行后附加包含此行的文件的名称。当指定多个文件时,将禁止文件名。
-H如果指定了-r或-R选项并且在命令行上指定了引用文件类型目录的符号链接,则grep将搜索符号链接所引用的目录文件以及文件层次结构中在它以下的所有文件。
-i在进行比较时忽略字母的大小写。
-l仅列出(一次)包含匹配行的文件的名称。文件名之间用换行符加以分隔。如果搜索到标准输入,将返回(标准输入)的路径名。-l标志同-c和-n标志的任意组合一起使用时,其作用类似于仅使用了-l标志。
-L如果指定了-r或-R选项,并且引用文件类型目录的符号链接在命令行上指定或在文件层次结构转移过程中遇到,则grep将搜索符号链接所引用的目录文件以及文件层次结构中在它以下的所有文件。如果同时指定了-H和-L,则命令行上最近指定的选项将生效。
-n在每一行之前放置文件中相关的行号。每个文件的起始行号为1,在处理每个文件时,行计数器都将被复位。
-p[ Separator]显示包含匹配行的整个段落。段落之间将按照Separator参数指定的段落分隔符加以分隔,这些分隔符是与搜索模式有着相同格式的模式。包含段落分隔符的行将仅用作分隔符,它们不会被包含在输出中。缺省的段落分隔符是空白行。
-q禁止所有写入到标准输出的操作,不管是否为匹配行。如果选择了输入行,则以零状态退出。-q标志同-c和-l、-n标志的任意组合一起使用时,其作用类似于仅使用了-q标志。
-r递归地搜索目录。在缺省情况下,按照到目录的链接。
-r递归地搜索目录。在缺省情况下,不按照到目录的链接。
-s禁止通常因为文件不存在或不可读取而写入的错误信息。其他的错误信息并未被禁止。
-v 显示所有与指定模式不匹配的行。
-w执行单词搜索。
-x显示与指定模式精确匹配而不含其他字符的行。
-y当进行比较时忽略字符的大小写。
PatternList指定将在搜索中使用的一个或多个模式。这些模式将被视作如同是使用-e标志指定的。
File指定将对其进行模式搜索的文件的名称。如果未给出File变量,将使用标准输入。
退出状态
此命令返回以下出口值:
0找到匹配项。
1未找到匹配项。
>1发现语法错误,或者文件不可访问(即使找到了匹配项)。
示例
若使用包含以下模式匹配字符的模式:*, ^, ?, [, ], \(, \), \{和\},请输入:
grep "^[a-zA-Z]" pgm.s
这将显示pgm.s中第一个字符为字母的所有行。
若显示所有与模式不匹配的行,请输入:
grep -v "^#" pgm.s
这将显示pgm.s中首字母不是#(井字符)的所有行。
若显示文件file1中与abc或xyz字符串匹配的所有行,请输入:
grep -E "abc|xyz" file1
若在名为test2的文件中搜索$(美元符号),请输入:
grep \\$ test2
为了强制shell将\$(单反斜杠和美元符号)传递给grep命令,必须要使用\\(双反斜杠)。\(单反斜杠)字符可通知grep命令将其后的字符(本例中为$)视作原义字符而不是表达式字符。如果使用fgrep命令,则可以不必使用反斜杠之类的转义字符。
通过/tmp递归地搜索以找到含有字IBM的文件,而不是通过指向目录的链接进行递归搜索,请输入:
grep –R IBM /tmp
或
grep –r -H IBM /tmp
要通过/tmp递归地搜索以找到含有词IBM的文件,同时也通过链接进行递归搜索,请输入:
grep –r IBM /tmp
或
grep -R -L IBM /tmp
文件
/usr/bin/grep包含grep命令。
收藏
举报
TAG: