linux命令grep
grep命令的由来可以追溯到UNIX诞生的早期,在UNIX系统中,搜索的模式(patterns)被称为正则表达式(regularexpressions),为了要彻底搜索一个文件,有的用户在要搜索的字符串前加上前缀global(全面的),一旦找到相匹配的内容,用户就像将其输出(print)到屏幕上,而将这一系列的操作整合到一起就是globalregular expressions print,而这也就是grep命令的全称。
grep命令能够在一个或多个文件中,搜索某一特定的字符模式(也就是正则表达式),此模式可以是单一的字符、字符串、单词或句子。
正则表达式是描述一组字符串的一个模式,正则表达式的构成模仿了数学表达式,通过使用操作符将较小的表达式组合成一个新的表达式。正则表达式可以是一些纯文本文字,也可以是用来产生模式的一些特殊字符。
grep命令的基本格式如下:
[root@localhost ~]# grep [选项] 模式 文件名
这里的模式,要么是字符(串),要么是正则表达式。
grep命令常用选项及含义:
-c:仅列出文件中包含模式的行数。
-i:忽略模式中的字母大小写。
-l:列出带有匹配行的文件名。
-n:在每一行的最前面列出行号。
-v:列出没有匹配模式的行。
-w:把表达式当做一个完整的单字符来搜寻,忽略那些部分匹配的行。
注意,如果是搜索多个文件,grep命令的搜索结果只显示文件中发现匹配模式的文件名;而如果搜索单个文件,grep命令的结果将显示每一个包含匹配模式的行。
-n 打印行号
grep -n ".*" h.txt 所有打印行号
grep -n "root" h.txt 匹配的内容显示行号
-v 不包括
-E 表示过滤 多个参数
grep -Ev "sshd|network|crond|sysstat|"
-o:仅打印你需要的东西,默认打印正行
grep -o "hello" h.txt
-i:忽略大小写
grep -i "hello" h.txt
-c: 用于统计文中出现的次数
--color=auto 过滤字段添加颜色
\b:作为边界符,边界只包含特定字符的行
grep "\boldboy\b" /etc/passwd -->只过滤包含oldboy的行
从多个文件中查找关键词
grep "omc" /etc/passwd /etc/shadow
数据去重:cat log | sort | uniq