最近学shell,在awk里,在语句的什么位置用正则表达式?例如 awk 'BEGIN {FS=";" $4~/root/}' testfile

在上面的例子里,我是知道的,我刚开始学,感觉应该大部分不是这样用的,请有经验的同学给讲解下,最好能有例子,谢谢。... 在上面的例子里,我是知道的,我刚开始学,感觉应该大部分不是这样用的,请有经验的同学给讲解下,最好能有例子,谢谢。 展开
 我来答
百度网友5311d79
2014-04-14 · TA获得超过1.9万个赞
知道大有可为答主
回答量:6356
采纳率:71%
帮助的人:3207万
展开全部

awk中使用正则大致就下面三种形式。


形式一(跟你给出的类似):

awk '/正则/{主体处理}' file

默认匹配$0,相当于  $0~/正则/

正则匹配后默认会打印匹配到的内容,所以若主体语句仅仅是print,可直接省略。

  

形式二:

awk '{if($4~/root/) print}' file

在主体语句的if判断里使用正则。

 

形式三:

awk '{内置字符串处理函数}' file

在awk内置的字符串处理函数中使用正则,如sub, gsub, gensub, match等。

echo "ABC^H^H^H^HDEF" | awk '{gsub(/\^H/,"");print $0}'

将所有^H替换为空,输出替换后的字符串。

这里gsub中省略了第三个参数“源字符串”,默认使用$0来匹配。

 

------------------------------------------------------- 

大部分情况下,正则都是跟主体语句相关的,所以这里抛开awk的BEGIN和END语句块不看。

BEGIN语句块属于预处理,尚未读入要处理的数据,用不上正则;

END语句块属于后处理,可以用正则但少见,因为复杂的逻辑判断尽量都放在主体中完成。

追问
先拜谢了
有几个小问题啊
形式一的格式就不需要BEGIN是吗? 这是一种特例的格式?话说“{主体处理}”能不能给个小例子。。
形式二 print 和printf 啥关系啥区别啊?

形式三 ^H前的\是转义字符吧?需要加“”吗?貌似我这儿用转义字符就必须加“”。
追答

你的问题只是关于正则的位置啊,其他都是awk基础知识,可以不要糅杂堆砌在一起。

BEGIN和END都可以有,根据需要,只是我这里为了简化,抛开awk的BEGIN和END语句块不看。

echo "hello_kitty99" | awk 'BEGIN{FS="_";a=""}$2~/[0-9]+/{a=$2}END{print a}'

 

print 和printf ,学过C语言的都应该清楚。printf是格式化打印,print就是简单的直接打印。

自己试试:

echo | awk '{printf("%05d\n", 22)}'

控制打印宽度为5个字符,不足的前面补0。

 

/\^H/ 由于^在正则中有特殊含义,用于匹配字符串或行的开始位置,所以若要去除其特殊含义而表达^字符本身,需要转义。

常忆大学时光
2014-04-14 · 超过17用户采纳过TA的回答
知道答主
回答量:56
采纳率:0%
帮助的人:37万
展开全部
假如你的例子 $4~/root/ (代表 第4列匹配 root)
你就可以加入正则表达式了。。/ xxx / 在匹配内容中用正则表达式代表匹配的内容
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式