nginx里如何修改变量中指定字符

 我来答

1个回答

#热议# 什么是淋病？哪些行为会感染淋病？

折柳成萌

高粉答主

2018-06-04 · 繁杂信息太多，你要学会辨别

知道顶级答主

回答量：4.4万

采纳率：96%

帮助的人：6014万

我也去答题访问个人页

关注

展开全部

需求是这样，提取出nginx日志中，GET或者POST的数据中，名称为’shell’字段的数据
nginx日志的format配置：
'$proxy_add_x_forwarded_for - $remote_user [$time_local] "$request" '

'$status $request_body "$http_referer" '

'"$http_user_agent" "$http_x_forwarded_for" $request_time $upstream_response_time';
nginx日志实际的内容，大致如下：
61.164.xxx.xxx, 10.16.xx.x – - [13/Aug/2014:00:00:02 +0800] “GET /xxx/xxx?stepid=32&tid=U%2Bo3c0S&&output=json&language=zh_CN&session=114047349&dip=10920&diu=00343B30-9EB8-4B43-A978-FF838587E989&diu3=e9c3afaa4134d678&dia=8E72-1B19E16C0B8E&shell=504c450000000000000000000000004100&compress=false&channel=&adcode=310000&pagenum=1&pagesize=10&sign=C3833277A0DE5C071A799AB5E8AE41E2 HTTP/1.1″ 200 4382 “-” “xxx-iphone” “61.164.xxx.xxx” 0.204
或
218.202.xxx.xxx, 123.103.xxx.xxx, 10.16.xxx.xxx – - [2014-08-19 22:17:08.446671] “POST /xxx/xxx-web/xxx HTTP/1.1″ 200 stepid=15&tid=U753HifVPE0DAOn%2F&output=json&language=zh_CN&session=114099628&dip=10920&diu=DBDBF926-3210-4D64-972A7&xxx=056a849c70ae57560440ebe&diu2=2DFDB167-1505-4372-AAB5-99D28868DCB5&shell=e3209006950686f6e65352c3205004150504c450000000000000000000000000000&compress=false&channel=&sign=438BD4D701A960CD4B7C1DE36AA8A877&wua=0&appkey=0&adcode=150700&t=0 “-” “xxx-iphone” “218.202.xxx.xxx, 123.103.xxx.xxx” 0.001 20.001
grep -P 'shell' access.log | sed 's/$.*$&shell=$.*$&$.*$/\2/g' | awk -F '&' '{print $1}' > output.txt
命令解释：
grep -P 'shell' access.log
#在日志文件中找到有’shell’ 关键字的数据行
sed 's/$.*$&shell=$.*$&$.*$/\2/g'
#sed使用正则表达式查找，希望将每行日志分成三个组，’&shell=’之前一组，’&shell=’和shell值和之后的&之间作为第二组，之后的字符串作为第3组，\2代表第二组，用第二组替换整个字符串。但是，sed的正则表达式是贪婪模式，实际的第3组是最后一个&后的字符串
awk -F '&' '{print $1}'
#用&将字符串split，输出第一个结果
Shell脚本命令众多，非常灵活，解决方法还有很多。这个不是最优方法，也不十分严格，如果作为重要脚本命令，还需要更多完善。存在的问题：shell关键在日志中如果不唯一，将导致拆分的结果是错误的。
#注意点：sed的正则表达式是贪婪模式

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

nginx里如何修改变量中指定字符

其他类似问题

为你推荐：