求一个查找特定中文字符正则表达式 5
一大批资料,几万条,我需要厘清里面的日期。情况如下:1、文本有个一个规律,就是日期中”日“字会反复出现“二〇一五年X月X日书记员XXX”2、”日书记员“三个字肯定是先后出...
一大批资料,几万条,我需要厘清里面的日期。情况如下:
1、文本有个一个规律,就是日期中”日“字会反复出现“二〇一五年X月X日 书记员 XXX”
2、”日书记员“三个字肯定是先后出现的,但出现形式被空格打乱,如”日 书 记 员“ ;”日书记员“ ;”日书 记 员“,到底空多少格可说不准
3、正则表达式该怎么写,能把他们找全??
我在NOTEpad++ 里编辑 展开
1、文本有个一个规律,就是日期中”日“字会反复出现“二〇一五年X月X日 书记员 XXX”
2、”日书记员“三个字肯定是先后出现的,但出现形式被空格打乱,如”日 书 记 员“ ;”日书记员“ ;”日书 记 员“,到底空多少格可说不准
3、正则表达式该怎么写,能把他们找全??
我在NOTEpad++ 里编辑 展开
2个回答
展开全部
日[ ]*书[ ]*记[ ]*员
解释一下,
首先你得保证,这四个字之间只能有空格或者没有空格,有其它空白字符的话自己补。
[ ],这个是表示字符集合,表示只匹配中括号中的字符。这里面的字符是空格。表示在这几个字符之间只能有空格。
*,这个符号通常是最小匹配,即匹配0个或多个,就是无论这四个字前后之间有没有空格,它都能匹配。
此表达式己经试验通过。
更多notepad++的正则表达式语法参考:http://my.oschina.net/duwaiweb/blog/82789
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询