按.NET的标准,\w本来就是可以匹配:汉字,字母,数字,
下划线。的
所以一般\w可以满足需求了。
如果需要排除字母数字的话,可以这样:
(?![a-zA-Z0-9_])\w
>_>这样写估计效率不高
所以一般来说还是直接匹配指定的unicode码
\unnnn Unicode代码中
十六进制代码为nnnn的字符
汉字(字符) [\u4e00-\u9fa5]
中文及
全角标点符号(字符) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]