验证中文正则表达式怎么写?

 我来答
aii猪猪侠
推荐于2019-09-19 · TA获得超过2910个赞
知道小有建树答主
回答量:5
采纳率:0%
帮助的人:680
展开全部

正则表达式主体:

[0-9]+[a-zA-Z]+[0-9a-zA-Z]*|[a-zA-Z]+[0-9]+[0-9a-zA-Z]*

说明:分为两种情况:

①至少一个数字开头,接着至少一个字母,后面无论是数字还是字母都可以。

②至少一个字母开头,接着至少一个数字,后面无论是数字还是字母都可以。

补充说明:虽然有些环境使用\d或[:digit:]之类的形式可以表示数字,或者其它的特定的形式所对应的特定字符集,但是这样表示并不是通用的;因此建议使用通用的方式来写正则表达式,如[0-9]表示数字,[a-zA-Z]表示大小写字母等。当然,对于特定的编程语言可能还会涉及到转义字符,届时请注意一下。

匿名用户
2023-05-19
展开全部
中文正则表达式可以使用Unicode编码实现,在表示中文字符时使用如下形式:[\\u4e00-\\u9fa5]其中,\\u4e00表示第汉字“一”的Unicode编码,\\u9fa5表示最后汉字“龥”的Unicode编码。此表达式表示匹配任意汉字。其他常用的中文正则表达式如下:1. 匹配中文字符和常用标点符号:[\\u4e00-\\u9fa5,。!?:;、“”‘’()【】]2. 匹配中文姓名:[\\u4e00-\\u9fa5]{2,4}3. 匹配中文数字:[零一二三四五六七八九十百千万亿]+需要注意的是,使用中文正则表达式时需要确保文本编码与所用正则表达式编码一致,否则可能会出现匹配错误的情况。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
缘木求木鱼
推荐于2019-11-12 · TA获得超过2387个赞
知道小有建树答主
回答量:532
采纳率:100%
帮助的人:990万
展开全部
\u4E00-\u9FA5只包含汉字,没有标点符号等。
比如:
“是\u201C
;是\uFF1B
,是\uFF0C
都不在这个范围内。

你遇到的问题,我估计跟编码有关:
有些工具在简体中文默认编码(CP 936 /GBK)状态下,无法正常处理此类正则表达式。
请将所用工具的编码切换到任意一种Unicode编码(比如 UTF-8)试试。

另外,简单地说,\u4E00-\u9FA5只是我们常用的GBK汉字范围。汉字不止这些。

若仍未解决,请详述现象,我继续帮你。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式