perl中正则表达式是按字符匹配还是按字节匹配的呢?
3个回答
展开全部
在所有内部不直接使用unicode的语言中,比如perl,php,python<3.0,
通常默认的字符编码是ascii码,而ascii码的内码长度和字节对应。
所以,默认情况的perl是按字符匹配,没错,但是按ascii码的字符(不包括汉字);
默认情况的perl是按字节匹配,也没大错,因为ascii码一个字符就一个字节。
在直接支持多字节编码下的语言环境,比如java,python3, c的wide char,这时的正则一般只以字符为单位配。
通常默认的字符编码是ascii码,而ascii码的内码长度和字节对应。
所以,默认情况的perl是按字符匹配,没错,但是按ascii码的字符(不包括汉字);
默认情况的perl是按字节匹配,也没大错,因为ascii码一个字符就一个字节。
在直接支持多字节编码下的语言环境,比如java,python3, c的wide char,这时的正则一般只以字符为单位配。
展开全部
正则表达式什么时候还按照字节来匹配了?正则表达式不分perl、java、js还是python,它是一个独立的系统。
正则本身就决定了它一定是用来匹配字符的。只要给定字符串,就可以来匹配字符串。
正则本身就决定了它一定是用来匹配字符的。只要给定字符串,就可以来匹配字符串。
追问
例句:$s = '回答:1、刍怎么读(GBK编码)';
如果检查句子中是否出现‘③’,你认为正则该怎样写呢?
$s =~ /@/; #显然这样不能达到目的。
追答
要是写ASCII码的十六进制形式,那就累了。不过也有这么做的,不过那用用来判断汉字的范围的。
如果用来判断字符串里是否存在某字符的话,java里是有办法的,不过不是用正则。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
字节
追问
能说详细些吗?谢谢。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询