请问如何通过正则表达式将HTML页面中的 <img> 标签提取出来?
比如:我有一个字符串:中国<imgsrc='adfs.jpg'>美国<imgsrc='美女.jpg'>XX现在通过...
比如:我有一个字符串:中国 <img src='adfs.jpg'> 美国 <img src='美女.jpg'> XX
现在通过正则表达式得到: <img src='adfs.jpg'> 和 <img src='美女.jpg'> . 展开
现在通过正则表达式得到: <img src='adfs.jpg'> 和 <img src='美女.jpg'> . 展开
3个回答
展开全部
你如果说从HTML中提取,那要看你规范到哪种地步,允许错误.不要妄想真能把所有符合规范的img标签都提取出来.
如果里面属性随便写,那 <img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
如果里面属性随便写,那 <img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
展开全部
<img\s?\w*='\w+\.\w*'>
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你如果说从HTML中提取,那要看你规范到哪种地步,允许错误.不要妄想真能把所有符合规范的img标签都提取出来.
如果里面属性随便写,那
<img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
如果里面属性随便写,那
<img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询