请问如何通过正则表达式将HTML页面中的 <img> 标签提取出来 ,谢谢高人请教,本人做了好几天了,没做出来
1个回答
2015-04-08 · 知道合伙人互联网行家
关注
展开全部
你如果说从HTML中提取,那要看你规范到哪种地步,允许错误.不要妄想真能把所有符合规范的img标签都提取出来.
如果里面属性随便写,那 <img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
如果里面属性随便写,那 <img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询