请问如何通过正则表达式将HTML页面中的 <img> 标签提取出来?

比如:我有一个字符串:中国<imgsrc='adfs.jpg'>美国<imgsrc='美女.jpg'>XX现在通过... 比如:我有一个字符串:中国 <img src='adfs.jpg'> 美国 <img src='美女.jpg'> XX
现在通过正则表达式得到: <img src='adfs.jpg'> 和 <img src='美女.jpg'> .
展开
 我来答
apodemakeles
2008-02-03 · TA获得超过154个赞
知道小有建树答主
回答量:125
采纳率:0%
帮助的人:124万
展开全部
你如果说从HTML中提取,那要看你规范到哪种地步,允许错误.不要妄想真能把所有符合规范的img标签都提取出来.
如果里面属性随便写,那 <img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
qianqing02
2008-01-28 · 超过35用户采纳过TA的回答
知道答主
回答量:161
采纳率:0%
帮助的人:128万
展开全部
<img\s?\w*='\w+\.\w*'>
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
羽永芬揭诗
2020-02-17 · TA获得超过3.7万个赞
知道大有可为答主
回答量:1.4万
采纳率:27%
帮助的人:924万
展开全部
你如果说从HTML中提取,那要看你规范到哪种地步,允许错误.不要妄想真能把所有符合规范的img标签都提取出来.
如果里面属性随便写,那
<img\s+[^>]>足够了.
如果有且只有src属性,象LZ例子那样要求的
<img\s+src=(['"])(?#注释:里面填写URL的正则,同样也看你如何定义了,如果不怕范围太大,大可以写上[^>]*)\1\s+>
总之你条件放得越宽,范围就越大,越有可能允许更多的不规范的标签得到匹配
LS的答案虽然能过楼主这几个例子,但有个明显问题是能允许img和src相连,我想这是什么限度也不能允许的.
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式