关于HTML取图片地址的正则表达式

functionGetImgSrc(str)'取得img标签内容dimtmp,objRegExp,Matches,MatchSetobjRegExp=NewRegexpo... function GetImgSrc(str) '取得img 标签内容
dim tmp,objRegExp,Matches,Match
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True '忽略大小写
objRegExp.Global = false '全文搜索 !关键!
objRegExp.Pattern = "<img (.*?)src=(.[^\[^>]*)(.*?)>"
Set Matches =objRegExp.Execute(str)
For Each Match in Matches
tmp=tmp & Match.Value
Next
GetImgSrc=getimgs(tmp)
end function

function getimgs(str)'取得
dim objRegExp1,mm,Match1,imgsrc
Set objRegExp1 = New Regexp
objRegExp1.IgnoreCase = True '忽略大小写
objRegExp1.Global = True '全文搜索
objRegExp1.Pattern = "src=.+[(gif|jpg|png)]+" '表达式
set mm=objRegExp1.Execute(str)
For Each Match1 in mm
imgsrc=Match1.Value
'也许存在不能过滤的字符,确保万一
imgsrc=replace(imgsrc,"""","")
imgsrc=replace(imgsrc,"src=","")
imgsrc=replace(imgsrc,"<","")
imgsrc=replace(imgsrc,">","")
imgsrc=replace(imgsrc,"img","")
imgsrc=replace(imgsrc," ","")
getimgs=getimgs&imgsrc'把里面的地址串起来备用
next
end function

上面的代码.有点不足.就是取图片地址的时候,把后面的字符串也链接起来
如:正确的地址是:http://xxx.com/images/000.jpg

取出的时候却为:http://xxx.com/images/000.jpgdfdsfw

后缀名多了一些字符.,高手们,这正则表达式能不能再完善点
展开
 我来答
狄烁
2008-09-15 · TA获得超过185个赞
知道小有建树答主
回答量:133
采纳率:0%
帮助的人:0
展开全部
用第一个函数就行了,修改一下

Function GetImgSrc(str) '取得img 标签内容
Dim tmp, objRegExp, Matches, Match
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True '忽略大小写
objRegExp.Global = True '全文搜索 !关键!
objRegExp.Pattern = "<img [^>]*?\bsrc=(['""]?)([^'""\x20]+)\1 [^>]*?>"
Set Matches = objRegExp.Execute(str)
For Each Match In Matches
tmp = tmp & Match.SubMatches(1) & vbCrLf
Next
GetImgSrc = tmp
End Function
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式