PHP中,为什么我用正则表达式提取的HTML代码总是只是页面的一部分?

我用file_get_contents获得的HTML代码,用preg_match_all('/<ahref=([^>]+)>([^<]+)</',$doc,$rs);来截... 我用file_get_contents获得的HTML代码,用preg_match_all('/<a href=([^>]+)>([^<]+)</',$doc,$rs);来截取代码中<a>......</a>之间的内容,可是为什么正则匹配之后只能得到一小部分的东西呢?
我看了下网页的源码,发现很多的链接是这样的:
<a class="font9ptblack" href=content_2062838.htm target=_blank>,我想应该是我的正则表达式没法匹配a和href中间其他内容的形式吧
展开
 我来答
溜须拍马关云长
2009-02-24 · TA获得超过1708个赞
知道大有可为答主
回答量:2443
采纳率:0%
帮助的人:0
展开全部
preg_match_all('/<a.+?href=([^>]+)>([^<]+)</',$doc,$rs);
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式