PHP中,为什么我用正则表达式提取的HTML代码总是只是页面的一部分?
我用file_get_contents获得的HTML代码,用preg_match_all('/<ahref=([^>]+)>([^<]+)</',$doc,$rs);来截...
我用file_get_contents获得的HTML代码,用preg_match_all('/<a href=([^>]+)>([^<]+)</',$doc,$rs);来截取代码中<a>......</a>之间的内容,可是为什么正则匹配之后只能得到一小部分的东西呢?
我看了下网页的源码,发现很多的链接是这样的:
<a class="font9ptblack" href=content_2062838.htm target=_blank>,我想应该是我的正则表达式没法匹配a和href中间其他内容的形式吧 展开
我看了下网页的源码,发现很多的链接是这样的:
<a class="font9ptblack" href=content_2062838.htm target=_blank>,我想应该是我的正则表达式没法匹配a和href中间其他内容的形式吧 展开
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询