php简单正则匹配Img标签src内容采集?
采集http://sports.qq.com/nba/?ptag=baidu.ald.sc.nba网站中所有img标签preg_match_all('/<imgsrc="...
采集http://sports.qq.com/nba/?ptag=baidu.ald.sc.nba网站中所有img标签
preg_match_all('/<img src="(.*)".*>/U', $file,$arr);我用的这个只能匹配到<img src=''>这样的图片<img alt='' src=''>这样的不能匹配到,还有一些文本内容如何匹配采集,感谢大神!! 展开
preg_match_all('/<img src="(.*)".*>/U', $file,$arr);我用的这个只能匹配到<img src=''>这样的图片<img alt='' src=''>这样的不能匹配到,还有一些文本内容如何匹配采集,感谢大神!! 展开
3个回答
展开全部
// 抓取网页
echo "\n\n抓取网页=======================================\n";
function getHTTPS($url) {
$ch = curl_init ();
curl_setopt ( $ch, CURLOPT_SSL_VERIFYPEER, FALSE );
curl_setopt ( $ch, CURLOPT_HEADER, false );
curl_setopt ( $ch, CURLOPT_FOLLOWLOCATION, true );
curl_setopt ( $ch, CURLOPT_URL, $url );
curl_setopt ( $ch, CURLOPT_REFERER, $url );
curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, TRUE );
$result = curl_exec ( $ch );
curl_close ( $ch );
return $result;
}
$result = getHTTPS ( "" );
$array = array (
'img',
'script',
'link'
);
$num = count ( $array );
for($i = 0; $i < $num; ++ $i) {
echo $array [$i] . "--------------------------------\n";
if (preg_match_all ( "/<" . $array [$i] . "[^>]*>/i", $result, $m )) {
for($j = 0; $j < count ( $m [0] ); $j ++) {
echo $m [0] [$j] . "\n";
}
}
}
2017-07-07
展开全部
/<img(.*)? src=["|'](.*)["|'](.*)?>/Uis
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询