php简单正则匹配Img标签src内容采集?

采集http://sports.qq.com/nba/?ptag=baidu.ald.sc.nba网站中所有img标签preg_match_all('/<imgsrc="... 采集http://sports.qq.com/nba/?ptag=baidu.ald.sc.nba网站中所有img标签
preg_match_all('/<img src="(.*)".*>/U', $file,$arr);我用的这个只能匹配到<img src=''>这样的图片<img alt='' src=''>这样的不能匹配到,还有一些文本内容如何匹配采集,感谢大神!!
展开
 我来答
yugi111
2017-07-14 · TA获得超过8.1万个赞
知道大有可为答主
回答量:5.1万
采纳率:70%
帮助的人:1.3亿
展开全部
// 抓取网页
echo "\n\n抓取网页=======================================\n";
function getHTTPS($url) {
$ch = curl_init ();
curl_setopt ( $ch, CURLOPT_SSL_VERIFYPEER, FALSE );
curl_setopt ( $ch, CURLOPT_HEADER, false );
curl_setopt ( $ch, CURLOPT_FOLLOWLOCATION, true );
curl_setopt ( $ch, CURLOPT_URL, $url );
curl_setopt ( $ch, CURLOPT_REFERER, $url );
curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, TRUE );
$result = curl_exec ( $ch );
curl_close ( $ch );
return $result;
}
$result = getHTTPS ( "" );

$array = array (
'img',
'script',
'link' 
);

$num = count ( $array );
for($i = 0; $i < $num; ++ $i) {
echo $array [$i] . "--------------------------------\n";
if (preg_match_all ( "/<" . $array [$i] . "[^>]*>/i", $result, $m )) {
for($j = 0; $j < count ( $m [0] ); $j ++) {
echo $m [0] [$j] . "\n";
}
}
}
匿名用户
2017-07-07
展开全部
/<img[^>]*src=[\'"]([^\'"]*)[\'"][^>]*>/is
追问
你这个[^>]*是什么意思还有[\'"]是什么意思,还有但是这中格式的图片还没有采集到
追答

/<img\s?(?:\w="[^"]*")?src=[\'"]([^\'"]*)[\'"][^>]*/is

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友fce0e26
2017-07-07 · TA获得超过336个赞
知道小有建树答主
回答量:444
采纳率:63%
帮助的人:139万
展开全部
/<img(.*)? src=["|'](.*)["|'](.*)?>/Uis
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式