php使用curl抓取一个网站的内容被拒绝
http://www.sgs.gov.cn/lz/etpsInfo.do?method=index这个网站输入上海科波勒之后查询后可以得到点击查看详情后他发送了一个pos...
http://www.sgs.gov.cn/lz/etpsInfo.do?method=index这个网站
输入上海科波勒之后查询后可以得到
点击查看详情后他发送了一个post到http://www.sgs.gov.cn/lz/etpsInfo.do?method=viewDetail$etpsId = 290000032004051700672用curl总是返回非法的访问方式,我设置了refer,设置了setcookie都还是不成。哪位大神能解决吗
就是从第一个输入关键字,查询,之后点击“详细信息”。我要curl的就是下面的内容
这个url是通过给http://www.sgs.gov.cn/lz/etpsInfo.do?method=viewDetail
post一个内容的etpsId = 290000032004051700672 展开
输入上海科波勒之后查询后可以得到
点击查看详情后他发送了一个post到http://www.sgs.gov.cn/lz/etpsInfo.do?method=viewDetail$etpsId = 290000032004051700672用curl总是返回非法的访问方式,我设置了refer,设置了setcookie都还是不成。哪位大神能解决吗
就是从第一个输入关键字,查询,之后点击“详细信息”。我要curl的就是下面的内容
这个url是通过给http://www.sgs.gov.cn/lz/etpsInfo.do?method=viewDetail
post一个内容的etpsId = 290000032004051700672 展开
3个回答
展开全部
刚写的。希望有用
<?php
$binfo =array('Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; InfoPath.2; AskTbPTV/5.17.0.25589; Alexa Toolbar)','Mozilla/5.0 (Windows NT 5.1; rv:22.0) Gecko/20100101 Firefox/22.0','Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET4.0C; Alexa Toolbar)','Mozilla/4.0(compatible; MSIE 6.0; Windows NT 5.1; SV1)',$_SERVER['HTTP_USER_AGENT']);
//218.242.124.16*
//125.90.88.*
$cip = '218.242.124.'.mt_rand(0,254);
$xip = '218.242.124.'.mt_rand(0,254);
$header = array(
'CLIENT-IP:'.$cip,
'X-FORWARDED-FOR:'.$xip,
);
function getimgs( $url,$data,$userinfo,$header)
{
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, "$url");
curl_setopt ($ch, CURLOPT_HTTPHEADER, $header);
curl_setopt ($ch, CURLOPT_REFERER, "http://www.sgs.gov.cn/lz/etpsInfo.do?method=index");
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
curl_setopt ($ch, CURLOPT_USERAGENT, "$userinfo");
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$contents = curl_exec($ch);
curl_close($ch);
return $contents;
}
$url ='http://www.sgs.gov.cn/lz/etpsInfo.do?method=doSearch';
$u = $binfo[mt_rand(0,3)];
$data = array(
'keyWords'=>'上海科波',
'searchType'=>'1'
);
$html = (getimgs($url,$data,$u,$header));
//替换链接地址
$html = str_replace('href="#"', 'href="http://www.sgs.gov.cn/lz/etpsInfo.do?method=doSearch#"', $html);
echo $html;
?>
追问
你这个我也已经写出来了,我说的是下一步,点击详细信息之后的,如果写出能用,追加分数
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询