关于php抓取asp网页 20

我需要抓取的网页是:http://lib.gdin.edu.cn/search/searchresult.aspx?ANYWORDS=4444&dt=ALL&cl=ALL... 我需要抓取的网页是:
http://lib.gdin.edu.cn/search/searchresult.aspx?ANYWORDS=4444&dt=ALL&cl=ALL&dept=ALL&sf=M_PUB_YEAR&ob=DESC&page=1&dp=20&sm=table
总不能成功。
有用过file_get_contents(),下面是源代码:
<?php
$url='http://lib.gdin.edu.cn/search/searchresult.aspx?ANYWORDS=4444&dt=ALL&cl=ALL&dept=ALL&sf=M_PUB_YEAR&ob=DESC&page=1&dp=20&sm=table';
$lines_string=file_get_contents($url);
echo htmlspecialchars($lines_string);
?>
结果出来的是:Warning: file_get_contents(http://lib.gdin.edu.cn/search/searchresult.aspx?ANYWORDS=4444&dt=ALL&cl=ALL&dept=ALL&sf=M_PUB_YEAR&ob=DESC&page=1&dp=20&sm=table) [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.1 500 Internal Server Error in F:\WWW\library.php on line 5

还有用过curlur,下面是源代码:
<?php
$url = "http://lib.gdin.edu.cn/search/searchresult.aspx?ANYWORDS=4444&dt=ALL&cl=ALL&dept=ALL&sf=M_PUB_YEAR&ob=DESC&page=1&dp=20&sm=table";
$ch = curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$contents = curl_exec($ch);
curl_close($ch);
echo $contents;
?>

结果出来的是:
Object moved to here.
我也尝试了snoopy插件,也是不行。
我抓取简单的php网页时就可以,例如:www.lingxiren.com
<?php
$url='http://www.lingxiren.com';
$lines_string=file_get_contents($url);
echo htmlspecialchars($lines_string);
?>
我有改allow_url_fopen,也这样user_agent=”Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)”,user_agent前面的分号我也去掉了。

希望有人可以帮到我,试验成功后,给我一份代码,感激不尽。
展开
 我来答
183525594
2015-03-25 · TA获得超过2922个赞
知道大有可为答主
回答量:3664
采纳率:58%
帮助的人:2072万
展开全部
curl_setopt($ch,CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:36.0) Gecko/20100101 Firefox/36.0');

加一行这个参数试试!!

追问
不行。运行结果是这个:
Object moved to here.
追答
你去抓一个正常请求的头信息,然后模仿一下
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式