php file_get_contents及其curl 无法抓取网站某一页

phpfile_get_contents及其curl无法抓取网站某一页比如20页以前可以正常抓取大于20页抓取内容就变成20页的内容了在线等·····... php file_get_contents及其curl 无法抓取网站某一页 比如 20页以前可以正常 抓取 大于20页抓取内容就变成20页的内容了 在线等····· 展开
 我来答
阳光上的桥
2013-11-28 · 知道合伙人软件行家
阳光上的桥
知道合伙人软件行家
采纳数:21423 获赞数:65813
网盘是个好东东,可以对话和传文件

向TA提问 私信TA
展开全部
估计是COOKIE在作怪,我在网页打开22页,嗅到的调用是:

http://house.focus.cn/search/0_0_0_0_0_0_0_0_0.html?&page=22&allpage=
----------------------------------------------------------------------
GET /search/0_0_0_0_0_0_0_0_0.html?&page=22&allpage= HTTP/1.1

Accept-Language: zh-CN,zh;q=0.8

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

Referer: http://house.focus.cn/search/0_0_0_0_0_0_0_0_0.html?&page=21&allpage=

DNT: 1

User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36

Accept-Encoding: gzip, deflate

Host: house.focus.cn

Connection: Keep-Alive

Cookie: IPLOC=unknown; PHPSESSID=56a959254d81b6274085ebdd567796b3; sohutag=8HsmeSc5NCwmcyc5NCwmYjc5NCwmYSc5NCwmZjc5MCwmZyc5NCwmbjc5NCwmaSc5NCwmdyc5NCwmaCc5NCwmYyc5NCwmZSc5NCwmbSc5NH0; SUV=1311281109462085; __utma=1.150856136.1385608204.1385608204.1385608204.1; __utmb=1.4.10.1385608204; __utmc=1; __utmz=1.1385608204.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); PHPSESSID=56a959254d81b6274085ebdd567796b3
百度网友0c2357e
2013-11-28 · TA获得超过371个赞
知道小有建树答主
回答量:803
采纳率:50%
帮助的人:589万
展开全部
那肯定程序有问题,上代码
追问

就一个php函数 page写死都不行  就能到20也页 以后抓取的全是20页内容  写死为大于20的页码 也为20页内容 不信你抓下试试 我估计他们网站不知道怎么弄得

追答
那就是他们的网站,要么是有缓存,要么是直接不让抓
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式