求大神!提交网页链接的爬虫数据显示403,网页能正常打开,是什么原因?怎么解决?

 我来答
若以下回答无法解决问题,邀请你更新回答
zth86435343
2018-03-23 · 超过22用户采纳过TA的回答
知道答主
回答量:59
采纳率:95%
帮助的人:9万
展开全部
403是请求被拒绝了 大多数网站的验证机制无非几种 1判断referer(来源网站) 2加密验证 requestheader 中会有一些特殊的值 3cookie用户验证

解决 1给你的请求header设置referer=上一页网址
2分析js或者在程序中使用浏览器内核运行js渲染
3htmlunit模拟登录 或者直接在header的cookie = 浏览器登录访问进去拷贝到你的程序代码里
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友270da952b9
2018-03-19
知道答主
回答量:5
采纳率:33%
帮助的人:4332
展开全部
添加header跟agent
追问
这是什么原因啊
还有agent是user agent吗
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式