python爬虫登录知乎后怎样爬取数据

 我来答

2个回答

#合辑# 面试问优缺点怎么回答最加分？

数阔八爪鱼采集器丨RPA机器人
2021-07-30 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

模拟登录
很多网站，比如知乎、微博、豆瓣，都需要登录之后，才能浏览某些内容。所以想要爬取这类网站，必须先模拟登录。比较简单的方式是利用这个网站的 cookie。cookie 相当于是一个密码箱，里面储存了用户在该网站的基本信息。在一次登录之后，网站会记住你的信息，把它放到cookie里，方便下次自动登录。所以，要爬取这类网站的策略是：先进行一次手动登录，获取cookie，然后再次登录时，调用上一次登录得到的cookie，实现自动登录。
动态爬取
在爬取知乎某个问题的时候，需要将滑动鼠标滚轮到底部，以显示新的回答。静态的爬取方法无法做到这一点，可以引入selenium库来解决这一问题。selenium库模拟人浏览网站、进行操作，简单易懂。

已赞过 已踩过<

评论收起

米粒遇上小麦
2017-01-20 · TA获得超过119个赞

知道小有建树答主

回答量：911

采纳率：0%

帮助的人：329万

我也去答题访问个人页

关注

展开全部

看你爬什么咯？如果是网页，那就是页面代码；如果是制定内容，那爬取的时候就给定匹配的关键字，返回你指定的数据（字串，list，json都可以）

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python爬虫登录知乎后怎样爬取数据

其他类似问题

为你推荐：