python爬虫求一个只用requests库和beautifulsoup库抓取淘宝目录页面内容的框架。。自己抓不出来。绝望。 255

如果方便的话，能不能写一下步骤的大概意思。。。现在写的一直重复抓同一个东西。。看了人家的还是迷迷糊糊的。。如果淘宝这些库不能解决的话。。抓个类似的。网站目录也行。。就是想... 如果方便的话，能不能写一下步骤的大概意思。。。现在写的一直重复抓同一个东西。。看了人家的还是迷迷糊糊的。。如果淘宝这些库不能解决的话。。抓个类似的。网站目录也行。。就是想练习一下，类似淘宝这种html页面比较复杂的这种。展开

 我来答

9个回答

#热议# 发烧为什么不能用酒精擦身体来退烧？

banxi1988
2019-03-19 · TA获得超过579个赞

知道小有建树答主

回答量：327

采纳率：66%

帮助的人：271万

我也去答题访问个人页

关注

展开全部

可以将网页下载下来先练习 BeautifulSoup 的解析。
requests 请求也是一样先各个击破的学习。
淘宝的请求回来的页面 html 没有目录数据，是因为有可能他们的页面渲染是通过 JS 来渲染的，所以你只用 BeautifulSoup 是不行的。需要使用其他支持 JS 的库。

追问

如果爬京东这种，爬取那些职业类型，薪水什么的，只用这两个，应该怎么爬，之前爬了一次，但是一直在单独循环爬爬取到的第一个。。。

追答

尽量模拟真实用户的请求行为吧。毕竟它总会响应用户请求的。
比如我上面说的尝试一下一些支持 JS 的库。

已赞过 已踩过<

评论收起

猪哥66
2019-09-04

知道答主

回答量：25

采纳率：0%

帮助的人：2.7万

我也去答题访问个人页

关注

展开全部

我最近在写淘宝爬虫，只用requests库：登录目前解决了，基本100%登录。
就是爬取pc网页时太频繁会出现滑块验证码，我试了好多次最多爬到2000条数据，只用requests库很难解决淘宝的滑块验证！
爬取淘宝遇到的问题太多了，各种反扒。。。。
教程这几天就写出来了，你可以关注我的vx公号：「裸睡的猪」，回复：淘宝获取教程

已赞过 已踩过<

评论收起

百度网友5efaba2
2019-03-18 · 超过41用户采纳过TA的回答

知道小有建树答主

回答量：77

采纳率：100%

帮助的人：36.3万

我也去答题访问个人页

关注

展开全部

京东比较好爬，只要有个user-agent的请求头就能爬取，淘宝的话比较难，因为反爬做的很好

更多追问追答
追问

可以写个爬京东的例子么。想看一下示范。非常感谢，自己琢磨不出来了。。绝望。。
追答

嗯⊙∀⊙！要不要加个好友讨论一下
追问

好的，感谢大佬!QQ方便么
追答

私信啦
追问

好的，非常感谢

已赞过 已踩过<

评论收起

数阔八爪鱼采集器丨RPA机器人
2021-07-30 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

淘宝的话有防采集，你要采集的话第一步要先模拟登录，然后可以通过开发者工具获取请求接口。

已赞过 已踩过<

评论收起

百度网友a367501
2019-03-19 · TA获得超过130个赞

知道答主

回答量：1024

采纳率：6%

帮助的人：90.7万

我也去答题访问个人页

关注

展开全部

淘宝的话比较难，因为反爬做的很好

已赞过 已踩过<

评论收起

更多回答（7）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

学python有用吗7年匠心打磨，从入门到实战!

class.imooc.com广告

python爬虫求一个只用requests库和beautifulsoup库抓取淘宝目录页面内容的框架。。自己抓不出来。绝望。 255

您可能关注的内容

其他类似问题

为你推荐：