各位python达人,怎样写一个爬取网站目录的

 我来答
丨洛神殇丨
2017-03-17
知道答主
回答量:28
采纳率:0%
帮助的人:8.6万
展开全部
如果你要的数据量很小的话,python2自带的urllib2写爬虫就可以,如果你要的数据量比较大,就需要专门的爬虫框架scrapy了。
一个爬虫,你首先要分析你要爬取的网页的页面结构,也就是你需要知道在DOM树种你要的元素在哪,然后用能操作DOM的包,比如beautifulsoup或者xpath等,解析DOM,获取你想要的值,然后保存起来
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式