python爬虫框架哪个好用

 我来答

3个回答

#热议# 网上掀起『练心眼子』风潮，真的能提高情商吗？

精金框架妊奥9
2019-12-10 · TA获得超过340个赞

知道小有建树答主

回答量：269

采纳率：98%

帮助的人：57.3万

我也去答题访问个人页

关注

展开全部

说实话感觉大同小异。各有优缺点吧~

常见python爬虫框架
1)Scrapy:很强大的爬虫框架，可以满足简单的页面爬取（比如可以明确获知url pattern的情况）。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。但是对于稍微复杂一点的页面，如weibo的页面信息，这个框架就满足不了需求了。
2)Crawley: 高速爬取对应网站的内容，支持关系和非关系数据库，数据可以导出为JSON、XML等
3)Portia:可视化爬取网页内容
4)newspaper:提取新闻、文章以及内容分析
5)python-goose:java写的文章提取工具
6)Beautiful Soup:名气大，整合了一些常用爬虫需求。缺点：不能加载JS。
7)mechanize:优点：可以加载JS。缺点：文档严重缺失。不过通过官方的example以及人肉尝试的方法，还是勉强能用的。
8)selenium:这是一个调用浏览器的driver，通过这个库你可以直接调用浏览器完成某些操作，比如输入验证码。
9)cola:一个分布式爬虫框架。项目整体设计有点糟，模块间耦合度较高。

资料来源：网页链接

希望我的回答对你有帮助~

已赞过 已踩过<

评论收起

云南新华电脑学校
2022-10-13 · 百度认证:云南新华电脑职业培训学校官方账号

云南新华电脑学校

云南新华电脑学校是经云南省教育厅批准成立的省（部）级重点计算机专业学校，采用三元化管理模式，教学设备先进，师资雄厚学生毕业即就业，学院引进了电商企业入驻，创建心为电商创业园区，实现在校即创业

向TA提问

关注

展开全部

1、Scrapy
是用纯 Python 实现一个为了爬取网站数据、提取结构性数据而编写的应用框架，用途非常广泛。
可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中，也可以应用在获取API所返回的数据（例如 Amazon Associates Web Services ) 或者通用的网络爬虫。

已赞过 已踩过<

评论收起

阳光为你倾情
2022-10-04

知道答主

回答量：24

采纳率：0%

帮助的人：1万

我也去答题访问个人页

关注

展开全部

request 库简单易用

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python爬虫框架哪个好用

其他类似问题

为你推荐：