Python什么爬虫库好用?
2个回答
2022-02-11 · 百度认证:北京一天天教育科技有限公司官方账号,教育领域创作者
关注
展开全部
aiohttp:是纯粹的异步框架,同时支持HTTP客户端和服务端,可以快速实现异步爬虫,并且其中的aiohttp解决了requests的一个痛点,它可以轻松实现自动转码,对于中文编码就很方便了。
asks:Python自带一个异步的标准库asyncio,但这个库很多人觉得并不好用,而里面的ask则是封装了curio和trio的一个http请求库。用起来和
Requests 90%相似,新手也可以很快上手。
vibora:号称是现在最快的异步请求框架,跑分是最快的。写爬虫、写服务器响应都可以用。但这个项目一直在重构,现在页面上还挂着项目正在重构的警告,使用需谨慎。
Pyppeteer:是异步无头浏览器,从跑分来看比Selenium+webdriver快,使用方式是最接近于浏览器的自身的设计接口的。它本身是来自
Google维护的puppeteer,但是按照Python社区的梗,作者进行了封装并且把名字中的u改成了y。
下面为大家介绍一下框架:
Grab:是很流行的渐进式框架,Grab可以说是爬虫界的渐进式框架,又十分简单的用法,封装的也很好,是基于生成器异步的设计。
botflow:概念很新颖,定位成了处理数据工作流的框架,可以用来爬虫、机器学习、量化交易等等。
ruia:比较接近Scrapy的使用方式,异步设计。
asks:Python自带一个异步的标准库asyncio,但这个库很多人觉得并不好用,而里面的ask则是封装了curio和trio的一个http请求库。用起来和
Requests 90%相似,新手也可以很快上手。
vibora:号称是现在最快的异步请求框架,跑分是最快的。写爬虫、写服务器响应都可以用。但这个项目一直在重构,现在页面上还挂着项目正在重构的警告,使用需谨慎。
Pyppeteer:是异步无头浏览器,从跑分来看比Selenium+webdriver快,使用方式是最接近于浏览器的自身的设计接口的。它本身是来自
Google维护的puppeteer,但是按照Python社区的梗,作者进行了封装并且把名字中的u改成了y。
下面为大家介绍一下框架:
Grab:是很流行的渐进式框架,Grab可以说是爬虫界的渐进式框架,又十分简单的用法,封装的也很好,是基于生成器异步的设计。
botflow:概念很新颖,定位成了处理数据工作流的框架,可以用来爬虫、机器学习、量化交易等等。
ruia:比较接近Scrapy的使用方式,异步设计。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询