写爬虫Python，Node.js 相对哪个比较适合

 我来答

1个回答

#热议# 什么是淋病？哪些行为会感染淋病？

鲁小凤
2016-04-10 · 专注中国文化立志做有文化的一代

鲁小凤

采纳数：179 获赞数：546

向TA提问私信TA

关注

展开全部

稍微谈谈我的使用感受，PHP不会，用过Python和Node.js。

简单的定向爬取：
Python + urlib2 + RegExp + bs4
或者
Node.js + co，任一一款dom框架或者html parser + Request + RegExp 撸起来也是很顺手。
对我来说上面两个选择差不多是等价的，但主要我JS比较熟，现在选择Node平台会多一些。

上规模的整站爬取：
Python + Scrapy
如果说上面两个方案里DIY 的 spider是小米加步枪，那Scrapy简直就是重工加农炮，好用到不行，自定义爬取规则，http错误处理，XPath，RPC，Pipeline机制等等等。而且，由于Scrapy是基于Twisted实现的，所以同时兼顾有非常好的效率，相对来说唯一的缺点就是安装比较麻烦，依赖也比较多，我还算是比较新的osx，一样没办法直接pip install scrapy

另外如果在spider中引入xpath的话，再在chrome上安装xpath的插件，那么解析路径一目了然，开发效率奇高。

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

写爬虫Python，Node.js 相对哪个比较适合

其他类似问题

为你推荐：