对于处理不同页面结构的文章如何进行爬取 我来答 1个回答 #热议# 海关有哪些禁运商品?查到后怎么办? 便漫轻答机0p 2019-07-05 · TA获得超过6216个赞 知道大有可为答主 回答量:6204 采纳率:83% 帮助的人:268万 我也去答题访问个人页 关注 展开全部 如果你要的数据量很小的话,python2自带的urllib2写爬虫就可以,如果你要的数据量比较大,就需要专门的爬虫框架scrapy了。一个爬虫,你首先要分析你要爬取的网页的页面结构,也就是你需要知道在DOM树种你要的元素在哪,然后用能操作DOM的包,比如beautifulsoup或者xpath等,解析DOM,获取你想要的值,然后保存起来 已赞过 已踩过< 你对这个回答的评价是? 评论 收起 推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询 广告您可能关注的内容网络爬虫工具-数据采集就用后羿采集器-小白神器,一键采集基于人工智能算法的新一代智能网络爬虫工具,不需要配置采集规则,一键采集!导出采集结果无数量限制~不要积分~~www.houyicaiji.com广告 其他类似问题 2017-08-07 网页结构如下,如何做到分类深度爬取 2017-01-02 如何实现scrapy针对网页内容变化的增量爬取 2017-01-11 如何分析网站网页爬虫爬取规则 7 2017-11-22 BS架构可以用来爬取网页吗 2015-06-07 通过什么方法对网站结构进行优化 2 2023-08-04 python3 怎么爬取新闻网站 2018-12-29 python 如何用爬取的文章里的标题命名保存的文件名称 1 2017-11-17 如何让网站内容快速被百度蜘蛛抓取收录 3 更多类似问题 > 为你推荐: