python网络爬虫可以干啥

 我来答

12个回答

#热议# 为什么有人显老，有人显年轻？

___宿愿

活跃答主

2022-03-02 · 守护你的好奇心是我的星辰大海

知道小有建树答主

回答量：1696

采纳率：0%

帮助的人：62.8万

我也去答题访问个人页

关注

展开全部

《Python3爬虫入门到精通课程视频【附软件与资料】【34课时】--崔庆才》百度网盘资源免费下载

链接:https://pan.baidu.com/s/1PM2MA-3Ba03Lcs2N_Xa1Rw

?pwd=zxcv 提取码:zxcv

已赞过 已踩过<

评论收起

柚鸥ASO
2024-03-16 广告

崔庆才的《python3网络爬虫开发实战》这本书很详细，很适合爬虫学习。 Python 3网络爬虫开发实战PDF ,崔庆才著 ,2018.04 ,Pg594 附书中实战代码链接: https://pan.baidu.com/s/1lS-G... 点击进入详情页

本回答由柚鸥ASO提供

49995gxyyj
推荐于2019-11-01 · TA获得超过1万个赞

知道答主

回答量：93

采纳率：100%

帮助的人：1.5万

我也去答题访问个人页

关注

展开全部

Python爬虫开发工程师,从网站某一个页面(通常是首页)开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站，那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

网络爬虫(又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者)，是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁，自动索引，模拟程序或者蠕虫。爬虫就是自动遍历一个网站的网页，并把内容都下载下来

网络爬虫另外一些不常使用的名字还有蚂蚁，自动索引，模拟程序或者蠕虫。随着网络的迅速发展，万维网成为大量信息的载体，如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎（Search Engine），例如传统的通用搜索引擎AltaVista，Yahoo！和Google等，作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是，这些通用性搜索引擎也存在着一定的局限性，如：

（1）不同领域、不同背景的用户往往具有不同的检索目的和需求，通用搜索引擎所返回的结果包含大量用户不关心的网页。

（2）通用搜索引擎的目标是尽可能大的网络覆盖率，有限的搜索引擎服务器资源与无限的网络数据资源之间的矛盾将进一步加深。

（3）万维网数据形式的丰富和网络技术的不断发展，图片、数据库、音频、视频多媒体等不同数据大量出现，通用搜索引擎往往对这些信息含量密集且具有一定结构的数据无能为力，不能很好地发现和获取。

（4）通用搜索引擎大多提供基于关键字的检索，难以支持根据语义信息提出的查询。

为了解决上述问题，定向抓取相关网页资源的聚焦爬虫应运而生。聚焦爬虫是一个自动下载网页的程序，它根据既定的抓取目标，有选择的访问万维网上的网页与相关的链接，获取所需要的信息。与通用爬虫（general？purpose web crawler）不同，聚焦爬虫并不追求大的覆盖，而将目标定为抓取与某一特定主题内容相关的网页，为面向主题的用户查询准备数据资源。

本回答被网友采纳

已赞过 已踩过<

评论收起

老男孩python学习
2018-11-14 · TA获得超过325个赞

知道答主

回答量：248

采纳率：66%

帮助的人：39.2万

我也去答题访问个人页

关注

展开全部

世界上80%的爬虫是基于Python开发的，学好爬虫技能，可为后续的大数据分析、挖掘、机器学习等提供重要的数据源。
什么是爬虫？

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

其实通俗的讲就是通过程序去获取web页面上自己想要的数据，也就是自动抓取数据

爬虫可以做什么？

你可以用爬虫爬图片，爬取视频等等你想要爬取的数据，只要你能通过浏览器访问的数据都可以通过爬虫获取。

爬虫的本质是什么？

模拟浏览器打开网页，获取网页中我们想要的那部分数据

浏览器打开网页的过程：

当你在浏览器中输入地址后，经过DNS服务器找到服务器主机，向服务器发送一个请求，服务器经过解析后发送给用户浏览器结果，包括html,js,css等文件内容，浏览器解析出来最后呈现给用户在浏览器上看到的结果

所以用户看到的浏览器的结果就是由HTML代码构成的，我们爬虫就是为了获取这些内容，通过分析和过滤html代码，从中获取我们想要资源。

已赞过 已踩过<

评论收起

百度网友87b2a52
推荐于2017-11-18 · 知道合伙人软件行家

百度网友87b2a52
知道合伙人软件行家

采纳数：523 获赞数：3490

毕业于南京大学，硕士学位。10年软件研发经验。现任信息系统架构师。

向TA提问私信TA

关注

展开全部

爬虫可以抓取网络上的数据啊。爬虫可以用很多种编程语言实现，python只是一种。所以你想知道的是网络爬虫可以干什么。
他比如证券交易数据，天气数据，网站用户数据，图片。
拿到这些数据之后你就可以做下一步工作了。
你去看看这里就明白了。http://baike.baidu.com/view/284853.htm

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

小贺32580
2019-07-11

知道答主

回答量：31

采纳率：0%

帮助的人：3.8万

我也去答题访问个人页

关注

展开全部

当你学会爬虫后就可以放飞自我了，只要你足够牛皮，互联网上所有的东西都是你的，现在什么最值钱，数据最值钱，拿到的最原始的数据，后期可以做数据清洗，分析，来获取例如，各年龄段人购买物品倾向，电影好评度，哪些不允许下载的网页文本，等等一系列的，对你来说都不是事情了。

已赞过 已踩过<

评论收起

更多回答（10）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

网络爬虫教程-数据采集就用后羿采集器-小白神器，一键采集

基于人工智能算法的新一代智能网络爬虫教程，不需要配置采集规则，一键采集!导出采集结果无数量限制~不要积分~~

www.houyicaiji.com广告

python网络爬虫可以干啥

您可能关注的内容

其他类似问题

为你推荐：