Python网站爬虫只能爬自己所选的网址? 10

我是个初学者,我目前知道的代码需要输入一个目标网址,我想问爬虫能不能自动去其他网站爬东西?... 我是个初学者,我目前知道的代码需要输入一个目标网址,我想问爬虫能不能自动去其他网站爬东西? 展开
 我来答
句心后端开发
2018-12-15 · 专注后端和移动端编程
句心后端开发
采纳数:316 获赞数:624

向TA提问 私信TA
展开全部

思路

  1. 网站地图(首先爬一个网站的首页,然后得到首页里面的超链接,这样就可以得到这个网站的二级页面,然后继续,最终爬去这个网站所有的页面)

  2. 互联网(假如你得到了一个超链接,那么就可以得到另一个,就可以继续得到另一个,继续下去,就可以得到整个互联网)

注意:

  1. 抓取数据时,需要分析特定网站的结构,一遍能抓取特定的数据

  2. 抓取的时候,应该支持多线程,这样才能在有限的生命中爬取完需要的数据

懵懂幼稚小童鞋
2018-12-15 · TA获得超过602个赞
知道答主
回答量:222
采纳率:33%
帮助的人:28.1万
展开全部
首先你得输入特定的网址,如果你想自动去爬所有网站 这就涉及到更高深的编程,就像百度蜘蛛一样,可以爬行成千上万个网站,但有些网站是有反爬机制的
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2018-12-15
展开全部
每个网站结构不一样 一些简单的可以直接爬 但是复杂的反爬虫的多数做不到
追问
我想问我可以不输入单一网址,爬虫可以自动去其他网站爬目标吗?
追答
可以啊 但是效果不一定好而已
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
大肚子圆又圆
2018-12-15
知道答主
回答量:64
采纳率:0%
帮助的人:6.1万
展开全部
可以输入多个目标网址,也可以从一个目标网址里爬取其他网址
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
小古娱乐实训
2018-12-15 · TA获得超过175个赞
知道小有建树答主
回答量:318
采纳率:54%
帮助的人:78.9万
展开全部
这样跟你说吧,最初的谷歌蜘蛛就用python写的
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(4)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式