网络爬虫只能爬去web页面的数据信息吗？是不是别人数据库中的数据时没有办法抓取的？

 我来答

2个回答

#合辑# 面试问优缺点怎么回答最加分？

股海老A
2014-10-28 · TA获得超过2635个赞

知道小有建树答主

回答量：1507

采纳率：0%

帮助的人：873万

我也去答题访问个人页

关注

展开全部

网络爬虫抓取页面信息，提取其中的链接，顺着链接依次爬行，一般深度优先或者广度优先，这样一层一层的抓取，但是网页上的信息可能会涉及版权，如果对方不允许爬虫抓取，robot协议里禁止抓取，或者设置权限为登陆状态才可以，这些都会阻碍爬虫抓取数据。而web页面上的信息，其实是数据库里的数据在网站上的体现，没有体现出来的数据库数据，爬虫是无法抓取的。除非是给一个入口，这样爬虫从入口进去可以抓取数据。

已赞过 已踩过<

评论收起

区块城市（广州）科技发展

广告2024-11-14

人工智能爬虫务实元宇宙的先行者，去中心化自治组织开放平台，轻松加入或创建你的DAO组织创新采用Web3和区块链思维，人工智能爬虫真正人人可用，无需下载安装

www.gzbluedata.com

百度网友82dd97ac7
2019-10-23

知道答主

回答量：70

采纳率：0%

帮助的人：5.7万

我也去答题访问个人页

关注

展开全部

网络爬虫抓取的是web页面的数据信息，其实这些信息原本也就是数据库里面的数据，但是如果有些数据库的数据在网页上面没有显示，或者网站的反爬机制严格，确实是没办法抓取的；包括现在用的比较多的软件机器人工具小帮，也是只能采集数据库中在界面显示的数据，针对反爬厉害的网站，可以试试。

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

网络爬虫工具-后羿采集器-小白神器-导出采集结果不限制

后羿采集器是新一代智能网络爬虫工具，不需要配置采集规则，为技术小白设计量身打造。导出数量无限制，可导出多种文件格式/网站/数据库，支持Win/Mac/Linux系统。

网络爬虫只能爬去web页面的数据信息吗？是不是别人数据库中的数据时没有办法抓取的？

您可能关注的内容

其他类似问题

为你推荐：