爬虫技术 什么编程语言

 我来答
兜转瞬间
2018-04-05 · TA获得超过2.3万个赞
知道小有建树答主
回答量:136
采纳率:100%
帮助的人:3.1万
展开全部

相关的网络编程API,比如Java, Python, C++, C#, PHP, Perl等

网络爬虫,又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常被称为网页追逐者,是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本,已被广泛应用于互联网领域。搜索引擎使用网络爬虫抓取Web网页、文档甚至图片、音频、视频等资源,通过相应的索引技术组织这些信息,提供给搜索用户进行查询。网络爬虫也为中小站点的推广提供了有效的途径。

网络爬虫另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎,例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如:

  1. 不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的网页。

  2. 通用搜索引擎的目标是尽可能大的网络覆盖率,有限的搜索引擎服务器资源与无限的网络数据资源之间的矛盾将进一步加深。

  3. 数据大量出现,通用搜索引擎往往对这些信息含量密集且具有一定结构的数据无能为力,不能很好地发现和获取。

  4. 通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。

deadlinehlt
2014-02-05 · 超过21用户采纳过TA的回答
知道答主
回答量:62
采纳率:0%
帮助的人:52.1万
展开全部
爬虫的主要原理是抓取html的内容,大部分目前常见的语言都有相关的网络编程API,都能实现网络爬虫。比如说Java, Python, C++, C#, PHP, Perl等语言都可以。

希望对你有所帮助!
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
zjsxwc
2014-02-04 · 超过18用户采纳过TA的回答
知道答主
回答量:45
采纳率:0%
帮助的人:35.6万
展开全部
所有支持网络的语言都可以
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
dzicrystal
2014-02-04 · TA获得超过1727个赞
知道小有建树答主
回答量:362
采纳率:0%
帮助的人:271万
展开全部
php, java, python都可以
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式