怎么用网络爬虫获取数据基于java的

 我来答

2个回答

#热议# 生活中有哪些实用的心理学知识？

百度网友b62111d0
2017-06-29 · TA获得超过414个赞

知道小有建树答主

回答量：537

采纳率：88%

帮助的人：153万

我也去答题访问个人页

关注

展开全部

爬虫的原理其实就是获取到网页内容，然后对其进行解析。只不过获取的网页、解析内容的方式多种多样而已。
你可以简单的使用httpclient发送get/post请求，获取结果，然后使用截取字符串、正则表达式获取想要的内容。
或者使用像Jsoup/crawler4j等这些已经封装好的类库，更方便的爬取信息。

已赞过 已踩过<

评论收起

匿名用户
2017-06-29

展开全部

原理即是保存cookie数据保存登陆后的cookie.以后每次抓取页面把cookie在头部信息里面发送过去。系统是根据cookie来判断用户的。有了cookie就有了登录状态，以后的访问都是基于这个cookie对应的用户的。补充：Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。Java技术具有卓越的通用性、高效性、平台移植性和安全性，广泛应用于PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网，同时拥有全球最大的开发者专业社群。

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

怎么用网络爬虫获取数据基于java的

其他类似问题

为你推荐：