用java写一个新浪微博的爬虫

以一个用户为种子,然后每次要同时抓取一个用户的用户信息,好友信息和微博内容。求教应该如何处理?... 以一个用户为种子,然后每次要同时抓取一个用户的用户信息,好友信息和微博内容。求教应该如何处理? 展开
 我来答
lnn的zgg
2016-11-26 · TA获得超过145个赞
知道小有建树答主
回答量:178
采纳率:83%
帮助的人:104万
展开全部

以一个用户uid为种子,可以写四个不同的子爬虫,每个子爬虫的传入数据为由uid拼接出的“用户主页”,“用户粉丝页”,“用户关注者页”,“用户发表微博页”,这几个字爬虫都可以控制爬取的页数,一般新浪只让爬取粉丝页和关注者页的前20页(最近好像被缩减到5页了),用户发表微博页没有限制,主页信息只要爬取一个就够啦。



比如(下面的uid为你获得uid):

用户主页:http://weibo.com/u/uid?refer_flag=0000015010_&from=feed&loc=nickname&is_all=1


用户粉丝页:http://weibo.com/p/100505uid/follow?relate=fans&from=100505&wvr=6&mod=headfans&current=fans#place


用户关注者页:http://weibo.com/p/100505uid/follow?page=4#Pl_Official_HisRelation__61


用户发表微博页:http://weibo.com/p/100505uid/home?from=page_100505_profile&wvr=6&mod=data&is_all=1#place


楼主也做新浪爬虫的话我们可以交流,微博有一定的反爬虫技术,不知楼主有没有解决的好方法?

柚鸥ASO
2024-03-16 广告
「柚鸥ASO」在ASO这块就做的蛮不错的,一直专注于应用商店优化,因为专注所以专业;专注应用商店下载量优化、评分优化、关键词排名优化、关键词覆盖、产品权重提升等等整体方案优化服务柚鸥网络-全球ASO优化服务商专注ASO优化已11年!(效果说... 点击进入详情页
本回答由柚鸥ASO提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式