java 获取微薄 10
现在想获取微薄文章搜索页面的标题,摘要,文章链接等信息,怎么获取这些信息,不要用工具去抓,用代码执行获取的方式。我看了下源码需要的数据部份是unicode编码,现在没办用...
现在想获取微薄文章搜索页面的标题,摘要,文章链接等信息,怎么获取这些信息,不要用工具去抓,用代码执行获取的方式。我看了下源码需要的数据部份是unicode编码,现在没办用jsoup抓取这些标签中的东西,求大神,速度帮我回答下,最好附上相关代码
展开
1个回答
展开全部
那你要好好学习爬虫了
追问
我模拟数据抓取到数据了,开始请求回来的部分数据是unicode编码,我转成utf-8的,但是我用jsuop抓不到Elements对象,Elements desc = docccc.select("p[class=link_info W_textb]"); (这个是我的抓取网址:http://s.weibo.com/list/relpage?search=中国&page=1)
追答
那还非要jsoup抓啊。只要能达到你的目的不就好了吗
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询