java根据url抓取html页面内容，怎么解析chunked 方式

 我来答

2个回答

#热议# 为什么有人显老，有人显年轻？

石岩松i
2016-02-11 · 知道合伙人互联网行家

石岩松i
知道合伙人互联网行家

采纳数：307 获赞数：1070

毕业于郑大，从事网络多年，担任无所不在运营总监

向TA提问私信TA

关注

展开全部

先获取页面
String html = getContent(url, Constants.ENCODING_UTF8);
解析页面 Document doc=Jsoup.parse(html);
然后你获取相应的标签String tag =doc.getElementsByTag("title").first().text();
如果标签很多不一样你就得判断了,还有看看有什么相同的地方吧,我抓取网页数据的时候最烦的就是格式不一样的,好多标签不一样的,只能判断,找到共同点,个别的单个处理,

已赞过 已踩过<

评论收起

好程序员
2016-03-09 · HTML5前端培训/大数据培训/Java

好程序员

好程序员是IT高端课程培训基地，从平凡到卓越,为梦想而拼搏。

向TA提问

关注

展开全部

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;

public class Test {

public static String getHtml(String urlString) {
try {
StringBuffer html = new StringBuffer();
URL url = new URL(urlString);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
InputStreamReader isr = new InputStreamReader(conn.getInputStream());
BufferedReader br = new BufferedReader(isr);
String temp;
while ((temp = br.readLine()) != null) {
html.append(temp).append("\n");
}
br.close();
isr.close();
return html.toString();
} catch (Exception e) {
e.printStackTrace();
return null;
}
}

public static void main(String[] args) {
System.out.println(Test.getHtml(http://192.168.1.1:8080/test/test.jsp));
}

}

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

java根据url抓取html页面内容，怎么解析chunked 方式

其他类似问题

为你推荐：