Java 关于抓取异步的网页数据

publicstaticStringgetHtmlCode(Stringurl,StringcharCode)throwsIOException{StringhtmlCo... public static String getHtmlCode(String url,String charCode) throws IOException {
String htmlCode = "";
InputStream in = null;
HttpURLConnection connection=null;
try {
URL urlCon = new URL(url);
connection = (HttpURLConnection) urlCon.openConnection();
connection.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/534.24 (KHTML, like Gecko) Chrome/11.0.696.25 Safari/534.24");
connection.setConnectTimeout(5000);
connection.setReadTimeout(5000);
connection.setFollowRedirects(true);
connection.setInstanceFollowRedirects(false);
connection.setDefaultUseCaches(false);
in = urlCon.openStream();
int index = 0;
byte[] bytes = new byte[1024*100];
int count = in.read(bytes, index, 1024 * 100);
while (count != -1) {
index += count;
count = in.read(bytes, index, 1);
}
htmlCode = new String(bytes, charCode);
} catch (Exception e) {
e.printStackTrace();
}
finally{
if(in!=null)
in.close();
if(connection!=null)
connection.disconnect();
}
return htmlCode;
}

我要抓取一个页面的数据,但是因为访问的页面采用AJAX。使我读取的数据不完全。请问下该怎么写才能读取到全部的数据
展开
 我来答
kissjie520
2013-04-05 · TA获得超过6396个赞
知道大有可为答主
回答量:1.2万
采纳率:0%
帮助的人:3586万
展开全部
遵循它,看到的AJAX请求是POST方法来模拟数据抓,但这么写代码太针对不具备通用性
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
cat7425
2013-04-05 · TA获得超过4798个赞
知道大有可为答主
回答量:1.1万
采纳率:0%
帮助的人:3186万
展开全部
遵循它,看到的AJAX请求是POST方法来模拟数据抓,但这么写代码太针对不具备通用性
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友5b585cf4c9d
2013-03-23 · TA获得超过646个赞
知道答主
回答量:1.8万
采纳率:20%
帮助的人:2687万
展开全部
顺藤摸瓜看到Ajax请求的POST或GET方法,模拟数据抓,但也有针对性的,写代码,不具有通用性
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
xiangyuecn
2012-04-23 · TA获得超过336个赞
知道小有建树答主
回答量:408
采纳率:0%
帮助的人:309万
展开全部
顺藤摸瓜,看那个ajax请求是post还是get方法,模拟一下把数据抓过来,不过这样写出的代码针对性太强,不具通用性
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
暖喵影视社
2012-05-04 · TA获得超过122个赞
知道小有建树答主
回答量:194
采纳率:0%
帮助的人:72.6万
展开全部
你确定后台把数据都拿到了呗?少年
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
收起 更多回答(3)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式