如何下载指定网页的pdf文件?求大神,若可行,必有重谢。
http://zwgk.cma.gov.cn/web/index_2.jsp?sid=101想要弄个网络爬虫下载这个网站的所有pdf文件,保存到本地。有没有大神指点下。。...
http://zwgk.cma.gov.cn/web/index_2.jsp?sid=101
想要弄个网络爬虫下载这个网站的所有pdf文件,保存到本地。有没有大神指点下。。。 展开
想要弄个网络爬虫下载这个网站的所有pdf文件,保存到本地。有没有大神指点下。。。 展开
1个回答
展开全部
我看了那些文章的地址都是一样的只有id不一样,你可以写一个连接xxx.jsp?id=?(id的值从最小到结尾这样就OK了)
更多追问追答
追问
= =!我是小白。。不是很明白,你能帮忙写下代码么。。。
追答
public void download(String urlString, String filename,String savePath) throws Exception {
// 构造URL
URL url = new URL(urlString);
// 打开连接
URLConnection con = url.openConnection();
//设置请求的路径
con.setConnectTimeout(5*1000);
// 输入流
InputStream is = con.getInputStream();
// 1K的数据缓冲
byte[] bs = new byte[1024];
// 读取到的数据长度
int len;
// 输出的文件流
File sf=new File(savePath);
if(!sf.exists()){
sf.mkdirs();
}
OutputStream os = new FileOutputStream(sf.getPath()+"\\"+filename);
// 开始读取
while ((len = is.read(bs)) != -1) {
os.write(bs, 0, len);
}
// 完毕,关闭所有链接
os.close();
is.close();
}
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |