用java编写 网络爬虫(又称网络蜘蛛)程序,即一个网络搜索引擎。寻求解决办法
本人出学,但是必须要在一周之内写出,今天看了许多相关资料还是毫无头绪,懂得的大侠们给我讲讲吧有没有人懂啊,网上我找了好多,但还是看不懂,根本不知道要从哪里下手,从哪方面开...
本人出学,但是必须要在一周之内写出,今天看了许多相关资料还是毫无头绪,懂得的大侠们给我讲讲吧
有没有人懂啊,网上我找了好多,但还是看不懂,根本不知道要从哪里下手,从哪方面开始做,网上的都很复杂,有没有人简述明白些,如果好我会再追加分的 展开
有没有人懂啊,网上我找了好多,但还是看不懂,根本不知道要从哪里下手,从哪方面开始做,网上的都很复杂,有没有人简述明白些,如果好我会再追加分的 展开
3个回答
展开全部
方法很多,我说一种方法吧。
你可以用HttpClient来获取网页的源码,然后在源码中分别查找每一个链接。
下面这一段代码就可以获取网页的的源码 strURL为网页链接
HttpClient client = new HttpClient();
client.getHttpConnectionManager().getParams().setConnectionTimeout(500);
client.getHttpConnectionManager().getParams().setSoTimeout(500);
method = new PostMethod(strURL);
client.executeMethod(method);
webStatus += method.getStatusLine().getStatusCode()+",";
if(! "200".equals(method.getStatusLine().getStatusCode()+"")){
if(! "".equals(method.getStatusLine().getStatusCode()+""))
return "";
}
InputStream is = method.getResponseBodyAsStream();
BufferedReader br = new BufferedReader(new InputStreamReader(is, currEncoding));
StringBuffer stringBuffer = new StringBuffer();
String str = "";
while ((str = br.readLine()) != null) {
stringBuffer.append(str);
}
content = stringBuffer.toString();
我不知道你还有什么具体的问题,有的继续追问。
你可以用HttpClient来获取网页的源码,然后在源码中分别查找每一个链接。
下面这一段代码就可以获取网页的的源码 strURL为网页链接
HttpClient client = new HttpClient();
client.getHttpConnectionManager().getParams().setConnectionTimeout(500);
client.getHttpConnectionManager().getParams().setSoTimeout(500);
method = new PostMethod(strURL);
client.executeMethod(method);
webStatus += method.getStatusLine().getStatusCode()+",";
if(! "200".equals(method.getStatusLine().getStatusCode()+"")){
if(! "".equals(method.getStatusLine().getStatusCode()+""))
return "";
}
InputStream is = method.getResponseBodyAsStream();
BufferedReader br = new BufferedReader(new InputStreamReader(is, currEncoding));
StringBuffer stringBuffer = new StringBuffer();
String str = "";
while ((str = br.readLine()) != null) {
stringBuffer.append(str);
}
content = stringBuffer.toString();
我不知道你还有什么具体的问题,有的继续追问。
追问
你好,就是你想浏览哪个网站,进去之后会根据你的需求把想要的东西全部自动下载到数据库
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询