设定一个程序 下载由url指定的网页源代码 指出其中所有超链接

java应用程序... java应用程序 展开
 我来答
严肃的甲道士
2013-11-14 · 传播技术传播爱,笔芯❤️
严肃的甲道士
采纳数:337 获赞数:619

向TA提问 私信TA
展开全部
public class TestReg {


 /**多次使用的使用不需要重新编译正则表达式了,对于频繁调用能提高效率
  * 
  *
  * */
//   public static   final String patternString1="<[aA]\\s*(href=[^>]+)>(.*?)</[aA]>";
  public static   final String patternString1="(http://[^>]+)\"";
 
 
  public static    Pattern pattern1 =Pattern.compile(patternString1,Pattern.DOTALL);


/**
 * @param args
 */
public static void main(String[] args) {

 /**测试的数据*/
    String ss="http://music.baidu.com/song/602998?fm=altg5";
    List<String> urls = getWebCon(ss);
    for (Iterator iterator = urls.iterator(); iterator.hasNext();) {
System.out.println(iterator.next().toString());
}
}

public static String parseUrl(String var)
{

        Matcher matcher=null;
        StringBuffer sb = new StringBuffer();

matcher=pattern1.matcher(var);

while(matcher!=null && matcher.find())
{
int a=matcher.groupCount();
while((a--)>0)
{
String ss = matcher.group(a);
sb.append(ss.substring(0, ss.indexOf("\"")));
}
 

}

return sb.toString();

}
public static List<String> getWebCon(String domain) {
List<String> sb = new ArrayList<String>();
try {
java.net.URL url = new java.net.URL(domain);
BufferedReader in = new BufferedReader(new InputStreamReader(url
.openStream()));
String line = "";
while ((line = in.readLine()) != null) {
line = new String(line.getBytes(),"UTF-8");
if(parseUrl(line) != null && parseUrl(line).length()>0){
sb.add(parseUrl(line));
}
}
in.close();
} catch (Exception e) { 
System.err.println(e);
}
return sb;
}
}
更多追问追答
追问
可以搞好的话加100给你了
追答
这段代码可以获取指定网址源码所含的所有链接,你需要下载网页或者网页源码的话我再修一下做个保存就可以了
匿名用户
2013-11-14
展开全部
HttpURLConnection 取得源码,分析所有的<a></a>
追问
是写一个java代码来实现 课堂作业
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式