设定一个程序下载由url指定的网页源代码指出其中所有超链接

java应用程序... java应用程序展开

 我来答

2个回答

#热议# 什么是淋病？哪些行为会感染淋病？

严肃的甲道士
2013-11-14 · 传播技术传播爱，笔芯❤️

严肃的甲道士

采纳数：337 获赞数：619

向TA提问私信TA

关注

展开全部

public class TestReg {

	
	 /**多次使用的使用不需要重新编译正则表达式了，对于频繁调用能提高效率
	  * 
	  *
	  * */
//	  public static   final String patternString1="<[aA]\\s*(href=[^>]+)>(.*?)</[aA]>";
	  public static   final String patternString1="(http://[^>]+)\"";
	 
	 
	  public static    Pattern pattern1 =Pattern.compile(patternString1,Pattern.DOTALL);
	
	
	/**
	 * @param args
	 */
	public static void main(String[] args) {
		
		 /**测试的数据*/
	    String ss="http://music.baidu.com/song/602998?fm=altg5";
	    List<String> urls = getWebCon(ss);
	    for (Iterator iterator = urls.iterator(); iterator.hasNext();) {
			System.out.println(iterator.next().toString());
		}
	}
	
	public static String parseUrl(String var)
	{
		
		        Matcher matcher=null;
		        StringBuffer sb = new StringBuffer();
	
				matcher=pattern1.matcher(var);
			
				while(matcher!=null && matcher.find())
				{
					int a=matcher.groupCount();
					while((a--)>0)
					{
						String ss = matcher.group(a);
						sb.append(ss.substring(0, ss.indexOf("\"")));
					}
				 
					
				}
			
			return sb.toString();
		
	}
	public static List<String> getWebCon(String domain) {
		List<String> sb = new ArrayList<String>();
		try {
			java.net.URL url = new java.net.URL(domain);
			BufferedReader in = new BufferedReader(new InputStreamReader(url
					.openStream()));
			String line = "";
			while ((line = in.readLine()) != null) {
				line = new String(line.getBytes(),"UTF-8");
				if(parseUrl(line) != null && parseUrl(line).length()>0){
					sb.add(parseUrl(line));
				}
			}
			in.close();
		} catch (Exception e) { 
			System.err.println(e);
		}
		return sb;
	}
}

更多追问追答

追问

可以搞好的话加100给你了

追答

这段代码可以获取指定网址源码所含的所有链接，你需要下载网页或者网页源码的话我再修一下做个保存就可以了

本回答由提问者推荐

已赞过 已踩过<

评论收起

北京引力弹弓科技有限公司

广告2025-04-19

AI IDE可根据你的描述自动生成代码或创建项目文件，支持从0到1开发项目。

www.trae.com.cn

匿名用户
2013-11-14

展开全部

HttpURLConnection 取得源码，分析所有的<a></a>

追问

是写一个java代码来实现 课堂作业

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

c++ 运行库下载_专业修复工具-解决无法启用问题，修复游戏

c++ 运行库下载，一键修复各类因dll缺失，异常等导致的游戏和软件不能运行的问题，工具适用于多种操作系统.VC库修复整合修复工具下载，一键快捷修复。适配各种电脑系统

dll.3dmgame.com广告

2025全新c语言-免费下载新版.doc标准版

今年优秀c语言修改套用，省时省钱。专业人士起草!c语言文件模板正规严谨合法，一键下载，立即修改套用，高效实用!

www.tukuppt.com广告

2025全新c语言下载-内容详细-完整版

熊猫办公海量c语言下载，满足各行办公教育需求通用文档，下载即用。全新c语言下载，完整范文.word格式，下载可直接使用。

www.tukuppt.com广告

设定一个程序 下载由url指定的网页源代码 指出其中所有超链接

您可能关注的内容

其他类似问题

为你推荐：

设定一个程序下载由url指定的网页源代码指出其中所有超链接