
展开全部
public class TestReg {
/**多次使用的使用不需要重新编译正则表达式了,对于频繁调用能提高效率
*
*
* */
// public static final String patternString1="<[aA]\\s*(href=[^>]+)>(.*?)</[aA]>";
public static final String patternString1="(http://[^>]+)\"";
public static Pattern pattern1 =Pattern.compile(patternString1,Pattern.DOTALL);
/**
* @param args
*/
public static void main(String[] args) {
/**测试的数据*/
String ss="http://music.baidu.com/song/602998?fm=altg5";
List<String> urls = getWebCon(ss);
for (Iterator iterator = urls.iterator(); iterator.hasNext();) {
System.out.println(iterator.next().toString());
}
}
public static String parseUrl(String var)
{
Matcher matcher=null;
StringBuffer sb = new StringBuffer();
matcher=pattern1.matcher(var);
while(matcher!=null && matcher.find())
{
int a=matcher.groupCount();
while((a--)>0)
{
String ss = matcher.group(a);
sb.append(ss.substring(0, ss.indexOf("\"")));
}
}
return sb.toString();
}
public static List<String> getWebCon(String domain) {
List<String> sb = new ArrayList<String>();
try {
java.net.URL url = new java.net.URL(domain);
BufferedReader in = new BufferedReader(new InputStreamReader(url
.openStream()));
String line = "";
while ((line = in.readLine()) != null) {
line = new String(line.getBytes(),"UTF-8");
if(parseUrl(line) != null && parseUrl(line).length()>0){
sb.add(parseUrl(line));
}
}
in.close();
} catch (Exception e) {
System.err.println(e);
}
return sb;
}
}
更多追问追答
追问
可以搞好的话加100给你了
追答
这段代码可以获取指定网址源码所含的所有链接,你需要下载网页或者网页源码的话我再修一下做个保存就可以了
2013-11-14
展开全部
HttpURLConnection 取得源码,分析所有的<a></a>
追问
是写一个java代码来实现 课堂作业
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |