如何获取网页源代码中标签信息的内容

 我来答

1个回答

#热议# 应届生在签三方时要注意什么？

huanglenzhi
2015-06-29 · 知道合伙人数码行家

huanglenzhi
知道合伙人数码行家

采纳数：117538 获赞数：517190

长期从事计算机组装，维护，网络组建及管理。对计算机硬件、操作系统安装、典型网络设备具有详细认知。

向TA提问私信TA

关注

展开全部

楼主可以试试我写的这个例子：

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URISyntaxException;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
  
public class URLTest {
  
    /**
     * @param args
     * @throws URISyntaxException 
     */
    public static void main(String[] args) throws Exception {
        URL url = new URL("http://www.ascii-code.com/");
        InputStreamReader reader = new InputStreamReader(url.openStream());
        BufferedReader br = new BufferedReader(reader);
        String s = null;
        while((s=br.readLine())!=null){
            s = GetContent(s);
            if(s!=null){
                System.out.println(s);
            }
        }
        br.close();
        reader.close();
    }
      
    public static String GetContent(String html) {
        //String html = "<ul><li>1.hehe</li><li>2.hi</li><li>3.hei</li></ul>";
        String ss = ">[^<]+<";
        String temp = null;
        Pattern pa = Pattern.compile(ss);
        Matcher ma = null;
        ma = pa.matcher(html);
        while(ma.find()){
            temp = ma.group();
            if(temp!=null){
                if(temp.startsWith(">")){
                    temp = temp.substring(1);
                }
                if(temp.endsWith("<")){
                    temp = temp.substring(0, temp.length()-1);
                }
                if(!temp.equalsIgnoreCase("")){
                    //System.out.println(temp);
                    return temp;
                }
            }
        }
        return null;
    }
}

已赞过 已踩过<

评论收起

武汉市江夏区曲速网络服..

广告2024-12-16

代理代办，快速解决您的需求，专业团队，全程指导，让您省心省力!代理代办，经验丰富，专属项目，快速解决您的需求!

qianhu.wejianzhan.com

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

网站设计专业公司-网站首页

qianhu.wejianzhan.com

网站设计有限公司-专业网站建设-高端网站设计

qianhu.wejianzhan.com

web端网站设计-点击进入网站首页

qianhu.wejianzhan.com

如何获取网页源代码中标签信息的内容

您可能关注的内容

其他类似问题

为你推荐：