java 如何去除html中的一个指定标签和指定标签里的内容

用java代码去除html中的一个指定标签和指定标签里的内容... 用java代码去除html中的一个指定标签和指定标签里的内容 展开
 我来答
一数一道
推荐于2017-09-24 · TA获得超过1751个赞
知道小有建树答主
回答量:369
采纳率:75%
帮助的人:216万
展开全部

java处理html指定标签最好用正则表达式。例如要去除html中所有的h1标签和类容就可以用下面的演示代码:

package konw.reg;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RemoveTag
{
    public static void main(String[] args)
    {
        FileReader fr;
        String content =null;
        String regex = "<[Hh]1>.*</[Hh]1>";
        try
        {
            fr = new FileReader("tag.html");
            BufferedReader br = new BufferedReader(fr);
            String str = null;
            StringBuffer sb = new StringBuffer();
            while((str = br.readLine()) != null)
            {
                sb.append(str+"\n");
            }
            content = sb.toString();
            br.close();
            
        } catch (FileNotFoundException e)
        {
            e.printStackTrace();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(content);
        StringBuffer sb1 = new StringBuffer();
        while(matcher.find())
        {
            sb1.append(matcher.replaceAll("")+"\n");
        }
        try
        {
            FileWriter fw = new FileWriter("tag.html");
            BufferedWriter bw = new BufferedWriter(fw);
            fw.write(sb1.toString());
            bw.close();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
    }
}
SWkissme
推荐于2017-10-12 · TA获得超过430个赞
知道小有建树答主
回答量:181
采纳率:88%
帮助的人:81.9万
展开全部
你好,可以用正则表达式。比如想要去除id为test的div标签及其内容:
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Person{
public static void main(String[] args) {
//正则表达式
Pattern p = Pattern.compile("<div.*id='test'.*</div>");
//测试用的html代码
String str = "<html><body>aa<div id='test'>bb</div></body></html>";
Matcher m = p.matcher(str);
//去除标签
String result = m.replaceAll("");

System.out.println(result);
}
}
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
等祢看流星雨
2015-06-18 · TA获得超过231个赞
知道小有建树答主
回答量:261
采纳率:0%
帮助的人:199万
展开全部
java不行,得javaScript
用getElementById()方法获取该标签,然后对标签进行操作
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
jACKy劉
2013-09-02 · TA获得超过325个赞
知道小有建树答主
回答量:240
采纳率:100%
帮助的人:244万
展开全部

JavaScript?


给定标签一个id, 譬如 labe_xxx

$("#label_xxx").empty();

$("#label_xxx").remove();
追问
java 处理html
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式