如何用正则表达式去掉html标签
3个回答
展开全部
protected string str = "<table><tr><td>sdasasdsdd</td></tr></table><br><p>sds</p><img id='img1' src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50' alt=''>aaassss<br><img src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50' alt=''> 说是道 ";
protected void Page_Load(object sender, EventArgs e)
{
//string regexstr = @"<[^>]*>"; //去除所有的标签
//@"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
// string regexstr = @"<img[^>]*>"; //去除图片的正则
// string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br
// string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容
string regexstr = @"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p
str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
}
protected void Page_Load(object sender, EventArgs e)
{
//string regexstr = @"<[^>]*>"; //去除所有的标签
//@"<script[^>]*?>.*?</script >" //去除所有脚本,中间部分也删除
// string regexstr = @"<img[^>]*>"; //去除图片的正则
// string regexstr = @"<(?!br).*?>"; //去除所有标签,只剩br
// string regexstr = @"<table[^>]*?>.*?</table>"; //去除table里面的所有内容
string regexstr = @"<(?!img|br|p|/p).*?>"; //去除所有标签,只剩img,br,p
str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
}
2016-02-09
展开全部
</?font[^><]*> 这个只却掉font标签的,保留除font以外的所有标签,如<img><p>等等. 同样的你需要去掉其他标签,只需要将里面的font换你要去掉的,就可以了.
</?[^/?(img)|(p)][^><]*> 这个保留(这里我写的保留了img,p这两个标签)你指定的标签,其他的(包括font)全去掉, 如果你还有其他的标签想保留,直接在里面加一个 |(xxx)就行了,
</?[a-zA-Z]+[^><]*> 这个就是我最上面写的那个,会去掉所有的标签,包括font .
</?[a-zA-Z]+[^><]*> 这个表达式可以去掉所有HTML的标签
JAVA代码可以这样写:
public static String delTagsFContent(String content){
String patternTag = "</?[a-zA-Z]+[^><]*>";
String patternBlank = "(^\\s*)|(\\s*$)";
return content.replaceAll(patternTag, "").replaceAll(patternBlank, "");
}
</?[^/?(img)|(p)][^><]*> 这个保留(这里我写的保留了img,p这两个标签)你指定的标签,其他的(包括font)全去掉, 如果你还有其他的标签想保留,直接在里面加一个 |(xxx)就行了,
</?[a-zA-Z]+[^><]*> 这个就是我最上面写的那个,会去掉所有的标签,包括font .
</?[a-zA-Z]+[^><]*> 这个表达式可以去掉所有HTML的标签
JAVA代码可以这样写:
public static String delTagsFContent(String content){
String patternTag = "</?[a-zA-Z]+[^><]*>";
String patternBlank = "(^\\s*)|(\\s*$)";
return content.replaceAll(patternTag, "").replaceAll(patternBlank, "");
}
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/2000/REC-xhtml1-20000126/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<script language="JavaScript" type="text/javascript">
//去掉指定的html标签
function g(id,s){
var o=document.getElementById(id);
o.innerHTML=o.innerHTML.replace(/(<\/?(?!br|p|img)[^>\/]*)\/?>/gi,'');
setText(s,id)
}
//取得源代码
function setText(d,s){
var d1=document.getElementById(d);
var s1=document.getElementById(s);
for (var i=0;i<d1.childNodes.length;i++){
d1.removeChild(d1.childNodes[i]);
}
d1.appendChild(document.createTextNode(s1.innerHTML))
}
</script>
<style>
div{border:solid 1px blue}
</style>
</head>
<body onload="setText('t','test')">
<div id="test">
<P><font size='12pt'>d</font>ows就免不<img src="http://www.blueidea.com/img/common/logo.gif"/>了要重新安装系统。<br/>当然<span style='border:solid 1px red;font-size:23px'>,重新安装系</span>统并不难,但是安装完系统后你知道我<h1>们</h1>有多少事情必须要做吗?<br><strong>这</strong>可容不得丝毫的松懈,一旦马虎,将可能会导致前功尽弃,甚至有可能会造成数据丢失、信息泄密!
</P>
</div>
<button onclick="g('test','t')">简化html</button>
<div id="t" title='源代码显示'></div>
</body>
</html>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<script language="JavaScript" type="text/javascript">
//去掉指定的html标签
function g(id,s){
var o=document.getElementById(id);
o.innerHTML=o.innerHTML.replace(/(<\/?(?!br|p|img)[^>\/]*)\/?>/gi,'');
setText(s,id)
}
//取得源代码
function setText(d,s){
var d1=document.getElementById(d);
var s1=document.getElementById(s);
for (var i=0;i<d1.childNodes.length;i++){
d1.removeChild(d1.childNodes[i]);
}
d1.appendChild(document.createTextNode(s1.innerHTML))
}
</script>
<style>
div{border:solid 1px blue}
</style>
</head>
<body onload="setText('t','test')">
<div id="test">
<P><font size='12pt'>d</font>ows就免不<img src="http://www.blueidea.com/img/common/logo.gif"/>了要重新安装系统。<br/>当然<span style='border:solid 1px red;font-size:23px'>,重新安装系</span>统并不难,但是安装完系统后你知道我<h1>们</h1>有多少事情必须要做吗?<br><strong>这</strong>可容不得丝毫的松懈,一旦马虎,将可能会导致前功尽弃,甚至有可能会造成数据丢失、信息泄密!
</P>
</div>
<button onclick="g('test','t')">简化html</button>
<div id="t" title='源代码显示'></div>
</body>
</html>
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询