如何用正则表达式去掉html标签
4个回答
展开全部
用正则表达式去掉html标签,下面是它的代码,直接复制就可以用的。
代码:
public
static string StripHTML(string HTML) //google "StripHTML" 得到 {
string[] Regexs = {
@"<script[^>]*?>.*?</script>",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+", @"&(quot|#34);",
@"&(amp|#38);", @"&(lt|#60);",
@"&(gt|#62);", @"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);", @"(\d+);",
@"-->", @"<!--.*\n" }; string[]
Replaces = { "", "", "", "\"", "&",
"<", ">", " ", "\xa1", //chr(161),
"\xa2", //chr(162), "\xa3", //chr(163), "\xa9", //chr(169), "",
"\r\n", "" }; string s = HTML; for (int i = 0; i <
Regexs.Length; i++) { s = new Regex(Regexs[i],
RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s,
Replaces[i]); } s.Replace("<", "");
s.Replace(">", ""); s.Replace("\r\n", ""); return s;
} }
代码:
public
static string StripHTML(string HTML) //google "StripHTML" 得到 {
string[] Regexs = {
@"<script[^>]*?>.*?</script>",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+", @"&(quot|#34);",
@"&(amp|#38);", @"&(lt|#60);",
@"&(gt|#62);", @"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);", @"(\d+);",
@"-->", @"<!--.*\n" }; string[]
Replaces = { "", "", "", "\"", "&",
"<", ">", " ", "\xa1", //chr(161),
"\xa2", //chr(162), "\xa3", //chr(163), "\xa9", //chr(169), "",
"\r\n", "" }; string s = HTML; for (int i = 0; i <
Regexs.Length; i++) { s = new Regex(Regexs[i],
RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s,
Replaces[i]); } s.Replace("<", "");
s.Replace(">", ""); s.Replace("\r\n", ""); return s;
} }
2016-06-01 · 百度知道合伙人官方认证企业
育知同创教育
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
关注
展开全部
使用正则表达式去掉html标签的方法常用的正则表达式是:/<[^<]+?>/g
1、定义含有html标签的字符串:
$text = '<p>Test paragraph.</p><!-- Comment --> <a href="#fragment">Other text</a>';
2、定义正则表达式并替换
$val = preg_replace('/<[^<]+?>/g', ' ', $row_get_Business['business_description']);
3、截取指定长度
$businessDesc = substr(val,0,110);
1、定义含有html标签的字符串:
$text = '<p>Test paragraph.</p><!-- Comment --> <a href="#fragment">Other text</a>';
2、定义正则表达式并替换
$val = preg_replace('/<[^<]+?>/g', ' ', $row_get_Business['business_description']);
3、截取指定长度
$businessDesc = substr(val,0,110);
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2016-03-26
展开全部
string regexstr = @"<[^>]*>";
, context = Regex.Replace(contextregexstr, string.Empty, RegexOptions.IgnoreCase);
context = context.Replace(" ", "");
, context = Regex.Replace(contextregexstr, string.Empty, RegexOptions.IgnoreCase);
context = context.Replace(" ", "");
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询