正则表达式,去除包含的所有html标签 30

有这样一段text:如图所示:想请教正则表达式的大牛,怎样提取除去html标签以外的正文内容,并且,我只想保留“wrote:”后面的正文,就是帖子是什么时间发表的一概不管... 有这样一段text:如图所示:

想请教正则表达式的大牛,怎样提取除去html标签以外的正文内容,并且,我只想保留“wrote:”后面的正文,就是帖子是什么时间发表的一概不管,并且不要签名档的内容,也就是“'post-sig”后面的都不想要,只想保留“ NS so glad you created this thread. You're really a special person. You and these wonderful women brought me back from a place I don't ever want to be again Love to you all ... and Happy and Healthy 2007Hugs CherylG.” 我想要一个通用的正则表达式,因为正文中出现的html标签各不一样:例如还有一段:

这个连签名都没有的~

或者:

抱歉我想贴上来文档,让大牛帮忙test,但是html标签子自动吃掉了,所以只好贴图
感激不尽~
展开
 我来答
阿辉LV6
2013-08-28 · TA获得超过263个赞
知道小有建树答主
回答量:705
采纳率:0%
帮助的人:409万
展开全部

可以用wrote:做为正则开关,正则结尾就得在文章里面找,哪个标签条件一定是满足,比如ID,或者class之类的,然后在清除HTML标签,这里就以class="post_sig" 为例

str = "wrote:(.+)<div class=\"post_sig\">";
str.replace(/(<.[^>]*>)/ig, '');
alert(str);
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式