perl语言中去掉网页中html代码的正则表达式怎么写

RT,求一段在perl语言中能提取网页内容（就是把html代码都去掉就可以）的正则表达式！... RT,求一段在perl语言中能提取网页内容（就是把html代码都去掉就可以）的正则表达式！展开

 我来答

2个回答

#热议# 在购买新能源车时，要注意哪些？

百度网友e53cbc0
2010-03-27 · TA获得超过630个赞

知道小有建树答主

回答量：389

采纳率：0%

帮助的人：554万

我也去答题访问个人页

关注

展开全部

这不是一两个正则可以解决的
如果你仅仅只是想去掉所有的tag可以直接使用
http://search.cpan.org/~dmuey/HTML-Obliterate-0.3/lib/HTML/Obliterate.pm
这个模块

如果要取特别部分比如仅仅是超级链接或者某个div里面的某个东西就需要去使用另外的必然 HTML::Tree等模块

而且有些html本身并不标准但一般游览器可以支持
所以要自己动手处理会有很多问题需要注意

perl就该多多利用cpan

本回答由提问者推荐

已赞过 已踩过<

评论收起

百度网友003d0c83c
2010-03-26 · TA获得超过333个赞

知道小有建树答主

回答量：256

采纳率：0%

帮助的人：381万

我也去答题访问个人页

关注

展开全部

preg_replace("/(\<[^\<]*\>)/is", ' ', $string);

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

perl语言中去掉网页中html代码的正则表达式怎么写

其他类似问题

为你推荐：