perl语言中去掉网页中html代码的正则表达式怎么写

RT,求一段在perl语言中能提取网页内容(就是把html代码都去掉就可以)的正则表达式!... RT,求一段在perl语言中能提取网页内容(就是把html代码都去掉就可以)的正则表达式! 展开
 我来答
百度网友e53cbc0
2010-03-27 · TA获得超过630个赞
知道小有建树答主
回答量:389
采纳率:0%
帮助的人:554万
展开全部
这不是一两个正则可以解决的
如果你仅仅只是想去掉所有的tag可以直接使用
http://search.cpan.org/~dmuey/HTML-Obliterate-0.3/lib/HTML/Obliterate.pm
这个模块

如果要取特别部分 比如仅仅是超级链接或者某个div里面的某个东西就需要去使用另外的必然 HTML::Tree等模块

而且有些html本身并不标准但一般游览器可以支持
所以要自己动手处理 会有很多问题需要注意

perl就该多多利用cpan
百度网友003d0c83c
2010-03-26 · TA获得超过333个赞
知道小有建树答主
回答量:256
采纳率:0%
帮助的人:381万
展开全部
preg_replace("/(\<[^\<]*\>)/is", ' ', $string);
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式