perl语言中去掉网页中html代码的正则表达式怎么写
2个回答
展开全部
这不是一两个正则可以解决的
如果你仅仅只是想去掉所有的tag可以直接使用
http://search.cpan.org/~dmuey/HTML-Obliterate-0.3/lib/HTML/Obliterate.pm
这个模块
如果要取特别部分 比如仅仅是超级链接或者某个div里面的某个东西就需要去使用另外的必然 HTML::Tree等模块
而且有些html本身并不标准但一般游览器可以支持
所以要自己动手处理 会有很多问题需要注意
perl就该多多利用cpan
如果你仅仅只是想去掉所有的tag可以直接使用
http://search.cpan.org/~dmuey/HTML-Obliterate-0.3/lib/HTML/Obliterate.pm
这个模块
如果要取特别部分 比如仅仅是超级链接或者某个div里面的某个东西就需要去使用另外的必然 HTML::Tree等模块
而且有些html本身并不标准但一般游览器可以支持
所以要自己动手处理 会有很多问题需要注意
perl就该多多利用cpan
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询