java 如何利用正则表达式只保留html里面的<p></p>标签里面的内容

java如何利用正则表达式只保留html里面的<p></p>标签里面的内容我们都知道html里面<p></p>里面就是正文内容,但是有时候也会有标签属性例如:<pstyl... java 如何利用正则表达式只保留html里面的<p></p>标签里面的内容

我们都知道html里面<p></p>里面就是正文内容,但是有时候也会有标签属性
例如:

<p style="font-size:1.3em;font-weight:bold">No page with that title exists.</p>

但是输出只要 No page with that tittle \n 也就是每个标签内容末尾要加个换行符,请问如何做?
我是想把html的正文内容保存成文本,并简单排版一下
展开
 我来答
65288664
推荐于2017-11-26 · TA获得超过952个赞
知道小有建树答主
回答量:2359
采纳率:0%
帮助的人:1104万
展开全部
正则表达式:<p.*?>(.*?)</p>
group(1)为正文内容。
输出时加上\n就行了

import java.util.regex.*;
public class Test{
public static void main(String[] args){
String str="<p style=\"font-size:1.3em;font-weight:bold\">No page with that title exists.</p> ";
String regex="<p.*?>(.*?)</p> ";
Pattern p =Pattern.compile(regex);
Matcher m=p.matcher(str);
while(m.find()){
System.out.println(m.group(1));
}
}
}
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
lazyye
2008-12-04 · 超过20用户采纳过TA的回答
知道小有建树答主
回答量:153
采纳率:0%
帮助的人:76.4万
展开全部
刚我也问了这个问题
原理一样的 改下语法就可以了 应该..其实我还是没成功 在找答案中..
http://zhidao.baidu.com/question/77876219.html

就是替换掉 <p * > 然后再把 </p>替换成<br/>
这样子.
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
督诺0GMffd
2008-12-04 · TA获得超过2013个赞
知道大有可为答主
回答量:3770
采纳率:0%
帮助的人:2057万
展开全部
其实没太看懂你的意思。
你想换行,直接用<br>就行了。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式