怎么清除所有的html标签,(包括图片、</p>、<span>等等所有标签)只保留文字部分

 我来答
东土小皇帝
2013-03-08 · 超过27用户采纳过TA的回答
知道答主
回答量:92
采纳率:0%
帮助的人:32.1万
展开全部
这是我以前整理的,你可以先试试
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HTMLSpirit{
publicstatic String delHTMLTag(String htmlStr){
String
regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式
String
regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式
String
regEx_html="<[^>]+>"; //定义HTML标签的正则表达式

Pattern
p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
Matcher m_script=p_script.matcher(htmlStr);

htmlStr=m_script.replaceAll(""); //过滤script标签

Pattern
p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
Matcher
m_style=p_style.matcher(htmlStr);
htmlStr=m_style.replaceAll("");
//过滤style标签

Pattern
p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
Matcher
m_html=p_html.matcher(htmlStr);

htmlStr=m_html.replaceAll(""); //过滤html标签
return
htmlStr.trim(); //返回文本字符串
}
}
更多追问追答
追问

这是我后台输出返回的结果:


这是页面显示:

你把图片截断了

追答
你可以根据你的需求 修改一下正则表达式,这个是我以前用的,不一定所有的都适合!
就是小厉1U
2013-03-08 · TA获得超过495个赞
知道小有建树答主
回答量:250
采纳率:100%
帮助的人:74.7万
展开全部
使用正则表达式去匹配删除
追问
我问的就是这个,我没用过正则所以想让你们帮我写一个,谢谢
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
chnzf
2013-03-08
知道答主
回答量:26
采纳率:100%
帮助的人:6.3万
展开全部
去代码里删了··
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
平常人平常aS
2013-03-08 · 超过20用户采纳过TA的回答
知道答主
回答量:127
采纳率:0%
帮助的人:69.7万
展开全部
直接删了不行吗?没明白你什么意思
更多追问追答
追问

我要在页面列表显示的时候不显示那些标签,否则会换行或者会出现图片,这样布局不就乱了吗

追答
这样的话加一个过滤器就行了
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式