java 中截取<></>类似标签中的字符串的方法

从文件中读出来的是含有<text>...</text>这样的html文件,如何从读到的内容里截取出标签中的这部分?谢谢正则表达式看了一下,没能解决我的问题,有没有大师给仔... 从文件中读出来的是含有<text>...</text>这样的html文件,如何从读到的内容里截取出标签中的这部分?谢谢
正则表达式看了一下,没能解决我的问题,有没有大师给仔细讲讲,谢谢~
展开
 我来答
千锋教育
2015-12-07 · 做真实的自己 用良心做教育
千锋教育
千锋教育专注HTML5大前端、JavaEE、Python、人工智能、UI&UE、云计算、全栈软件测试、大数据、物联网+嵌入式、Unity游戏开发、网络安全、互联网营销、Go语言等培训教育。
向TA提问
展开全部

可以使用Jsoup解析器

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。


示例

<html>
    <title>hello</title>
  <head>
  </head>
  
  <body>
   <form action="/FileUpload/Upload" method="post" enctype="multipart/form-data">
   <input name="name"/><br/>
   <input type="file" name="head"/><br/>
   <input type="submit" value="upload"/>
   </form>
  </body>
</html>


比如要取得上面html中的标题

这样使用Jsoup

    Document doc = Jsoup.parse(html);//html为内容    
    Element e_title = doc.getElementsByTag("title").get(0);//根据标签名找title元素
    String title = e_title.text();//获取标签的文字

获取form中的method值

Document doc = Jsoup.parse("s");
Element e_form = doc.getElementsByTag("form").get(0);
String method = e_form.attr("method");

可以说使用非常简单,几行代码就能搞定。

红我一17
推荐于2017-12-15 · TA获得超过373个赞
知道答主
回答量:269
采纳率:0%
帮助的人:0
展开全部
解决方法很多
1.。利用String 的substr
2.用正则一定行
3.用java大量的开源,如htmlunit,httpunit,最好的我推荐htmlparse
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2009-10-31
展开全部
如果文件格式标准的话,也就是不要给我出现啥<text></t></tt>这种乱七八糟的东西并且是个xml,那可以考虑用org.w3c.dom来解析。

如果文件格式可能会乱的,但是知道要提取某些标签之间的内容的话,那还是用正则吧。

具体怎么做么,嗯,不知道,因为你描述得还不够详细。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
啊呜呜狗
2009-10-31 · 超过19用户采纳过TA的回答
知道答主
回答量:57
采纳率:0%
帮助的人:0
展开全部
apche的commons组建中有一套工具叫做httpclient。它里边就提供了一套对网页读取的操作。包括get,post方法。你可以去找找这方面的资料阅读一下。很容易就会解决你的问题。估计你是在做爬虫。。。比较恶心的东西 呵呵
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友f53cacb
2009-10-31 · TA获得超过4664个赞
知道大有可为答主
回答量:4511
采纳率:50%
帮助的人:2119万
展开全部
用正则表达式吧,具体可参考这里

http://www.javaeye.com/topic/301465
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
收起 更多回答(3)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式