java 中截取<></>类似标签中的字符串的方法
从文件中读出来的是含有<text>...</text>这样的html文件,如何从读到的内容里截取出标签中的这部分?谢谢正则表达式看了一下,没能解决我的问题,有没有大师给仔...
从文件中读出来的是含有<text>...</text>这样的html文件,如何从读到的内容里截取出标签中的这部分?谢谢
正则表达式看了一下,没能解决我的问题,有没有大师给仔细讲讲,谢谢~ 展开
正则表达式看了一下,没能解决我的问题,有没有大师给仔细讲讲,谢谢~ 展开
2015-12-07 · 做真实的自己 用良心做教育
千锋教育
千锋教育专注HTML5大前端、JavaEE、Python、人工智能、UI&UE、云计算、全栈软件测试、大数据、物联网+嵌入式、Unity游戏开发、网络安全、互联网营销、Go语言等培训教育。
向TA提问
关注
展开全部
可以使用Jsoup解析器
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
示例
<html>
<title>hello</title>
<head>
</head>
<body>
<form action="/FileUpload/Upload" method="post" enctype="multipart/form-data">
<input name="name"/><br/>
<input type="file" name="head"/><br/>
<input type="submit" value="upload"/>
</form>
</body>
</html>
比如要取得上面html中的标题
这样使用Jsoup
Document doc = Jsoup.parse(html);//html为内容
Element e_title = doc.getElementsByTag("title").get(0);//根据标签名找title元素
String title = e_title.text();//获取标签的文字
获取form中的method值
Document doc = Jsoup.parse("s");
Element e_form = doc.getElementsByTag("form").get(0);
String method = e_form.attr("method");
可以说使用非常简单,几行代码就能搞定。
展开全部
解决方法很多
1.。利用String 的substr
2.用正则一定行
3.用java大量的开源,如htmlunit,httpunit,最好的我推荐htmlparse
1.。利用String 的substr
2.用正则一定行
3.用java大量的开源,如htmlunit,httpunit,最好的我推荐htmlparse
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2009-10-31
展开全部
如果文件格式标准的话,也就是不要给我出现啥<text></t></tt>这种乱七八糟的东西并且是个xml,那可以考虑用org.w3c.dom来解析。
如果文件格式可能会乱的,但是知道要提取某些标签之间的内容的话,那还是用正则吧。
具体怎么做么,嗯,不知道,因为你描述得还不够详细。
如果文件格式可能会乱的,但是知道要提取某些标签之间的内容的话,那还是用正则吧。
具体怎么做么,嗯,不知道,因为你描述得还不够详细。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
apche的commons组建中有一套工具叫做httpclient。它里边就提供了一套对网页读取的操作。包括get,post方法。你可以去找找这方面的资料阅读一下。很容易就会解决你的问题。估计你是在做爬虫。。。比较恶心的东西 呵呵
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询