如何取到网页<Script>标签中的部分内容,直接在网页上取(最好)或者在JSP上取都行
Java的抓取,如何取到网页<Script>标签中的部分内容,直接在网页上取(最好)或者在JSP上取都行,说清方法,最好有代码...
Java的抓取,如何取到网页<Script>标签中的部分内容,直接在网页上取(最好)或者在JSP上取都行,说清方法,最好有代码
展开
3个回答
展开全部
用jsoup,字数不够字数不够字数不够字数不够
追问
字数不够你再多说点啊,http://www.jb51.net/article/43485.htm,这上的方法可行不?我新手,我觉得还是用jsoup靠谱,你先给我说方法,成功了我再开个问题给你分
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
20分太少了 自己去学习HtmlUnit
追问
你要是回答出来我再追加50都没问题,具体方法就成
追答
public class Html {
@SuppressLint("SetJavaScriptEnabled")
public static String HtmlUnit(String path) {
// TODO Auto-generated method stub
final WebClient webClient = new WebClient();
webClient.getOptions().setThrowExceptionOnScriptError(false);
webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);
webClient.getOptions().setJavaScriptEnabled(true);//执行JS
webClient.getOptions().setCssEnabled(false);
webClient.setAjaxController(new NicelyResynchronizingAjaxController());
webClient.setJavaScriptTimeout(1000);
webClient.getOptions().setThrowExceptionOnScriptError(false);
HtmlPage page = null;
try {
page = webClient.getPage(path);
} catch (FailingHttpStatusCodeException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
webClient.closeAllWindows();
return page.asXml();
}
}
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你是想用java解析XML文件吧,去看看Dom4j吧
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询