用java写爬虫程序，有个网站获取不到链接，求指导

http://www.cnpcbidding.com/wps/portal/ebid/wcm_search/bidnotice_publishhttp://ssggzy.... http://www.cnpcbidding.com/wps/portal/ebid/wcm_search/bidnotice_publish
http://ssggzy.ss.gov.cn/zbxx/index.jhtml?cid=1&type=0
爬取这两个网站列表的标题和链接，不用翻页，简单粗暴的结果
（若能解其一，感激不尽）
第二个已解决，请帮忙参考第一个，谢谢展开

 我来答

4个回答

#热议# 为什么说不要把裤子提到肚脐眼？

百度网友469523a
推荐于2016-10-26 · TA获得超过1.3万个赞

知道大有可为答主

回答量：2852

采纳率：0%

帮助的人：1020万

我也去答题访问个人页

关注

展开全部

//读取网页上的内容方法---------------------2010.01.25 public String getOneHtml(String htmlurl) throws IOException {
URL url;
String temp;
final StringBuffer sb = new StringBuffer();
try {
url = new URL(htmlurl);
// 读取网页全部内容
final BufferedReader in = new BufferedReader(new InputStreamReader(
url.openStream(),"GBK"));
while ((temp = in.readLine()) != null) {
sb.append(temp);
}
in.close();
} catch (final MalformedURLException me) {
System.out.println("你输入的URL格式有问题！请仔细输入");
me.getMessage();

} catch (final IOException e) {
e.printStackTrace();

}
return sb.toString();
}上面这个方法是根据你传入的url爬取整个网页的内容，然后你写个正则表达式去匹配这个字符串的内容。

追问

用其他方法解决了，你这方法我还没试，看起来牛逼哄哄的，采纳吧！多谢了

本回答被提问者和网友采纳

已赞过 已踩过<

评论收起

帽子狗
2015-07-21 · TA获得超过942个赞

知道小有建树答主

回答量：611

采纳率：50%

帮助的人：554万

我也去答题访问个人页

关注

展开全部

第一个是用js做的跳转
点击链接以后设置他下面一个表单属性的值
<input type="hidden" name="documentId" value="" />
然后提交了这个表单搞到值了以后直接你设置 documentId=xxx 往表单action里面发数据就搞到链接了

已赞过 已踩过<

评论收起

数阔八爪鱼采集器丨RPA机器人
2021-07-30 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

可能是正则表达式写错了，你用工具测试一下。

已赞过 已踩过<

评论收起

双子伍豪
2015-07-21

知道答主

回答量：8

采纳率：0%

帮助的人：5694

我也去答题访问个人页

关注

展开全部

把网站地址链接加入

追问

什么意思？

已赞过 已踩过<

评论收起

更多回答（2）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

用java写爬虫程序，有个网站获取不到链接，求指导

其他类似问题

为你推荐：