java语言获取网页标签中的内容
我需要从一个网站上获取天气预报的温度值,我选择了新浪网程序如下packagetianqi;importjava.io.File;importjava.io.FileInp...
我需要从一个网站上获取天气预报的温度值,我选择了新浪网
程序如下
package tianqi;
import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStream;import java.io.IOException;import java.util.Iterator;
import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;
public class zhuaqutianqi { public static void main(String[] args) throws Exception { String getUrl = "http://www.sina.com.cn/"; Document doc = Jsoup.connect(getUrl).timeout(1000).get(); Element body = doc.body(); Elements el=body.select("span[class]"); Iterator it = el.iterator(); String[]s=new String[100]; int i=0; while( it .hasNext() ) { Element e = (Element) it.next(); s[i]=e.text(); i++; System.out.println(s[i] ); }
}
}
为什么结果为空
这个是那个网页的标签,我需要那个27~18度,求各位神帮忙修改一下程序 展开
程序如下
package tianqi;
import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStream;import java.io.IOException;import java.util.Iterator;
import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;
public class zhuaqutianqi { public static void main(String[] args) throws Exception { String getUrl = "http://www.sina.com.cn/"; Document doc = Jsoup.connect(getUrl).timeout(1000).get(); Element body = doc.body(); Elements el=body.select("span[class]"); Iterator it = el.iterator(); String[]s=new String[100]; int i=0; while( it .hasNext() ) { Element e = (Element) it.next(); s[i]=e.text(); i++; System.out.println(s[i] ); }
}
}
为什么结果为空
这个是那个网页的标签,我需要那个27~18度,求各位神帮忙修改一下程序 展开
3个回答
展开全部
新浪的那个天气的值是通过js动态加载的,原始html页面是<div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"></div> 。
而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。
而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。
更多追问追答
追问
那如何才能获得那些信息,将网页内容全部下载下载下来?我需要定时提取的,现在只是先能提取下来就行
追答
请求天气 实际是访问了这个地址http://php.weather.sina.com.cn/iframe/index/w_cl.php 你可以从这里抓取.
展开全部
建议使用htmlparser,这个比较强大,带有过滤和提取内容的功能。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
使用一些框架更好,例如htmlparser之类的,如果不是的,就需要使用正则来处理了!
追问
小弟是初学者,希望大神能够帮忙改改,小弟不知道是哪里的问题,不是说jsoup可以进行筛选吗,我只想得到那个温度值
追答
看jsoup文档啊,这种事应该自己做,文档里就有!
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询