java下载网页的程序
请问做了一个java下载网页的程序,但是如果下载例如:http://zhidao.baidu.com/question/89142348.html的网页就可以,但如果是像...
请问做了一个java下载网页的程序,但是如果下载例如:http://zhidao.baidu.com/question/89142348.html的网页就可以,但如果是像这种:http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1=semiconductor&OS=semiconductor&RS=semiconductor,(没有html或htm结尾的),即通过搜索引擎接口得到的返回页面,下载的时候就会有问题,请问这是怎么回事呢?http协议的问题?可能这样往往得不到这张网页的大小,谢谢高手了!
展开
3个回答
展开全部
呵呵,这就要提到WEB的运行机制了,一般情况下,你用JAVA程序下载html静态页面是没问题的,因为HTTP请求返回的就是静态页面,也就是你只能从服务器得到带有超文本标记的文本。。。但是现在许多页面不仅仅是HTML静态页面,很多页面的内容都是要经过服务器后台程序(ACTION)处理后输出,并由服务器解释称HTML语言发给客户端浏览器的,比如百度搜索就是这样,相信你的网页下载程序中的页面显示用的是 JEditPane 吧,这个好像只能用于静态页面的显示,而动态页面就有些力不从心了,一般会显示的不太正常,比如网页排版、超链接等
这里有个浏览器的例子,看看吧
http://hi.baidu.com/pazhu/blog/item/754f039bc6f75dbdc8eaf434.html
这里有个浏览器的例子,看看吧
http://hi.baidu.com/pazhu/blog/item/754f039bc6f75dbdc8eaf434.html
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你是拿到输入流,然后存到电脑吧,还是显示出来呢,如果是把服务器传过来的东东直接存电脑可能是文件名的问题!!
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
是你解析网页的时候遇到了特殊 的符号
符号被转义了
符号被转义了
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询