网络爬虫问题,关于爬虫爬到的语言

我用Httrack爬外国的多语言网页时,老是爬到英文的网页,用浏览器看却能直接看到中文的网页,为什么?求解答... 我用Httrack爬外国的多语言网页时,老是爬到英文的网页,用浏览器看却能直接看到中文的网页,为什么?

求解答
展开
 我来答
Anter_0
2013-07-24 · TA获得超过353个赞
知道小有建树答主
回答量:461
采纳率:100%
帮助的人:192万
展开全部
我是做WEB的 我给你个专业的回答,大部分网站都是有支持多语言能力的,这个多语言是根据用户的浏览器语言自动判定的,你可以在你IE选项里面看到当前的语言信息,应该是中文的,所以当你访问外国网站时,看到是中文界面,
而爬虫未携带任何语言信息,所以网站响应的时候就会响应默认语言,相信国外的网站默认语言都应该是英文,这么解释明白不?
更多追问追答
追问
那要爬到中文怎么办呢?
追答
爬到中文也会索引起来啊。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式