帮忙分析一下用python爬取一个网站一直不成功的原因

headers={"Accept":headers={"text/html,application/xhtml+xml,application/xml;q=0.9,ima... headers = {
"Accept":
headers={"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
"Accept-Encoding": "gzip, deflate",
"Accept-Language": "zh-CN,zh;q=0.9",
"Cache-Control": "no-cache",
"Connection": "keep-alive",
"DNT": "1",
"Host": "ha.chinaunicombidding.cn",
"Pragma": "no-cache",
"Upgrade-Insecure-Requests": "1",
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36"
}
url1='http://ha.chinaunicombidding.cn/jsp/cnceb/web/info1/infoList.jsp?notice=&time1=&time2=&province=&city=&type='
response = requests.get(url1, headers=headers)
text = response.content.decode('utf-8')
html = etree.HTML(text)
biaotis=html.xpath('//*[@id="div1"]/table/tbody/tr/td//text()') #招标公告标题
for biaoti in biaotis:
print(biaoti) 展开

 我来答

1个回答

#热议# 海关有哪些禁运商品？查到后怎么办？

风驰电掣happy
2019-08-02 · TA获得超过136个赞

知道小有建树答主

回答量：226

采纳率：63%

帮助的人：81.4万

我也去答题访问个人页

关注

展开全部

人家内容是通过js生成就这样,而且就算不是js生成的你写的代码也有一堆问题,人家没有对请求头的返爬你加不加毫无意义,text = response.content.decode('utf-8')你这写法是什么鬼,人家网站charset默认utf8没有必要定义,直接text = response.text就可以了,这个网站你应该爬不下来,还是看看基础吧骚年

追问

回答好nb啊！那你给指点一下啊！

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

超级码客~2025版海量Javascript面试题+笔试题&答案

精编javascript 笔试题Web前端工程师面试#H5，CSS3，JavaScript，Vue，JQuery，Redux，WebpackBootstrap，TypeScript，微信小程序核心题集超3500题，一站式面试服务javascript 笔试题

www.chaojimake.cn广告

帮忙分析一下用python爬取一个网站一直不成功的原因

您可能关注的内容

其他类似问题

为你推荐：