python抓取数据的问题
想提取“交易品种”用下面代码不能过滤“xml:namespace。。。”这行。要怎么改呢?tables=soup.find('table').findAll('span'...
想提取“交易品种”用下面代码不能过滤“xml:namespace。。。”这行。要怎么改呢?
tables=soup.find('table').findAll('span')
for item in tables
a=item.findAll(text=True)
<P style="MARGIN: 0 0 0; LINE-HEIGHT: 150%; TEXT-ALIGN: left; mso-pagination: widow-orphan"><SPAN style="FONT-SIZE: 12px; COLOR: black; LINE-HEIGHT: 150%; FONT-FAMILY: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0">交易品种<SPAN><?xml:namespace prefix = o ns = "urn:schemas-microsoftcom:office:office" /><o:p></o:p></SPAN></SPAN></P></TD> 展开
tables=soup.find('table').findAll('span')
for item in tables
a=item.findAll(text=True)
<P style="MARGIN: 0 0 0; LINE-HEIGHT: 150%; TEXT-ALIGN: left; mso-pagination: widow-orphan"><SPAN style="FONT-SIZE: 12px; COLOR: black; LINE-HEIGHT: 150%; FONT-FAMILY: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0">交易品种<SPAN><?xml:namespace prefix = o ns = "urn:schemas-microsoftcom:office:office" /><o:p></o:p></SPAN></SPAN></P></TD> 展开
2个回答
展开全部
这个不复杂,没必要搞着这种,真心建议你直接用免费的八爪鱼采集器,采集网站数据就剩下点鼠标即可。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
1) Beautiful Soup 能用吗?
2) 截图的话,别人没法直接帮你试验的。
2) 截图的话,别人没法直接帮你试验的。
更多追问追答
追问
可以用啊,我补充了代码了,是表格的一条,结果是:"交易品种": "xml:namespace prefix = o ns = \"urn:schemas-microsoft-com:office:office\" /" ,怎么消掉后面那些?
追答
不知道用soup.table.td.p.span.text 可不可以?
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询