python抓取数据的问题

想提取“交易品种”用下面代码不能过滤“xml:namespace。。。”这行。要怎么改呢？tables=soup.find('table').findAll('span'... 想提取“交易品种”用下面代码不能过滤“xml:namespace。。。”这行。要怎么改呢？
tables=soup.find('table').findAll('span')
for item in tables
a=item.findAll(text=True)
交易品种<?xml:namespace prefix = o ns = "urn:schemas-microsoftcom:office:office" /><o:p></o:p></TD> 展开

 我来答

2个回答

#热议# 上班途中天气原因受伤算工伤吗？

keven1006
2014-03-15 · TA获得超过684个赞

知道小有建树答主

回答量：820

采纳率：66%

帮助的人：371万

我也去答题访问个人页

关注

展开全部

这个不复杂，没必要搞着这种，真心建议你直接用免费的八爪鱼采集器，采集网站数据就剩下点鼠标即可。

已赞过 已踩过<

评论收起

matlab2000
2014-03-14 · TA获得超过2323个赞

知道大有可为答主

回答量：1678

采纳率：100%

帮助的人：1050万

我也去答题访问个人页

关注

展开全部

1) Beautiful Soup 能用吗？
2) 截图的话，别人没法直接帮你试验的。

更多追问追答

追问

可以用啊,我补充了代码了,是表格的一条,结果是:"交易品种": "xml:namespace prefix = o ns = \"urn:schemas-microsoft-com:office:office\" /" ,怎么消掉后面那些?

追答

不知道用soup.table.td.p.span.text 可不可以？

本回答被提问者和网友采纳

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python抓取数据的问题

其他类似问题

为你推荐：