python抓取数据的问题

想提取“交易品种”用下面代码不能过滤“xml:namespace。。。”这行。要怎么改呢?tables=soup.find('table').findAll('span'... 想提取“交易品种”用下面代码不能过滤“xml:namespace。。。”这行。要怎么改呢?
tables=soup.find('table').findAll('span')
for item in tables
a=item.findAll(text=True)
<P style="MARGIN: 0 0 0; LINE-HEIGHT: 150%; TEXT-ALIGN: left; mso-pagination: widow-orphan"><SPAN style="FONT-SIZE: 12px; COLOR: black; LINE-HEIGHT: 150%; FONT-FAMILY: 宋体; mso-bidi-font-family: 宋体; mso-font-kerning: 0">交易品种<SPAN><?xml:namespace prefix = o ns = "urn:schemas-microsoftcom:office:office" /><o:p></o:p></SPAN></SPAN></P></TD>
展开
 我来答
keven1006
2014-03-15 · TA获得超过684个赞
知道小有建树答主
回答量:820
采纳率:66%
帮助的人:371万
展开全部
这个不复杂,没必要搞着这种,真心建议你直接用免费的八爪鱼采集器,采集网站数据就剩下点鼠标即可。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
matlab2000
2014-03-14 · TA获得超过2323个赞
知道大有可为答主
回答量:1678
采纳率:100%
帮助的人:1050万
展开全部
1) Beautiful Soup 能用吗?
2) 截图的话,别人没法直接帮你试验的。
更多追问追答
追问
可以用啊,我补充了代码了,是表格的一条,结果是:"交易品种": "xml:namespace prefix = o ns = \"urn:schemas-microsoft-com:office:office\" /" ,怎么消掉后面那些?
追答
不知道用soup.table.td.p.span.text 可不可以?
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式