beautifulsoup 怎样抓取 select 标签里面的 option 的文本
2个回答
展开全部
1.你要抓取的option等内容,很明显,是标签script内部的内容(content/text)
-》 所以没法用BeautifulSoup当做标签(的属性)去抓取
2.想要当做属性处理
一种办法:
在获得你所说的:
<option value="0000049">[0000049]ANNA</option>
后,再去把(用html标签括起来)组合成html,然后再用BeautifulSoup去当做html处理
-> 就可以获得option这个标签了
-> 就可以获得option的string了
3.当然,对于你这样的情况,相对来说,用(你已经用了的)正则,比用bs,效率更高。
-》 所以没法用BeautifulSoup当做标签(的属性)去抓取
2.想要当做属性处理
一种办法:
在获得你所说的:
<option value="0000049">[0000049]ANNA</option>
后,再去把(用html标签括起来)组合成html,然后再用BeautifulSoup去当做html处理
-> 就可以获得option这个标签了
-> 就可以获得option的string了
3.当然,对于你这样的情况,相对来说,用(你已经用了的)正则,比用bs,效率更高。
展开全部
1.你要抓取的option等内容,很明显,是标签script内部的内容(content/text)
-》 所以没法用BeautifulSoup当做标签(的属性)去抓取
2.想要当做属性处理
一种办法:
在获得你所说的:
<option value="0000049">[0000049]ANNA</option>
后,再去把(用html标签括起来)组合成html,然后再用BeautifulSoup去当做html处理
-> 就可以获得option这个标签了
-> 就可以获得option的string了
3.当然,对于你这样的情况,相对来说,用(你已经用了的)正则,比用bs,效率更高。
4.关于beautifulSoup,可参考:
Python专题教程:BeautifulSoup详解
-》 所以没法用BeautifulSoup当做标签(的属性)去抓取
2.想要当做属性处理
一种办法:
在获得你所说的:
<option value="0000049">[0000049]ANNA</option>
后,再去把(用html标签括起来)组合成html,然后再用BeautifulSoup去当做html处理
-> 就可以获得option这个标签了
-> 就可以获得option的string了
3.当然,对于你这样的情况,相对来说,用(你已经用了的)正则,比用bs,效率更高。
4.关于beautifulSoup,可参考:
Python专题教程:BeautifulSoup详解
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询