使用BeautifulSoup中的get_text()时,如何值获取当前标签的值,而不获取子标签的值??
例如:frombs4importBeautifulSouphtml="""<li><spanclass="hello">Hello</span>World</li>"""...
例如:
from bs4 import BeautifulSoup
html = """
<li>
<span class="hello"> Hello</span>
World
</li>
"""
a = BeautifulSoup(html, "lxml").find('li').get_text()
print(a)
结果是:Hello World
如何只得到World?? 展开
from bs4 import BeautifulSoup
html = """
<li>
<span class="hello"> Hello</span>
World
</li>
"""
a = BeautifulSoup(html, "lxml").find('li').get_text()
print(a)
结果是:Hello World
如何只得到World?? 展开
3个回答
展开全部
推荐使用的是 PyCharm,大部分用的都是这个,还有一部分坚守再sublime text上:
mport urllib
from BeautifulSoup import BeautifulSoup
url = 连接;
allData=
content = urllib.urlopen(url).read()
soup = BeautifulSoup(content)
tags1 = soup.findAll('tr', {class: even right})
tags2 = soup.findAll('tr', {class: odd right})
上面的就是利用写的一些代码,是要取出网页中class 为even right 的所有tr和所有class为odd right的所有tr取出之后就可以打印出他的内容。
mport urllib
from BeautifulSoup import BeautifulSoup
url = 连接;
allData=
content = urllib.urlopen(url).read()
soup = BeautifulSoup(content)
tags1 = soup.findAll('tr', {class: even right})
tags2 = soup.findAll('tr', {class: odd right})
上面的就是利用写的一些代码,是要取出网页中class 为even right 的所有tr和所有class为odd right的所有tr取出之后就可以打印出他的内容。
展开全部
from bs4 import BeautifulSoup
html = """
<li>
<span class="hello"> Hello</span>
World
</li>
"""
a = BeautifulSoup(html, "lxml").find('li').stripped_strings
print(list(a)[1])
html = """
<li>
<span class="hello"> Hello</span>
World
</li>
"""
a = BeautifulSoup(html, "lxml").find('li').stripped_strings
print(list(a)[1])
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
....同样遇到这样的问题,楼主怎么解决的,我是小白
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询