python3 用BeautifulSoup 爬取指定ul下的a标签
遇到一个问题,在用python爬取网站中a标签href的时候。用find_all会将整个网站中的a标签都取到,a标签没有唯一标识,但是他的ul有唯一的class,请问我要...
遇到一个问题,在用python爬取网站中a标签href的时候。用find_all会将整个网站中的a标签都取到,a标签没有唯一标识,但是他的ul有唯一的class,请问我要怎么取出ul中的a标签里的href?
展开
3个回答
2019-04-04
展开全部
这种明细就用select来的方便啊
soup.select('a ul.class')
soup.select('a ul.class')
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc)
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc)
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询