python3 用BeautifulSoup 爬取指定ul下的a标签

遇到一个问题,在用python爬取网站中a标签href的时候。用find_all会将整个网站中的a标签都取到,a标签没有唯一标识,但是他的ul有唯一的class,请问我要... 遇到一个问题,在用python爬取网站中a标签href的时候。用find_all会将整个网站中的a标签都取到,a标签没有唯一标识,但是他的ul有唯一的class,请问我要怎么取出ul中的a标签里的href? 展开
 我来答
wanghan519
2019-04-04 · TA获得超过7820个赞
知道小有建树答主
回答量:1285
采纳率:60%
帮助的人:540万
展开全部

用select('ul 的 css 路径').find_all(...)

css路径直接用浏览器开发视图,从ul复制就好,当然也可以把前面多余的部分删掉

匿名用户
2019-04-04
展开全部
这种明细就用select来的方便啊
soup.select('a ul.class')
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友d1a298599
2019-04-04 · 超过31用户采纳过TA的回答
知道答主
回答量:387
采纳率:21%
帮助的人:37.2万
展开全部
# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作

from bs4 import BeautifulSoup
import urllib.request
import re

#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc)
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式