如何入门 Python 爬虫

 我来答
chris_xisaier
2016-11-18 · 知道合伙人软件行家
chris_xisaier
知道合伙人软件行家
采纳数:46 获赞数:110

向TA提问 私信TA
展开全部
第一 你是否有PYTHON 语言基础?
第二 你是否有 HTML 语言基础?
第三 你是会正则表达式?

如果你满足以上三点条件,那么恭喜你 可以开始学习SPIDER了。
首先爬虫的基本原理都是通过获取整个HTML 页面 ,然后通过正则表达式 分析 过滤掉不想要的内容 在把想要的内容 输出 保存。
python 爬虫主要用到的mod
1 re
2 urllib and urllib2 or beautiful soup or ...
第一个正则 第二个前两个是用来提交 HTML request 和获得HTML respones的 后面的OR 跟的都是 封装为了更简单处理标记语言的模块。
i丶Comedian
2016-11-18
知道答主
回答量:1
采纳率:0%
帮助的人:1061
展开全部
看教程找教程,我也刚开始学
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式