为什么都说爬虫PYTHON好?

首先我本人是个JAVA开发者,开发正常网页,没研究过爬虫个人理解爬虫就是把HTML文件爬下来然后在HTML文件内找到有用的数据保存到自己的数据库或文件里这套操作JAVAC... 首先我本人是个JAVA 开发者,开发正常网页 ,没研究过爬虫

个人理解 爬虫就是把 HTML文件爬下来 然后在HTML文件内 找到有用的数据 保存到自己的数据库或文件里

这套操作 JAVA C# 似乎都可以轻松做到 ,为什么都说爬虫PYTHON好,优势在哪里,求大佬解惑
展开
 我来答
hy1397471
2020-07-14 · 知道合伙人软件行家
hy1397471
知道合伙人软件行家
采纳数:4714 获赞数:17152
15年数据库维护及数据库应用系统开发经验,从事零售业、服务业及财务管理类系统开发与维护。

向TA提问 私信TA
展开全部
JAVA C#一样可以做,只是Python有很多爬虫框架,相对的学习成本,开发效率都要高很多。
“HTML文件爬下来 然后在HTML文件内”算入门级的知识点,实际应用中要复杂的多。反爬虫一项就有非常多的内容。
你有做个网页开发,应该知道,现在的网页,大多是动态的,直接请求到的页面并非最终显示的页面。期间有大量的接口请求,然后通过返回的数据,本地渲染最终页面。这类爬虫就需要跟踪目标网页的请求过程,分析接口。
再者,爬取数据也只是爬虫工作的一部分,还有数据清洗,数据转存,爬虫的云端部署,等等等。
天天新解读
2020-07-14 · TA获得超过182个赞
知道小有建树答主
回答量:311
采纳率:58%
帮助的人:64万
展开全部

python上手容易,第三方库多(go现在第三方库也多)。

如果不考虑采集速度,不用登陆——requests,单线程,简单的代码如下:

url = "http://dd.com"

html = requests.get(url)

html.encoding=('GBK') #避免编码问题 如有报错,另外测试

print (html.text[:1000]) #输出1000个字符,避免ide假死。

本人没学过java  c#,不清楚他们两个一个简单爬虫的代码量,想来最起码比python的要多。

不过说实话python的工作机会没有 java c#的多,也就是说别想着花钱去培训班培训了几个月,就能找到月入过万的工作。

python的运行效率比其他编程语言要差,不考虑效率的情况下,可以用python写写小代码,有钱的可以写scrapy代码,堆服务器做分布式爬虫。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
末惜悠地逆哒0K
2020-07-14
知道答主
回答量:74
采纳率:0%
帮助的人:4.8万
展开全部
者,开发正常网页 ,没研究过爬虫 个人理解
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式