为什么都说爬虫PYTHON好？

首先我本人是个JAVA开发者，开发正常网页，没研究过爬虫个人理解爬虫就是把HTML文件爬下来然后在HTML文件内找到有用的数据保存到自己的数据库或文件里这套操作JAVAC... 首先我本人是个JAVA 开发者，开发正常网页，没研究过爬虫

个人理解爬虫就是把 HTML文件爬下来然后在HTML文件内找到有用的数据保存到自己的数据库或文件里

这套操作 JAVA C# 似乎都可以轻松做到，为什么都说爬虫PYTHON好，优势在哪里，求大佬解惑展开

 我来答

3个回答

#热议# 什么是淋病？哪些行为会感染淋病？

hy1397471
2020-07-14 · 知道合伙人软件行家

hy1397471
知道合伙人软件行家

采纳数：4714 获赞数：17152

15年数据库维护及数据库应用系统开发经验，从事零售业、服务业及财务管理类系统开发与维护。

向TA提问私信TA

关注

展开全部

JAVA C#一样可以做，只是Python有很多爬虫框架，相对的学习成本，开发效率都要高很多。
“HTML文件爬下来然后在HTML文件内”算入门级的知识点，实际应用中要复杂的多。反爬虫一项就有非常多的内容。
你有做个网页开发，应该知道，现在的网页，大多是动态的，直接请求到的页面并非最终显示的页面。期间有大量的接口请求，然后通过返回的数据，本地渲染最终页面。这类爬虫就需要跟踪目标网页的请求过程，分析接口。
再者，爬取数据也只是爬虫工作的一部分，还有数据清洗，数据转存，爬虫的云端部署，等等等。

本回答由提问者推荐

已赞过 已踩过<

评论收起

天天新解读
2020-07-14 · TA获得超过182个赞

知道小有建树答主

回答量：311

采纳率：58%

帮助的人：64万

我也去答题访问个人页

关注

展开全部

python上手容易，第三方库多（go现在第三方库也多）。

如果不考虑采集速度，不用登陆——requests，单线程，简单的代码如下：

url = "http://dd.com"
html = requests.get(url)
html.encoding=('GBK') #避免编码问题如有报错，另外测试
print (html.text[:1000]) #输出1000个字符，避免ide假死。

本人没学过java c#，不清楚他们两个一个简单爬虫的代码量，想来最起码比python的要多。

不过说实话python的工作机会没有 java c#的多，也就是说别想着花钱去培训班培训了几个月，就能找到月入过万的工作。

python的运行效率比其他编程语言要差，不考虑效率的情况下，可以用python写写小代码，有钱的可以写scrapy代码，堆服务器做分布式爬虫。

已赞过 已踩过<

评论收起

末惜悠地逆哒0K
2020-07-14

知道答主

回答量：74

采纳率：0%

帮助的人：4.8万

我也去答题访问个人页

关注

展开全部

者，开发正常网页，没研究过爬虫个人理解

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

为什么都说爬虫PYTHON好？

其他类似问题

为你推荐：