pandas与matplotlib综合案例

 我来答
四季教育17
2022-07-26 · TA获得超过5664个赞
知道大有可为答主
回答量:5408
采纳率:99%
帮助的人:265万
展开全部

需求:分析Xiaoqu_NJ.csv文件,分析南京各小区分布数量、及小区建成情况等。

1、打开Xiaoqu_NJ.csv文件,由于爬取的文件没有表头,所以需要自定义表头。

2、城市定位与街道定位去除’小区‘

3、删除多余的列

4、将热度等字段保留数字,其余删除。用到extract()文本提取函数,它与正则表达式配合使用。\d+,其中\d代表数字,+代表批配数字后的数字

5、物业费。保留单价数字,用到
data['物业费'] = data['物业费'].str.extract('(. ?)元. ?')
(.*?)提取元前()内的数据

6、永久删除缺失值

7、增加一列使用年限

8、保存清洗 后的数据

1、导入库

2、读取修改后的数据

3、绘制南京各区小区分布数量图
数组转列表,.tolist()

运行效果:

4、南京小区建成数量与年份的关系图表

运行效果:

运行效果:

5、各区域建成数量与年份关系图

运行效果:

6、南京下辖各区小区均价情况

运行效果

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
光点科技
2023-08-15 广告
通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件... 点击进入详情页
本回答由光点科技提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式