如何将pandas.dataframe的数据写入到文件中
步骤操作方法如下:
1、环境准备:
a、右击桌面上选择【Open in Terminal】 打开终端。
b、在弹出的终端中输入【ipython】进入Python的解释器中,如图1所示。
2、导入所需要的包:
导入实验常用的python包。如图2所示。
【import pandas as pd】pandas用来做数据处理。
【import numpy as np】numpy用来做高维度矩阵运算.
【import matplotlib.pyplot as plt】matplotlib用来做数据可视化。
3、pandas数据写入到csv文件中:
【names = [‘Bob’,’Jessica’,’Mary’,’John’,’Mel’]】创建一个names列表
【 births = [968,155,77,578,973]】创建一个births 列表
【DataSet = list(zip(names,births))】用 zip 函数将这两个列表合并在一起
【DataSet】查看生成的数据
【df = pd.DataFrame(data = DataSet ,columns=[‘Names’,’Births’])】用生成的数据生成一个DataFrame对象
【df】查看生成的dataFrame
将创建的数据写入到/opt/births1880.csv文件中,
【df.to_csv(‘/opt/births1880.csv’, index=False, header=False )】将df写入到文件中
【ls /opt/births1880.csv】查看文件是否存在
【cat /opt/births1880.csv】查看文件内容
4、pandas读取csv中的数据
读取步骤3生成的数据,如图5所示。
【local_data = r’/opt/births1880.csv’】将文件路径赋到变量local_data中
【df2 = pd.read_csv(local_data,header=None)】读取内容赋值到df2
【df2】查看df2的值
【 df3 = pd.read_csv(local_data,header=None,names=[‘names’,’births’])】指定列名字赋值到df3
【df3】查看df3的值
Pandas是Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作,DataFrame是一张多维的表,大家可以把它想象成一张Excel表单或者Sql表。之前这篇文章已经介绍了从各种数据源将原始数据载入到dataframe中,这篇文件介绍怎么将处理好的dataframe中的数据写入到文件和数据库中。
参考资料
博客园.博客园[引用时间2018-1-2]
先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值
为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列
我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数
这又是一个字典创建DataFrame的例子
假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:
可以使用dtypes来查看各行的数据格式
接着看一下如何查看数据框中的数据,看一下所有的数据
使用head查看前几行数据(默认是前5行),不过你可以指定前几行
查看前三行数据
使用tail查看后5行数据
查看数据框的索引
查看列名用columns
查看数据值,用values
查看描述性统计,用describe
使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据
使用T来转置数据,也就是行列转换
对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。