用python读取一个文件夹下的所有CSV文件里某一列数据中最大值,将此最大值所在行截取到新CSV文件中? 50
以下代码可实现你的要求,我有两个csv文件,其中第7列是“实际入库数量”,你只需要修改下面两个代码就可以用了:
1、第15行的7,这是“实际入库数量”的列数
2、第17行的“实际入库数量”,这是列名
这是csv数据的样式,列数是基于0开始的
# coding=gbk
import glob
import pandas as pd
# 初始化,此变量用来装所有csv数据
all_data_frames = []
# 使用glog.glob找到所有csv文件并将所有数据放到all_data_frames中
for file in glob.glob("*.csv"):
all_data_frames.append(pd.read_csv(file,encoding='gbk'))
# 合并数据
data_frame_concat = pd.concat(all_data_frames,axis=0,ignore_index=True)
# 得到指定列里的最大值
最大值 = max(data_frame_concat.iloc[:,7])
# 得到最大值所在行
最大值所在行 = data_frame_concat[data_frame_concat['实际入库数量']==最大值]
# 输出行结果
最大值所在行.to_csv("最终结果.csv",index=False)