python对多个csv文件里提取指定列汇总到一个新生成的csv文件

python对多个csv文件（位于不同目录）提取指定列（例如第二列）的内容，然后把他们放在新生成的一个csv文件里，分别放在不同的列。另外从来没有用过python，只用过... python对多个csv 文件（位于不同目录）提取指定列（例如第二列）的内容，然后把他们放在新生成的一个csv文件里，分别放在不同的列。
另外从来没有用过python，只用过vc++,是不是一样要下载一个软件安装呢？求hello world的例子。展开

 我来答

3个回答

#合辑# 机票是越早买越便宜吗？

tim_spac
2015-08-20 · TA获得超过3628个赞

知道大有可为答主

回答量：1804

采纳率：100%

帮助的人：1998万

我也去答题访问个人页

关注

展开全部

#!/usr/bin/env python
# coding: utf-8

import os
import re


def parserln(ln, patt):
    """用给定的正则表达式解析行"""
    matched = patt.match(ln)
    if matched:
        return matched.groupdict()


def getdata(filename, parser, callback=None):
    """用指定的解析方法parser解析指定文件,
        用callback进行数据加工过的数据列表
    """
    with open(filename, 'rt') as handle:
        return map(
            callback,
            filter(None, map(parser, handle))
            )


def storage(filename, dataserial, spliter=','):
    """将数据序列按行存储到指定文件,
        每一序列元素间用指定的字符分割"""
    with open(filename, 'wt') as handle:
        handle.writelines([
            "%s\n" % (spliter.join(map(str, item)))
            for item in dataserial
        ])


if __name__ == "__main__":
    patt = re.compile(
        r"""^
        (?P<month>\d+),
        (?P<amount>\d+),
        (?P<usage>\d+)
        \s*$""",
        re.I | re.U | re.X)
    datapath = 'datasource'
    # datasource下所有存在"usage.csv"文件的子目录
    subpaths = [
        os.path.join(datapath, path)
        for path in os.listdir(datapath)
        if (os.path.isdir(os.path.join(datapath, path))
            and os.path.exists(
                os.path.join(datapath, path, "usage.txt"))
            )
        ]
    storage(
        'store.csv',
        zip(*map(
            lambda path: getdata(
                os.path.join(path, "usage.csv"),
                # 解析方法为用patt解析行
                parser=lambda ln: parserln(ln, patt),
                # 数据加工方法是取出"amount"转成整数
                callback=lambda x: int(x["amount"]),
            ),
            subpaths))
        )

$ tail -n 12 datasource/*/*.csv
==> datasource/2014/usage.csv <==
1,4234,423
2,3523,432
3,4352,438
4,4792,458
5,4823,834
6,5093,734
7,4743,832
8,5152,859
9,4932,810
10,4993,802
11,4999,810
12,5052,850

==> datasource/2015/usage.csv <==
1,5234,423
2,4523,432
3,5352,438
4,5792,458
5,6823,834
6,6093,734
7,6743,832
8,7152,859
9,6932,810
10,6993,802
11,6999,810
12,7052,850
(venv)tim@crunchbang:~/workspace/baidu$

$ cat store.csv
4234,5234
3523,4523
4352,5352
4792,5792
4823,6823
5093,6093
4743,6743
5152,7152
4932,6932
4993,6993
4999,6999
5052,7052
$

已赞过 已踩过<

评论收起

百度网友87b2a52
推荐于2016-04-23 · 知道合伙人软件行家

百度网友87b2a52
知道合伙人软件行家

采纳数：523 获赞数：3490

毕业于南京大学，硕士学位。10年软件研发经验。现任信息系统架构师。

向TA提问私信TA

关注

展开全部

1.首先下载python 2.7，进行安装
2.教你一个简单的csv操作的例子
如下面为一csv文件：
Title,Release Date,Director
And Now For Something Completely Different,1971,Ian MacNaughton
Monty Python And The Holy Grail,1975,Terry Gilliam and Terry Jones
Monty Python's Life Of Brian,1979,Terry Jones
Monty Python Live At The Hollywood Bowl,1982,Terry Hughes
Monty Python's The Meaning Of Life,1983,Terry Jones
打印发行日期及标题。
逐行处理：
for line in open("samples/sample.csv"):
    title, year, director = line.split(",")    //以“,”号为分割，按逗号将数据分成三部分；
    print year, title
使用csv模块处理：
import csv
reader = csv.reader(open("samples\sample.csv"))
for title, year, director in reader:
    print year, title
改变分隔符


本回答被提问者采纳






已赞过已踩过<

你对这个回答的评价是？
评论收起

大漠凤萧萧
2015-09-01 · TA获得超过174个赞

知道小有建树答主

回答量：359

采纳率：91%

帮助的人：58.7万

我也去答题访问个人页

关注

展开全部

csv 是可以直接当文本直接读的,他的格式是一行由若干列逗号隔开的
和文本文件一样的读到csv后,用逗号分隔列,然后将您需要的那一列写到新的文件里就可以了
只提供思路,我就不写代码了,可能会用有 open split readline

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python对多个csv文件里提取指定列汇总到一个新生成的csv文件

其他类似问题

为你推荐：