linux列统计不同值操作的awk或shell脚本

各位大神，菜鸟问个问题在linux下面，用awk或者shell等脚本如何实现下面的结果？我有一个文件file.txt，大约1-2个G，共M行N列（M,N都大于100，对不... 各位大神，菜鸟问个问题

在linux下面，用awk 或者shell等脚本如何实现下面的结果？

我有一个文件 file.txt ，大约1-2个G，共M行N列（M,N都大于100，对不同的文件M，N的值不同）
如何写一个脚本，统计每一列的列值一共有多少个不同值，把每个不同列值出现次数也统计出来，并对每列的列值按照统计结果进行降序排序

比如：
输入：
1,2,3,4,5,60
1,20,3,4,5,6
10,2,3,4,5,60
1,2,3,4,5,60
1,2,3,4,50,6
1,20,30,4,5,6

脚本输出结果为：

第1列：1,4次，10,1次
第2列：2,3次，20,2次
........
第6列：6,3次，60,3次
后来添加一列数据，结果忘了改。
应该改为这样：
脚本输出结果为：

第1列：1,5次，10,1次
第2列：2,4次，20,2次
........
第6列：6,3次，60,3次展开

 我来答

1个回答

#热议# 在购买新能源车时，要注意哪些？

怪物甄别指南rY
2014-10-16 · TA获得超过1541个赞

知道大有可为答主

回答量：1005

采纳率：0%

帮助的人：947万

我也去答题访问个人页

关注

展开全部

!#/bin/awk -f
BEGIN{
    print "下面是文件对列的统计";
}
{
    for(i=1;i<=NF;i++)
        ++a[i][$i];
}
END{
    for(i=1;i<=NF;i++)
    {
            printf("第%s列",i);
            for(j in a[i]) printf("\t%s,%s次",j,a[i][j]);
            print ""；
        }
        print "输出完毕";
}

将这个文件保存成一个文本文件，我这里举例文件名叫script，你要改成什么都可以

然后在命令行里敲

gawk -F"," -f /path/to/script /path/to/your/txt/file

比如你的test.txt和script文件都放在同一个文件夹/home/ha,那这个命令就是

gawk -F"," -f /home/ha/script /home/ha/test.txt

或者你也可以单敲一行命令

gawk -F"," 'BEGIN{ print "开始输出对列的统计"; } { for(i=1;i<=NF;i++) ++a[i][$i]; } END { for(i=1;i<=NF;i++) { printf("第%s列",i); for(j in a[i]) printf("\t%s,%s次",j,a[i][j]); print ""; } print "输出完毕"; }' test.txt

都是一样的，test.txt是你要统计的文件

这下面你的文件产生的输出

开始输出对列的统计

第1列 1,5次 10,1次

第2列 2,4次 20,2次

第3列 3,5次 30,1次

第4列 4,6次

第5列 5,5次 50,1次

第6列 6,3次 60,3次

输出完毕

awk有很多很多版本，这个脚本用gawk是可以的，其他的awk不一定。

追问

思路我倒是明确，但我用的不是fawk，我这里完全不行啊。貌似普通的awk里面没有arr[i][j]的用法，就是普通的awk里面不支持二维数组。如果不支持二维数组，那该怎么才能实现呢？

追答

对啊，普通awk确实没有二维数组

能不能装个gawk？主流的系统都会有啊，实在不能用的话可以考虑对每列单独进行处理。但是你的文件很大，列数也很多，会非常慢

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

安全高效全能的宝塔Linux面板，一键管理服务器!

一键配置管理服务器:LAMP/LNMP，网站，数据库，FTP，SSL，轻松搞定linux一键解决Apache/nginx/Tomcat服务器管理难题。

www.bt.cn广告

宝塔专注linux一键安装-让服务器运维简单高效;

服务器运维要高效，装宝塔面板。支持一键配置LAMP/LNMP，SSL，WEB，FTP.轻松搞定linux命令行;宝塔面板服务器linux命令行减少运维人力物力成本，让运维简单高效;

www.bt.cn广告

linux列统计不同值操作的awk或shell脚本

您可能关注的内容

其他类似问题

为你推荐：