有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中? 80

有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中?1500万行数据分别装在15个文本文件中,将统计出来的数据分别输出到以下文件中... 有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中?
1500万行数据分别装在15个文本文件中,将统计出来的数据分别输出到以下文件中:
出现1次的.txt
出现2次的.txt
出现3次的.txt
出现4次的.txt
出现5次的.txt
出现6次的.txt
...
出现15次的.txt 展开

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

百度网友ee5da2f
2019-07-31

知道答主

回答量：4

采纳率：0%

帮助的人：1789

我也去答题访问个人页

关注

展开全部

这玩意其实不应该用MATLAB做，用任意一种高级语言比如Python做比较好。
有两种方案，都是借助hash做
如果你懂hash map的底层原理可以自己手动实现，数组嵌套，数组的每一个元素是一个链表，数组长度设为2^24，数据存放在数组哪个位置通过hash算法得到，将该数据添加到链表中，一次遍历就可以对数据完成统计，然后相同的数据必定都在同一个链表中，如果链表长度小于10（自己定）就手动判断重复，如果长度过大就再在链表里通过加salt再次统计。
嫌麻烦就借助hash map，map结构为<string，list>，如果数据未在map中出现，就添加进去，并加到list后，以后都可以直接加到list中，这样实际也是借助hash完成了分类，但list中重复率可能高了点（hash长度为16），这里统计完成了，然后是一样的操作。

更多追问追答

追问

语言懂C++,C#,Python也有学过点,但是都是入门水平,这种问题确实不懂怎么写代码.

追答

import random

datas = [random.randint(1,100) for i in range(1000)]
result={}
for data in datas:
if not result.get(data,None):
result[data]=[]
result[data].append(data)
else:
result[data].append(data)

for key in result.keys():
print('%s出现了%d次'%(key,len(result[key])))

# 实际上到这可能还会有重复，只是几率很小很小
# 可以对每个分类通过对数据后面加salt操作，比如加个abc，再使用上面的方法再筛一次
# 但会消耗很多内存
result_1=[]
for key in result.keys():
cdata=result[key]
tmp={}
for data in cdata:
data=str(data)+"abc" # 加salt
if not tmp.get(data, None):
tmp[data] = []
tmp[data].append(data)
else:
tmp[data].append(data)
result_1.append(tmp)

for result in result_1:
for key in result.keys():
print('%s出现了%d次' % (key, len(result[key])))
写到文本的代码就自己写吧，很简单。

已赞过 已踩过<

评论收起

台州市翰能文化传媒

广告2024-12-21

excel表格是一款办公软件套装，可以实现办公软件常用的文字表格，演示等多种功能。内存占用低，运行速度快，体积小巧。

wpp1.hanneng2.top

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

【羽山数据】关于的数据分析-点击进入

公安，司法，工商，银联等体系权威认证授权，通过数据安全技术，获取目标客户风险画像准确有效核查目标客户失信，逾期，欺诈，黑名单等，有效提高企业风控能力。

www.yushanshuju.com广告

AHP 层次分析法软件中文版

层次分析过程软件，支持专家打分、一致性检验和权重计算，多指标决策分析。-专业数据分析、科研绘图代做，助你解读研究成果!

www.statistical-analysis.top广告

excel的快速分析一站式调研平台，AI生成问卷、分析数据

调研神器，每份问卷最低0.5元，多快好省!支持AI快速生成问卷、便捷分析专业数据。可触达全球超300万样本，数十种在线建模分析模型支持。

www.credamo.com广告

有1500万行数据,如何用matlab统计每行数据出现的次数并将该条数据输出到相应的文件中? 80

您可能关注的内容

其他类似问题

为你推荐：