c#编程中关于大数据量的问题

问题:现在我有很多的字符串大概有500万个需要处理,用什么样的数据类型在时空上比较合适?具体的问题描述:有一大堆的字符串在一个txt中都是这样的格式21001221110... 问题:现在我有很多的字符串大概有500万个需要处理,用什么样的数据类型在时空上比较合适?

具体的问题描述:有一大堆的字符串在一个txt中都是这样的格式21001221110011(每个串只有2,1,0这三种数字且都是14位)这样的数字串大概有200万个以上,现在要统计这些串中重复的数字串及其重复的次数,应该如何编程?(在时间和空间上尽量可行)
最好能给出代码?只求时间和空间上可行就行
展开
 我来答
是六千啦89
2010-01-26 · TA获得超过125个赞
知道小有建树答主
回答量:185
采纳率:0%
帮助的人:99.6万
展开全部
1、逐行读取(这样内存消耗较小)
2、将读取的结果存入Dictionary<key,value>类型中。
3、存入Dictionary<key,value>前先判断是否存在。

string value = "21001221110011";
if (openWith.TryGetValue("21001221110011", out value))
{
//存在的处理
}
else
{
//不存在的处理
}

字典的效率比较高,查询时间是O(1)。
碧茂科技
2023-10-18 广告
资源配额不足:任务堆积可能是因为YARN集群的资源配额不足,无法满足任务的资源需求。可以尝试增加集群的资源配额,或者调整集群中各个队列的资源配额,以提高资源利用率。队列优先级设置不当:任务堆积可能是因为队列优先级设置不当,导致高优先级的任务... 点击进入详情页
本回答由碧茂科技提供
百度网友b1283323c
2010-01-25 · TA获得超过3010个赞
知道小有建树答主
回答量:715
采纳率:100%
帮助的人:827万
展开全部
首先看你想用哪种形式了;

1、可以用单线程;
2、可以用多线程;
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式