Java如何处理大数据的

 我来答

2个回答

#热议# 网上掀起『练心眼子』风潮，真的能提高情商吗？

以道教育
2018-06-01 · 以道承诺未就业全额退款

以道教育

以道教育作为专业的IT培训教育公司，目前主要进行java大数据、云计算、人工智能、web全栈培训服务,提出“就业是检验真理的唯一标准”的教育理念，以道承诺未就业全额退还学费。

向TA提问

关注

展开全部

文件读取：首先是一个文件上传，数据入库，10-200万条不等，这里主要考虑到一次性读取，JVM分配出来的栈内存不一定会够（个人对内存这一块还是处于一知半解的状态，所以比较谨慎，若诸位大神有好的认知，希望评论留下地址分享一下），是依行读取数据，设定一个批量值，当读取的数据达到一定量之后，执行批量入库操作，清空集合，再接着读取。
//读取文件内容
while((s = br.readLine())!=null){
//判断是否达到单次处理量
if(num%leadingNum==0&&num!=0){
int a = stencDao.insertBatch(listBean);
if(a!=leadingNum){
flag = false;
}
//清空集合
listBean.clear();
}
String value = s.trim();
//将读取到的内容放入集合中
if(!value.equals("")){
StencilCustomer bean = new StencilCustomer();
bean.setCustomerPhone(value);
bean.setLinkStencilId(id);
listBean.add(bean);
num ++;
}
}
数据处理：这里的思路也是将数据小化然后处理，这里使用了多线程，设定单个线程处理量，然后开启多个线程处理，这里需要考虑你的服务器的承载能力，如果线程开得太多了，处理不过来，会出现蹦死的情况。例如200万数据，我开了20个线程，单个线程处理600条。
//建立一个线程池 ThreadPoolExecutor threadPool = new ThreadPoolExecutor(
minTaskNumber, maxTaskNumber, 3L, TimeUnit.SECONDS,
new ArrayBlockingQueue<Runnable>(minTaskNumber),
new ThreadPoolExecutor.DiscardOldestPolicy());
//当正在执行的线程数达到最大执行线程数的时候等待
boolean flag = true;
while(flag){
Thread.sleep(1000);//休眠2ms查询一次
int c = threadPool.getActiveCount();//线程池中活动中的线程数量
if(c<maxTaskNumber){
flag = false;
}
}
上面的代码是我对线程池的一个控制，控制服务器一直最大线程执行，Thread.sleep(1000);用while的时候，这个休眠最好不要去掉，去掉之后很影响执行效率

已赞过 已踩过<

评论收起

百度网友b082f96
2018-05-31 · 超过14用户采纳过TA的回答

知道答主

回答量：43

采纳率：100%

帮助的人：24.7万

我也去答题访问个人页

关注

展开全部

使用大数据处理框架，比如hadoop,spark等。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

大数据定义_大数据定义_法本信息技术实施

法本信息是国内大数据定义行业专业服务商，为企业提供大数据专业服务及创新性解决方案，拥有成熟的方法论，自主研发产品，经验丰富的团队，帮助客户挖掘自身的核心价值。

www.farben.com.cn广告

大数据的基本概念_法本信息-面向全球的IT综合服务上市企业

www.farben.com.cn

java框架学习顺序学习无门槛，零基础，小白入行绝佳选择

java框架学习顺序从入门到入行，一站式解决您的所有烦恼java框架学习顺序一对一专业答疑辅导，快速解决您的学习问题

class.imooc.com广告

Java如何处理大数据的

您可能关注的内容

其他类似问题

为你推荐：