通过Redis消息队列实现大文件处理

 我来答

1个回答

#热议# 应届生在签三方时要注意什么？

抛下思念17
2022-07-16 · TA获得超过1.1万个赞

知道大有可为答主

回答量：6185

采纳率：99%

帮助的人：33.8万

我也去答题访问个人页

关注

展开全部

一、故事背景
1、读取离线文件数据，再通过【离线数据】作为条件，查询第三方接口，返回最终的结果，再入库。
2、业务逻辑是很简单， 读取文件、查询接口、返回数据集、入库四步。
3、业务特性：第三方接口调用400毫秒(ms) 。
如果用普通单线程去跑算500毫秒一个请求，一天也就跑8W多数据量，20多亿的数据不知道跑到猴年马月了。

二、处理方案
A) 初步方案采用ganymed-ssh2(文件都存储在Linux服务器上) 来读文件，Redis来存储消息、多线程来提升处理能力。
B) 流程图：

三、呈现问题

四、优化问题

最终流程图：

1、 通过Redis做一个计数器 每读取一行记录数值，即使服务终止后，先从Redis读取这个数值
再通过cat指定行数开始读数据即可。

2、 通过取模拆Key 分片到不同小Key存储 ，降低单个节点存储压力，也充分利用了存储资源。

3、Redis Push 提供了批量方式(leftPushAll) ，可以指定读取行数再批量入库，而pop并没有提供批量只能一个一个pop。

4、消费者通过多线程pop、再分发到线程去处理。

五、总结问题

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

通过Redis消息队列实现大文件处理

其他类似问题

为你推荐：