您好!
欢迎来到京东云开发者社区
登录
首页
博文
课程
大赛
工具
用户中心
开源
首页
博文
课程
大赛
工具
开源
更多
用户中心
开发者社区
>
博文
>
配运基础数据缓存瘦身实践
分享
打开微信扫码分享
点击前往QQ分享
点击前往微博分享
点击复制链接
配运基础数据缓存瘦身实践
自猿其说Tech
2021-05-17
IP归属:未知
7845240浏览
计算机编程
## 一、背景: 在现代物流的实际作业流程中,会有大量关系到运营相关信息的数据产生,如商家,车队,站点,分拣中心,客户等等相关的信息数据,这些数据直接支撑齐了物流的整个业务流转,具有十分重要的地位,那么对于这一类数据我们需要提供基本的增删改查存的能力,目前京东物流的基础数据是由中台配运组来整体负责。 在基础数据的常规能力当中,数据的存取是最基础也是最重要的能力,为了整体提高数据的读取能力,缓存技术在基础数据的场景中得到了广泛的使用,下面会重点展示一下配运组近期针对数据缓存做的瘦身实践。 ## 二、方案: 这次优化我们挑选了商家基础资料和C后台2个系统进行了缓存数据的优化试点,从结果看取得了非常显著的成果,节省了大量的硬件资源成本,下面的数据是优化前后的缓存使用情况对比: **商家基础资料Redis数据量由45G降为8G;** **C后台Redis数据量由132G降为7G;** 从结果看这个优化的力度太大了,相信大家对如何实现的更加好奇了,那接下来就让我们一步步来看是如何做到的吧! 首先目前的商家基础资料使用@Caceh注解组件作为缓存方式,它会将从db中查出的值放入本地缓存及jimdb中,由于该组件早期的版本没有jimdb的默认过期时间且使用注解时也未显式声明,造成早期大量的key没有过期时间,从而形成了大量的僵尸key。 所以如果我们可以找到这些僵尸key并进行优化,那么就可以将缓存进行一个整体的瘦身,那首先要怎么找出这些key呢? #### 2.1 keys命令 可能很多同学会想到简单粗暴的keys命令,遍历出所有的key依次判断是否有过期时间,但Redis是单线程执行,keys命令会以阻塞的方式执行,遍历方式实现的复杂度是O(n),库中的key越多,阻塞的时间会越长,通常我们的数据量都会在几十G以上,显然这种方式是无法接受的。 #### 2.2 scan命令 redis在2.8版本提供了scan命令,相较于keys命令的优势: - scan命令的时间复杂度虽然也是O(N),但它是分次进行的,不会阻塞线程。 - scan命令提供了类似sql中limit参数,可以控制每次返回结果的最大条数。 当然也有缺点: - 返回的数据有可能会重复,至于原因可以看文章最后的扩展部分。 - scan命令只保证在命令开始执行前所有存在的key都会被遍历,在执行期间新增或删除的数据,是不确定的即可能返回,也可能不返回。 #### 2.3基本语法 目前看来这是个不错的选择,让我们来看下命令的基本语法: SCAN cursor [MATCH pattern] [COUNT count] - cursor:游标 - pattern:匹配的模式 - count:指定从数据集里返回多少元素,默认值为10 #### 2.4 实践 首先感觉上就是根据游标进行增量式迭代,让我们实际操作下: ![](//img1.jcloudcs.com/developer.jdcloud.com/bf1b1334-0369-4e4e-9d57-3f169a88b39820210517112613.png) 看来我们只需要设置好匹配的key的前缀,循环遍历删除key即可。 可以通过Controller或者调用jsf接口来触发,使用云redis-API,demo如下: ![](//img1.jcloudcs.com/developer.jdcloud.com/c121b20f-96a6-4da7-9072-d06f551dfbdb20210517112637.png) 好的,大功告成.在管理端执行randomkey命令查看.发现依然存在大量的无用key,貌似还有不少漏网之鱼,这里又是怎么回事呢? 下面又到了喜闻乐见的踩坑环节。 #### 2.5 避坑指南 通过增加日发现,返回的结果集为空,但游标并未结束! 其实不难发现scan命令跟我们在数据库中按条件分页查询是有别的,mysql是根据条件查询出数据,scan命令是按字典槽数依次遍历,从结果中再匹配出符合条件的数据返回给客户端,那么很有可能在多次的迭代扫描时没有符合条件的数据。 我们修改代码使用scanResult.isFinished()方法判断是否已经迭代完成。 ![](//img1.jcloudcs.com/developer.jdcloud.com/6974935c-1213-4dec-bff8-571abf7efc4c20210517112733.png) 至此程序运行正常,之后通过传入不同的匹配字符,达到清楚缓存的目的。 ## 三、课后扩展 这里我们探讨重复数据的问题:为什么遍历出的数据可能会重复? #### 3.1 重复的数据 首先我们看下scan命令的遍历顺序: ![](//img1.jcloudcs.com/developer.jdcloud.com/7305dc5e-2018-4dd1-b120-be8c562b2f2620210517112814.png) Redis中有3个key,我们用scan命令查看发现遍历顺为0->2->1->3,是不是感到奇怪,为什么不是按0->1->2->3的顺序? 我们都知道HashMap中由于存在hash冲突,当负载因子超过某个阈值时,出于对链表性能的考虑会进行Resize操作.Redis也一样,底层的字典表会有动态变换,这种扫描顺序也是为了应对这些复杂的场景。 **3.1.1 字典表的几种状态及使用顺序扫描会出现的问题** - 字典表没有扩容 字段tablesize保持不变,顺序扫描没有问题 - 字典表已扩容完成 ![](//img1.jcloudcs.com/developer.jdcloud.com/b024366e-3cdc-4bb4-8873-c01efe2f8fa220210517112917.png) 假设字典tablesize从8变为16,之前已经访问过3号桶,现在0~3号桶的数据已经rehash到8~11号桶,若果按顺序继续访问4~15号桶,那么这些元素就重复遍历了。 - 字典表已缩容完成 ![](//img1.jcloudcs.com/developer.jdcloud.com/c24b4283-0709-458d-bd00-4e3e5afd326620210517112952.png) 假设字典tablesize从16缩小到8,同样已经访问过3号桶,这时8~11号桶的元素被rehash到0号桶,若按顺序访问,则遍历会停止在7号桶,则这些数据就遗漏掉了。 - 字典表正在Rehashing Rehashing的状态则会出现以上两种问题即要么重复扫描,要么遗漏数据。 **3.1.2 反向二进制迭代器算法思想** 我们将Redis扫描的游标与顺序扫描的游标转换成二进制作对比: ![](//img1.jcloudcs.com/developer.jdcloud.com/4114edf7-dbb6-4653-8109-ae97f5320adb20210517113030.png) 高位顺序访问是按照字典sizemask(掩码),在有效位上高位加1。 举个例子,我们看下Scan的扫描方式: 1.字典tablesize为8,游标从0开始扫描; 2.返回客户端的游标为6后,字典tablesize扩容到之前的2倍,并且完成Rehash; 3.客户端发送命令scan 6; ![](//img1.jcloudcs.com/developer.jdcloud.com/2853d6d1-2d40-4c93-968b-93c2acf6718820210517113133.png) 这时scan命令会将6号桶中链表全部取出返回客户端,并且将当前游标的二进制高位加一计算出下次迭代的起始游标.通过上图我们可以发现扩容后8,12,10号槽位的数据是从之前0,4,2号槽位迁移过去的,这些槽位的数据已经遍历过,所以这种遍历顺序就避免了重复扫描。 字典扩容的情况类似,但重复数据的出现正是在这种情况下: 还以上图为例,再看下缩容时Scan的扫描方式: 1.字典tablesize的初始大小为16,游标从0开始扫描; 2.返回客户端的游标为14后,字典tablesize缩容到之前的1/2,并完成Rehash; 3.客户端发送命令scan 14; 这时字典表已完成缩容,之前6和14号桶的数据已经Rehash到新表的6号桶中,那14号桶都没有了,要怎么处理呢?我们继续在源码中找答案: ![](//img1.jcloudcs.com/developer.jdcloud.com/825efeea-0d77-4e9a-b6ec-9754c3e0942b20210517113236.png) 即在找目标桶时总是用当前hashtaba的sizemask(掩码)来计算,v=14即二进制000 1110,当前字典表的掩码从15变成了7即二进制0000 0111,v&m0的值为6,也就是说在新表上还要扫一遍6号桶.但是缩容后旧表6和14号桶的数据都已迁移到了新表的6号桶中,所以这时扫描的结果就出现了重复数据,重复的部分为上次未缩容前已扫描过的6号桶的数据。 **结论: 当字典缩容时,高位桶中的数据会合并进低位桶中(6,14)->6,scan命令要保证不遗漏数据,所以要得到缩容前14号桶中的数据,要重新扫描6号桶,所以出现了重复数据.Redis也挺难的,毕竟鱼和熊掌不可兼得。** ## 总结 通过本次Redis瘦身实践,虽然是个很小的工具,但确实带来的显著的效果,节约资源降低成本,并且在排查问题中又学习到了命令底层巧妙的设计思想,收货颇丰,最后欢迎感兴趣的小伙伴一起交流进步。 ------------ ###### 自猿其说Tech-JDL京东物流技术发展部 ###### 作者:中台技术部-配运平台组 张仲良 ------------
原创文章,需联系作者,授权转载
上一篇:CodeReview数字化管理工程实践
下一篇:JDL-GateWay物流网络SDK的设计与使用
相关文章
Taro小程序跨端开发入门实战
Flutter For Web实践
配运基础数据缓存瘦身实践
自猿其说Tech
文章数
426
阅读量
2149963
作者其他文章
01
深入JDK中的Optional
本文将从Optional所解决的问题开始,逐层解剖,由浅入深,文中会出现Optioanl方法之间的对比,实践,误用情况分析,优缺点等。与大家一起,对这项Java8中的新特性,进行理解和深入。
01
Taro小程序跨端开发入门实战
为了让小程序开发更简单,更高效,我们采用 Taro 作为首选框架,我们将使用 Taro 的实践经验整理了出来,主要内容围绕着什么是 Taro,为什么用 Taro,以及 Taro 如何使用(正确使用的姿势),还有 Taro 背后的一些设计思想来进行展开,让大家能够对 Taro 有个完整的认识。
01
Flutter For Web实践
Flutter For Web 已经发布一年多时间,它的发布意味着我们可以真正地使用一套代码、一套资源部署整个大前端系统(包括:iOS、Android、Web)。渠道研发组经过一段时间的探索,使用Flutter For Web技术开发了移动端可视化编程平台—Flutter乐高,在这里希望和大家分享下使用Flutter For Web实践过程和踩坑实践
01
配运基础数据缓存瘦身实践
在基础数据的常规能力当中,数据的存取是最基础也是最重要的能力,为了整体提高数据的读取能力,缓存技术在基础数据的场景中得到了广泛的使用,下面会重点展示一下配运组近期针对数据缓存做的瘦身实践。
自猿其说Tech
文章数
426
阅读量
2149963
作者其他文章
01
深入JDK中的Optional
01
Taro小程序跨端开发入门实战
01
Flutter For Web实践
添加企业微信
获取1V1专业服务
扫码关注
京东云开发者公众号