解决了Redis大key问题,同事们都夸他牛皮

前言

前几天元宵节,小黑准时下班回到家,吃着汤圆,看着电视,好生惬意!

忽然,手机叮咣叮咣响个不停报警,看了下是某个服务调用Redis异常了。

放下饭碗,小黑打开电脑一顿排查,最终定位到是Redis有大key问题。

寻思一时半会儿也解决不了,明天到公司再搞,先继续看电视吧 哈哈哈。

什么是大key

很多朋友肯定在想redis的key能有多大呀?

这里就有个误区了,所谓的大key问题是某个key的value比较大,所以本质上是大value问题。

这样就对上了,key往往是程序可以自行设置的,value往往不受程序控制,因此可能导致value很大。

设想一种场景:

在线音乐app中,某个歌单有很多用户收藏,假如有这样的数据结构:

  • 歌单和用户之间的映射关系采用redis存储
  • redis的key是歌单ID,长度可控且很小
  • redis的value是个list,list包含了用户ID
  • 用户可能很多,就导致list长度不可控

这下明白啥是大key问题了吧!

redis中有常见的几种数据结构,每种结构对大key的定义不同,比如:

  • value是String类型时,size超过10KB
  • value是ZSET、Hash、List、Set等集合类型时,它的成员数量超过1w个

上述的定义并不绝对,主要是根据value的成员数量和字节数来确定,业务可以根据自己的场景也确定标准。

大key有什么影响

我们都知道,redis的一个典型特征就是:核心工作线程是单线程。

单线程中请求任务的处理是串行的,前面完不成,后面处理不了,同时也导致分布式架构中内存数据和CPU的不平衡。

  • 执行大key命令的客户端本身,耗时明显增加,甚至超时
  • 执行大key相关读取或者删除操作时,会严重占用带宽和CPU,影响其他客户端
  • 大key本身的存储带来分布式系统中分片数据不平衡,CPU使用率也不平衡
  • 大key有时候也是热key,读取操作频繁,影响面会很大
  • 执行大key删除时,在低版本redis中可能阻塞线程

这样看来大key的影响还是很明显的,最典型的就是阻塞线程,并发量下降,导致客户端超时,服务端业务成功率下降。

大key是如何产生的

大key的产生往往是业务方设计不合理,没有预见vaule的动态增长问题:

  • 一直往value塞数据,没有删除机制,迟早要爆炸
  • 数据没有合理做分片,将大key变成小key

如何找到大key

增加内存&流量&超时等指标监控

由于大key的value很大,执行读取时可能阻塞线程,这样Redis整体的qps会下降,并且客户端超时会增加,网络带宽会上涨,配置这些报警可以让我们发现大key的存在。

bigkeys命令

使用bigkeys命令以遍历的方式分析Redis实例中的所有Key,并返回整体统计信息与每个数据类型中Top1的大Key

redis-rdb-tools

使用redis-rdb-tools离线分析工具来扫描RDB持久化文件,虽然实时性略差,但是完全离线对性能无影响。

redis-rdb-tools是由Python写的用来分析Redis的rdb快照文件用的工具,它可以把rdb快照文件生成json文件或者生成报表用来分析Redis的使用详情。

集成化可视化工具

基于某些公有云或者公司内部架构的redis一般都会有可视化的页面和分析工具,来帮助我们定位大key,当然页面底层也可能是基于bigkeys或者rdb文件离线分析的结果。

如何解决大key问题

根据大key的实际用途可以分为两种情况:可删除和不可删除。

删除大key

如果发现某些大key并非热key就可以在DB中查询使用,则可以在Redis中删掉:

  • 当Redis版本大于4.0时,可使用UNLINK命令安全地删除大Key,该命令能够以非阻塞的方式,逐步地清理传入的Key。

Redis UNLINK 命令类似与 DEL 命令,表示删除指定的 key,如果指定 key 不存在,命令则忽略。

UNLINK 命令不同与 DEL 命令在于它是异步执行的,因此它不会阻塞。

UNLINK 命令是非阻塞删除,非阻塞删除简言之,就是将删除操作放到另外一个线程去处理。

  • 当Redis版本小于4.0时,避免使用阻塞式命令KEYS,而是建议通过SCAN命令执行增量迭代扫描key,然后判断进行删除。

Redis Scan 命令用于迭代数据库中的数据库键。

SCAN 命令是一个基于游标的迭代器,每次被调用之后, 都会向用户返回一个新的游标, 用户在下次迭代时需要使用这个新游标作为 SCAN 命令的游标参数, 以此来延续之前的迭代过程。

压缩和拆分key

当vaule是string时,比较难拆分,则使用序列化、压缩算法将key的大小控制在合理范围内,但是序列化和反序列化都会带来更多时间上的消耗。

当value是string,压缩之后仍然是大key,则需要进行拆分,一个大key分为不同的部分,记录每个部分的key,使用multiget等操作实现事务读取。

当value是list/set等集合类型时,根据预估的数据规模来进行分片,不同的元素计算后分到不同的片。

小结

Redis的大key问题,无论在面试还是工作中都很常见,好好理解一波,非常值得。

祝各位老铁 深夜无报警,线上无bug!

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/238105.html<

(0)
运维的头像运维
上一篇2025-04-22 19:07
下一篇 2025-04-22 19:09

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注