解决Redis持久化之大数据服务暂停问题

  Redis持久化是有两种方式:RDB和AOF

  对这两种方式的官方文档的翻译请看:

  http://latteye.com/2011/11/redis-persistence.html

  RDB就是快照存储,比如“每1个小时对redis进行快照存储”。那么,

  save这个参数就应该设置save 3600 1000 //前一次快照3600秒后,当有超过1000个key被改动的时候就进行一次快照更新RDB快照产生dump.rdb文件,当每到快照时间,更新文件。

  AOF是存储所有的写操作,分两个步骤:fsync和rewritefsync是把内存中的写操作写入aof文件中rewrite是将写操作合并,比如set aa 1; set aa 2; 两个操作应该写成一个操作set aa 2;

  如果数据量小的话,啥问题也没有

  现在假设服务器是20G内存,而且服务器上仅仅只有跑redis一个占内存的进程,就是说redis最多可以跑20G物理内存现在压入13G的redis数据(可以使用phpredis循环压入,但是要注意设置php的运行内存大小,最好使用pipeline的方式,否则php出现内存不足的error)

  尝试1,我们只使用RDB的方式当进行快照的时候(测试时候可以把快照间隔时间定成30秒或更短)top查看进程

  26376 test 16 0 13.5g 13g 7488 D 0.0 42.8 6:48.24 redis-server

  32459 test 18 0 13.5g 13g 7200 D 1.3 42.8 0:23.22 redis-server

  看到有两个进程,同时在运行,并且占用同样大小的内存数,和起来竟然占用26G之大~!

  现在redis服务端上两个进程都运行,看看客户端:测试redis-cli set操作:

  redis 10.1.0.108:6379> set test2 22

  耗时(40.47s)近1分钟

  就是说在大数据量的时候,做RDB,redis服务会暂停近1分钟!这个就是redis持久化的时候的服务暂停现象。

  好吧,为了保证数据容错性,我们的快照一般是要频繁快照的,所以暂停一分钟是不可容忍的。

  现在尝试使用AOF+RDB

  1 将RDB的快照时间设置为1天(由于加上了AOF,所以这个时间是合理的)。

  2 1次性压入1000w左右的string数据到redis中(大概有5G数据量)

  3 查看性能表现:

  第一个步骤fsync:

  redis会从内存中逐渐生成appendonly.aof 在这个过程我试了下set和get操作都是没有暂停现象的(很好~!)

  好了,现在appendonly.aof生成了,有5.7个G

  -rw-r–r– 1 root root 4186238374 Mar 6 15:50 appendonly.aof

  第二个步骤:调用BGREWRITEAOF重写aof文件

  这个时候top查看:

  看到也是两个redis-server服务开着。说明rewrite的时候是fork一个子进程在rewrite的,主进程是进行着redis服务的。

  这个时候redis-cli调用检查

  get操作:无延时

  set操作:出现了延迟现象 !!

  这个说明AOF在重写的时候会占用服务器的大量CPU和内存资源,导致服务出现短暂暂停现象!但是为什么get操作没有出现延迟现象呢?参考官网文章,看到一个配置项:no-appendfsync-on-rewrite

  这个配置项是设置在rewrite的时候是否对新的写操作进行fsync。no表示进行fsync,yes表示不进行

  默认是设置为no

  现在将这个配置项设置为yes(我们对于rewrite的aof文件硬盘大小没有很大要求)

  重新进行测试:

  对同样的5.7G的AOF操作进行一次BGREWRITEAOF。

  get操作:无延迟

  set操作:无延迟

  很好!说明在rewrite的时候如果不进行fsync操作,主进程和子进程是互不干扰的。

  那么如果rewrite的时候对新的写操作不进行fsync,那么新的aof文件里面是否会丢失这个写操作呢?

  答案是不会的,redis会将新的写操作放在内存中,等待rewrite操作完成的时候,将新操作直接挂在aof中。

  好了,至此,这个问题应该已经可以过去了。

  推荐几个文章:

  对数据持久化的一些想法:http://www.yiihsia.com/2011/04/%E5%AF%B9redis%E6%95%B0%E6%8D%AE%E6%8C%81%E4%B9%85%E5%8C%96%E7%9A%84%E4%B8%80%E4%BA%9B%E6%83%B3%E6%B3%95/

  (这个文章提供了一个非常好的方法,当数据量大,内存足够的情况,一台机子上尽量多开几个redis,甚至可以考虑有几个cpu就开几个redis,这样,每个redis的内存量不会太大,就不会有大数据量服务暂停问题,这个也是考虑到了redis是单线程的,能尽量利用CPU)

  redis的内存陷阱:http://www.iteye.com/topic/808293

  (这个文章很好解释了问什么大数据量的时候会出现服务暂停)

  Copy on write does not seem to work.: http://code.google.com/p/redis/issues/detail?id=150

  出处:http://www.cnblogs.com/yjf512/

  本文版权归yjf512和cnBlog共有,欢迎转载,但未经作者同意必须保留此段声明

【编辑推荐】

  1. 当大数据遇到敏捷,会发生什么
  2. SQL Server引入Hadoop大数据处理能力
  3. 大数据来临 如何为数据安全保驾护航?
  4. 大数据下的数据分析平台架构
  5. 大数据时代已来临,你准备好了吗?

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/229459.html<

(0)
运维的头像运维
上一篇2025-04-18 18:53
下一篇 2025-04-18 18:55

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注