Redis Sentinel(哨兵)

/ Redis / 没有评论 / 469浏览

提到哨兵我们第一个印象就是和安全保卫方面相关的。那么在Redis中也是一样的,它也是保卫Redis的运行安全的。Redis在主从复制的模式下,如果主节点发生故障不能提供服务时,那我们可以人工的介入,将其中任何一个从节点晋升为主节点,然后我们还要通知其它子节点更新主节点信息。这样Redis就可以继续提供服务了。但在实际的场景中,如果我们采用人工介入的方式来解决主节点故障等问题是不恰当的,因为只要和人有关的操作就可能会有问题,其二人工进入的方式修复的比较慢。为了解决以上各种问题,于是Redis在2.8版本之后提供了Redis Sentinel(哨兵)功能来解决这种问题。所以这一篇中我们主要介绍Redis Sentinel的详细使用。


在上面我们提到过,当Redis主节点发生故障时,我们可以采用人工介入的主式,选取一个从节点继续提供服务,但这样有很大的不便,无论是对于应用还是运维来说。对于应用方来说,主节点的故障可能导致数据的丢失及读取数据错误,而对于运维来说故障的修复实时性和准确性则无法得到保障。所以当我们遇到上述问题并且Redis在2.8版本之后时,我们就可以使用Redis Sentinel功能,该功能能够自动完成故障发现和故障转移。


Redis Sentinel是一个分布式架构,其中包含若干个Sentinel节点和Redis数据节点。每个Sentinel节点都会对数据节点和其它的Sentinel节点进行监控,当它发现其它节点不可用时,会对该节点进行下线标识。如果被标识的节点是主节点,它会和其它的Sentinel节点进行商量,并且当大多数Sentinel节点都认为主节点不可用时,它们会选举出一个Sentinel节点来完成自动故障转移功能,同时Redis Sentinel会将这个变化实时通知给Redis应用方,且整个过程完全是自动的,无需人工介入。


下面我们看一下Redis主从复制模式和Redis Sentinel架构的区别。

img


下面我们简单介绍一下Redis Sentinel中的几个功能:

对于节点故障的判断是由多个Sentinel节点共同完成的,这样可以有效地防止误判。 下面我们了解一下Redis Sentinel的安装与部署。


1.启动主节点

img img


2.启动两个从节点,因为从节点要配置主节点的信息,所以我们采用配置文件的方式配置,下面为具体的配置:

redis-6380.conf

port:6380
slaveof 127.0.0.1 6379

redis-6381.conf

port:6381 
slaveof 127.0.0.1 6379

3.确认主从关系

站在主节点的角度上看,它有两个从节点:

img

站在从节点的角度上看,它有一个主节点:

img


下面我们看一下Sentinel节点的具体配置:

1.配置Sentinel节点

port 26379
sentinel monitor mymaster 127.0.0.1 6379 2
sentinel down-after-milliseconds mymaster 30000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 180000

1)Sentinel节点的默认端口为26379。 2)Sentinel monitor mymaster 127.0.0.1 6379 2代表sentinel-1节点需要监控127.0.0.1:6379这个主节点,2代表判断主节点失败至少需要2个Sentinel节点的同意,mymaster是主节点的别名,其余的参数以后在做详细说明。


2.启动Sentinel节点

Sentinel节点的启动方法有两种:

redis-sentinel redis-sentinel-26379.conf
redis-server redis-sentinal-26379.conf --sentinel

3.确认

Sentinel节点因为本质是一个特殊的Redis节点,所以我们依然可以通过info命令查看它的相关信息。

img


下面我们详细介绍一下Sentinel节点的配置说明。

1.sentinel monitor

配置如下:

sentinel monitor <master-name> <ip> <port> <guorum>

Sentinel节点会定期监控主节点。参数表示要监控的主节点的名字。表示监控主节占的ip,表示监控主节点的端口,表示要判断主节点故障时所需要的票数。参数设置的越小,那么达到下线的条件就越宽松,反之越严格。正常情况下应该是该参数设置为Sentinel节点的一半加1。


2.sentinel down-after-milliseconds

配置如下:

sentinel down-after-milliseconds <master-name> <times>

每个Sentinel节点都要通过定期发送ping命令来判断Redis数据节点和其余Sentinel节点是否可用,如果超过了down-after-milliseconds配置的时间且没有回复,则判断节点不可用。参数单位为毫秒。


3.sentinel parallel-syncs

配置如下:

sentinel parallel-syncs <master-name> <nums>

当Sentinel节点对主节点判断故障时,Sentinel领导者节点会做故障转移操作,选出新的节点,原来的节点会向新的主节点发起复制操作,parallel-syncs就是限制在一次故障转移后,每次向新的主节点发起复制操作的从节点个数。


4.sentinel failover-timeout

配置如下:

sentinel failover-timeout <master-name> <times>

failover-timeout可以理解为故障转移超时时间,但实际上它主要有4个阶段:


5.sentinel auth-pass

配置如下:

sentinel auth-pass <master-name> <password>

如果Sentinel监控的主节点配置了密码,sentinel auth-pass配置通过添加主节点的密码,防止Sentinel节点对主节点无法监控。


6.sentinel notification-script

配置如下:

sentinel notification-script <master-name> <script-path>

sentinel notification-script的作用是在故障转移期间,当一些警告级别的Sentinel时间发生时,会触发对应路径的脚本,并向脚本发送相应的事件参数。


7.sentinel client-reconfig-script

配置如下:

sentinel client-reconfig-script <master-name> <script-path>

sentinel client-reconfig-script的作用是在故障转移结束后,会触发对应路径脚本,并向脚本发送故障转移结果的相关参数。