什么是Keepalived呢,keepalived观其名可知,保持存活,在网络里面就是保持在线了,也就是所谓的高可用或热备,用来防止单点故障(单点故障是指一旦某一点出现故障就会导致整个系统架构的不可用)的发生,那说到keepalived时不得不说的一个协议就是VRRP协议,可以说这个协议就是keepalived实现的基础,那么首先我们来看看VRRP协议

一,keepalived的原理

1,VRRP协议

学过网络的朋友都知道,网络在设计的时候必须考虑到冗余容灾,包括线路冗余,设备冗余等,防止网络存在单点故障,那在路由器或三层交换机处实现冗余就显得尤为重要,在网络里面有个协议就是来做这事的,这个协议就是VRRP协议,Keepalived就是巧用VRRP协议来实现高可用性(HA)的

2,keepalived也是模块化设计,不同模块复杂不同的功能,下面是keepalived的组件

core check vrrp libipfwc libipvs-2.4 libipvs-2.6
core:是keepalived的核心,复杂主进程的启动和维护,全局配置文件的加载解析等
check:负责healthchecker(健康检查),包括了各种健康检查方式,以及对应的配置的解析包括LVS的配置解析
vrrp:VRRPD子进程,VRRPD子进程就是来实现VRRP协议的
libipfwc:iptables(ipchains)库,配置LVS会用到
libipvs*:配置LVS会用到
注意,keepalived和LVS完全是两码事,只不过他们各负其责相互配合而已

keepalived启动后会有三个进程

父进程:内存管理,子进程管理等等
子进程:VRRP子进程
子进程:healthchecker子进程
有图可知,两个子进程都被系统WatchDog看管,两个子进程各自复杂自己的事,healthchecker子进程复杂检查各自服务器的健康程度,例如HTTP,LVS等等,如果healthchecker子进程检查到MASTER上服务不可用了,就会通知本机上的兄弟VRRP子进程,让他删除通告,并且去掉虚拟IP,转换为BACKUP状态

二,keepalived安装

[root@test1 ~]# wget  http://www.keepalived.org/software/keepalived-1.2.1.tar.gz[root@test1 ~]# tar zxvf keepalived-1.2.1.tar.gz[root@test1 ~]# cd keepalived-1.2.1[root@test1 keepalived-1.2.1]# ./configure --prefix=/usr/local/keepalived[root@test1 keepalived-1.2.1]# make && make install安装排错:1,configure: error:  !!! OpenSSL is not properly installed on your system. !!!  !!! Can not include OpenSSL headers files.            !!!解决方法: [root@test1 keepalived-1.2.1]# yum install -y openssl-devel2,Use IPVS Framework       : NoIPVS sync daemon support : No这里不是必须的,但是还是建议大家安装上[root@test1 keepalived-1.2.1]# cd /usr/src/kernels/[root@test1 kernels]# yum install -y kernel-devel ipvsadm[root@test1 ~]# ln -s /usr/src/kernels/2.6.18-194.el5-x86_64/   /usr/src/linux

keepalived安装验证

1,检查目录及相应的文件信息[root@test1 ~]# cd /usr/local/keepalived/bin/   etc/   sbin/  share/2,启动设置[root@test1 ~]# cp /usr/local/keepalived/etc/sysconfig/keepalived  /etc/sysconfig/[root@test1 ~]# cp /usr/local/keepalived/etc/rc.d/init.d/keepalived  /etc/init.d/[root@test1 ~]# mkdir  /etc/keepalived      [root@test1 ~]# cp  /usr/local/keepalived/etc/keepalived/keepalived.conf  /etc/keepalived/[root@test1 ~]# cp  /usr/local/keepalived/sbin/keepalived  /usr/sbin/[root@test1 ~]# service keepalived startStarting keepalived:                                       [  OK  ][root@test1 ~]# ps aux|grep keepalivedroot     18846  0.0  0.1  35832   620 ?        Ss   04:33   0:00 keepalived -Droot     18847  0.2  0.3  37924  1556 ?        S    04:33   0:00 keepalived -Droot     18848  0.0  0.2  37924  1028 ?        S    04:33   0:00 keepalived -DKeepalived正常运行时,共启动3个进程,其中一个进程时父进程,负责监控其子        进程,一个是vrrp子进程;另外一个是checkers子进程。

四,keepalived.conf的配置

global_defs {   notification_email { #指定keepalived在发生切换时需要发送email到的对象,一行一个   }   notification_email_from #指定发件人   smtp_server localhost #指定smtp服务器地址   smtp_connect_timeout 30 #指定smtp连接超时时间   router_id LVS_DEVEL #运行keepalived机器的一个标识}vrrp_sync_group VG_1{ #监控多个网段的实例    group { inside_network  #实例名 outside_network } notify_master /path/xx.sh #指定当切换到master时,执行的脚本 netify_backup /path/xx.sh #指定当切换到backup时,执行的脚本 notify_fault "path/xx.sh VG_1" #故障时执行的脚本 notify /path/xx.sh smtp_alert   #使用global_defs中提供的邮件地址和smtp服务器发送邮件通知}vrrp_instance inside_network {  state BACKUP #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备靠priority决定  interface eth0 #设置实例绑定的网卡  dont_track_primary #忽略vrrp的interface错误(默认不设置)  track_interface{ #设置额外的监控,里面那个网卡出现问题都会切换   eth0   eth1  }  mcast_src_ip #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip  garp_master_delay #在切换到master状态后,延迟进行gratuitous ARP请求  virtual_router_id 50 #VPID标记  priority 99 #优先级,高优先级竞选为master  advert_int 1 #检查间隔,默认1秒  nopreempt #设置为不抢占 注:这个配置只能设置在backup主机上,而且这个主机优先级要比另外一台高  preempt_delay #抢占延时,默认5分钟  debug #debug级别  authentication { #设置认证    auth_type PASS #认证方式    auth_pass 111111 #认证密码  }  virtual_ipaddress { #设置vip    192.168.202.200  }}virtual_server 192.168.202.200 23 {  delay_loop 6 #健康检查时间间隔  lb_algo rr  #lvs调度算法rr|wrr|lc|wlc|lblc|sh|dh  lb_kind DR  #负载均衡转发规则NAT|DR|RUN  persistence_timeout 5  #会话保持时间  protocol TCP      #使用的协议  persistence_granularity 
#lvs会话保持粒度 virtualhost
#检查的web服务器的虚拟主机(host:头) sorry_server
# 备用机,所有realserver失效后启用 real_server 192.168.200.5 23 { weight 1 #默认为1,0为失效 inhibit_on_failure #在服务器健康检查失效时,将其设为0,而不是直接从ipvs中删除 notify_up
|
#在检测到server up后执行脚本 notify_down
|
#在检测到server down后执行脚本 TCP_CHECK { connect_timeout 3 #连接超时时间 nb_get_retry 3 #重连次数 delay_before_retry 3 #重连间隔时间 connect_port 23 健康检查的端口的端口 bindto
} HTTP_GET | SSL_GET{ url{ #检查url,可以指定多个 path / digest
#检查后的摘要信息 status_code 200 #检查的返回状态码 } connect_port
bindto
connect_timeout 5 nb_get_retry 3 delay_before_retry 2 } SMTP_CHECK{ host{ connect_ip
connect_port
#默认检查25端口 bindto
} connect_timeout 5 retry 3 delay_before_retry 2 helo_name
|
#smtp helo请求命令参数,可选 } MISC_CHECK{ misc_path
|
#外部脚本路径 misc_timeout #脚本执行超时时间 misc_dynamic #如设置该项,则退出状态码会用来动态调整服务器的权重,返回0 正常,不修改;返回1, 检查失败,权重改为0;返回2-255,正常,权重设置为:返回状态码-2 } }} real_server 192.168.0.20 80 { //真实IP web的IP weight 1 //默认为1,0为失效 HTTP_GET { connect_port 80 //健康检查端口 connect_timeout 3 //链接超时时间 nb_get_retry 3 //重链次数 delay_before_retry 3 //重连讲时间(秒) } }}