手册下载
多机备份(VSRP)技术白皮书-6W100-整本手册.pdf (869.57 KB)
多机备份(VSRP)技术白皮书
Copyright © 2022 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文中的内容为通用性技术信息,某些信息可能不适用于您所购买的产品。
3.3 ARP支持多机备份联动VRRP备份组功能且以直连链路作为备份通道典型组网
3.4 ND支持多机备份联动VRRP备份组功能且以直连链路作为备份通道典型组网
4 DHCPv4服务器/DHCPv6服务器支持多机备份的技术实现
5 DHCPv4中继/DHCPv6中继支持多机备份的技术实现
随着用户对网络可靠性的要求越来越高,如何保证网络的不间断传输,已成为一个必须解决的问题。特别是在一些重要业务的入口或接入点上,需要保证网络的不间断运行,如企业的Internet网关等。在这些业务点上如果只使用一台设备,无论其可靠性多高,系统都必然要承受因单点故障而导致网络业务中断的风险,如图1所示。为解决上述问题,我们通常会采用设备级的1+1冗余备份。尤其对于业务类型多样的路由网关,除了实现硬件上的1+1备份,还会在设备上部署多机备份功能来对多种业务数据进行备份,从而保证单点故障后,流量迁移到另一台设备后,有相应的业务数据来保证流量不中断。
多机备份功能通过VSRP(Virtual Service Redundancy Protocol,虚拟业务冗余协议)提供了一种设备级别的网络可靠性解决方案。它在部署了主备协议(例如VRRP、S-Trunk)的场景下,将主用设备上的用户业务数据备份到备用设备,当主用设备或者链路出现故障时,能够快速将用户业务切换至备用设备;当主用设备或者链路的故障恢复时,能够顺利将用户业务由备用设备回切至主用设备,保证用户业务的不中断。
如图2所示,在实际应用中,多机备份最常见的组网为1+1设备级冗余备份,也称为双机热备,即在网络的重要节点部署两台型号和软、硬件配置均相同的设备,来提高网络的可靠性。其中:
· 一台设备作为主用设备。主用设备处理业务、转发业务流量,并进行业务模块数据的备份。
· 另一台设备作为备用设备。当主用设备正常工作时,备用设备不转发业务流量,仅进行业务模块数据的备份。当主用设备故障时,备用设备能接替主用设备工作,使业务不中断。
多机备份基于双机热备模型,将双机热备模型扩展到多台设备间,可实现多台设备间的设备级冗余备份。本文重点讲述多机备份中的双机组网场景。
承担多机备份任务的两台设备组成一个多机备份组。
多机备份组包含两台设备,其中的每一台设备都叫做另一台设备的多机备份对端。管理员需要在这两台设备上分别配置对端设备的IP地址等信息,多机备份组才能创建成功。
多机备份组中设备角色分为主用设备(Master)和备用设备(Backup)。设备的角色影响业务模块数据备份的方向。大部分业务模块是将主用设备上的业务数据备份到备用设备上,也有些业务模块是将主用设备和备用设备上的业务数据双向备份。
多机备份实例用于管理多机备份组中两台设备间的数据备份。在多机备份实例下,管理员可以指定多机备份对端、备份模式、备份触发条件等参数。当业务模块引用多机备份实例后,就会按照多机备份实例中定义的参数进行数据备份。
创建多个实例,在实例中指定不同的对端,可以实现多台设备间的数据备份。
创建多个实例,在实例中指定不同的备份参数,可以满足不同业务数据的备份需求。
多机备份的主用设备和备用设备之间需要使用通道进行多机备份协议状态的协商和业务模块数据的同步。多机备份通道基于TCP连接,包括以下两种:
· 控制通道:用于传输VSRP协议报文,来确定设备在双机备份组中的角色。在一个多机备份组中,所有的多机备份实例使用同一个控制通道。
· 业务数据备份通道:业务模块关联多机备份实例后,会在该多机备份实例两端的设备上创建一个业务数据通道,业务数据通道用来同步该业务的数据(实时状态和业务运行信息等),以保证当主用设备故障时,备用设备能够代替主用设备,使业务不会中断。
完成多机备份配置,并确保备份通道使用的本端IP地址和对端IP地址之间路由可达后,主用设备和备用设备之间会自动建立备份通道。
多机备份正常工作时,主用设备负责转发用户流量,备用设备仅作为备份,不转发用户流量。当主用设备或者链路故障时,备用设备切换成新的主用设备,接替原主用设备转发用户流量的过程,称为正切。
多机备份组网发生正切后,原主用设备或者链路故障恢复,原主用设备恢复主用设备角色,原备用设备恢复备用设备角色,流量回切到原主用设备、由原主用设备转发的过程,称为回切。
根据备份通道的搭建方式不同,多机备份支持以下两种典型组网:
· 直连组网。将主用设备和备用设备直连,使用直连链路作为备份通道,如图3所示。使用直连链路作为备份通道备份效率更高,但是需要占用接口。
· 跨中间设备组网。使用跨中间设备的上行链路作为备份通道,如图4所示。使用跨设备链路作为备份通道无需占用接口,但是备份控制报文和数据备份报文会和业务报文混杂在一起,建议使用专用VLAN或者子接口,来进行流量隔离。
为提高备份链路的可靠性,避免单链路故障导致无法备份的问题,请使用聚合链路作为备份通道。
在多机备份组网中,需要解决两个问题:一个是决定哪台设备处理流量,一个是如何备份业务数据。
如图5所示,在双机备份组网中:
· 使用VRRP(Virtual Router Redundancy Protocol,虚拟路由器冗余协议)或S-Trunk(Smart Trunk)来确定双机备份中谁是主用设备,谁是备用设备,流量通过主用设备转发。
· VSRP作为桥梁模块,关联VRRP、S-Trunk和业务模块。为多种用户业务在主备设备之间的冗余备份建立了统一的备份平台。
¡ VSRP根据VRRP和S-Trunk的主备,来确定VSRP数据备份中的主备。
¡ VSRP将数据备份中的主备通告给业务模块,来指导业务模块的数据备份。
¡ VSRP将备份通道、备份时间间隔或流量阈值等参数通告给业务模块,来指导业务模块的数据备份。
· 业务模块实现数据备份,以便流量切换到另一台设备后,另一台设备有相应的业务数据来处理业务报文,实现业务不中断。例如,多机备份功能应用于BRAS(Broadband Remote Access Server,宽带远程接入服务器)组网中,对网络汇聚层中的BRAS设备进行多机备份,主用设备和备用设备通过业务数据备份通道备份用户的BRAS认证信息、计费信息和客户管理信息,从而保证了BRAS系统不间断运行,提高了可靠性。
目前支持多机备份的业务模块包括ARP(Address Resolution Protocol,地址解析协议)、ND(Neighbor Discovery,邻居发现)、DHCPv4服务器、DHCPv6服务器、DHCPv4中继、DHCPv6中继、IGMP(Internet Group Management Protocol,互联网组管理协议)、MLD(Multicast Listener Discovery,组播侦听器发现)、IPoE(IP over Ethernet)、PPPoE(PPP over Ethernet)、L2TP(Layer 2 Tunneling Protocol,二层隧道协议)、Portal、NAT(Network Address Translation,网络地址转换)和MEC(Multi-access Edge Computing,多接入边缘计算)。
设备对业务模块的支持情况与设备的型号有关,请以设备的实际情况为准。
图5 VSRP和各业务模块之间的关系图
VRRP将局域网内的一组路由器(通常为两台)划分在一起,形成一个VRRP备份组。VRRP备份组在功能上相当于一台虚拟路由器。VRRP备份组将物理设备划分为两种角色:Master路由器和Backup路由器。
VRRP备份组支持两种工作模式:标准协议模式和负载均衡模式。
· 在标准协议模式下:
¡ Master路由器转发流量,局域网内的主机通过Master路由器与外界通信;
¡ Backup路由器处于监听状态,不能转发报文。
· 在负载均衡模式下:
Master路由器和Backup路由器都能转发报文。
不管是标准协议模式还是负载均衡模式,在多机备份组网中,将VSRP和VRRP联动后,VSRP实例中两台设备的主备角色由VRRP备份组中设备的角色决定。VRRP备份组中的Master路由器在多机备份组中作为主用设备,VRRP备份组中的Backup路由器在多机备份组中作为备用设备。
在进行网络部署时,网络管理员需要给这两台设备配置VRRP优先级,VRRP选举设备角色的规则如下:
· 优先级高的路由器成为Master路由器;
· 优先级低的成为Backup路由器;
· 如果优先级相同,则VRRP备份组所在接口的IP地址大的设备成为Master路由器。
VRRP主备组网指的是VRRP备份组工作在标准协议模式,只有Master路由器转发报文,Backup路由器不转发报文。其实现原理为:
(1) 管理员在主机上指定网关为VRRP备份组的虚拟IP地址。
(2) Host向网关发送ARP/ND报文,请求网关的MAC地址。
(3) Master路由器使用本机的虚拟MAC地址应答主机的ARP/ND请求,Backup路由器不会应答主机的ARP/ND请求。
(4) 主机在ARP表中维护Master路由器虚拟MAC地址和网关IP地址的对应关系,将报文发送给Master路由器处理。
VSRP的主备设备角色与VRRP备份组相同。VRRP备份组的Master路由器即为VSRP的主用设备,VRRP备份组的Backup路由器为VSRP的备用设备,如图6所示。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
图6 多机备份和VRRP备份组联动的组网图(正常情况下)
在VRRP标准协议模式中,只有Master路由器可以转发报文,Backup路由器处于监听状态,无法转发报文。为了提高设备利用率,我们希望VRRP在提供网关冗余备份功能的同时,两台设备都可以处理业务,转发报文,即VRRP支持双活组网。在VRRP双活组网中,VRRP备份组中的设备也分为两种角色:Master路由器和Backup路由器。将VSRP和VRRP联动后,VSRP实例中两台设备的主备角色仍由VRRP备份组中设备的角色决定。VRRP备份组中的Master路由器在多机备份组中作为主用设备,VRRP备份组中的Backup路由器在多机备份组中作为备用设备。
VRRP双活组网有两种实现方式:
(1) 通过创建多个标准协议模式的VRRP备份组来实现双活,如图7所示。
对于VRRP:
¡ 在VRRP备份组1中,让Router A作为VRRP备份组1的主用设备,Router B作为VRRP备份组1的备用设备。
- Router A使用本机的虚拟MAC地址回复Host A和Host B的ARP/ND请求。
- Host A和Host B发送的报文的目的IP地址为备份组1的虚拟IP地址,目的MAC地址为Router A的虚拟MAC地址。
- Router A转发Host A和Host B的报文。
¡ 在VRRP备份组2中,让Router A作为VRRP备份组2的备用设备,Router B作为VRRP备份组2的主用设备。
- Router B使用本机的虚拟MAC地址回复Host C的ARP/ND请求。
- Host C发送的报文的目的IP地址为备份组2的虚拟IP地址,目的MAC地址为Router B的虚拟MAC地址。
- Router B转发Host C的报文。
对于VSRP:
可以配置VSRP实例1和VRRP备份组1联动,VSRP实例2和VRRP备份组2联动,则VSRP的主备设备角色与VRRP备份组相同:
¡ 在VSRP实例1中,Router A作为VSRP主用设备,Router B作为VSRP备用设备。
¡ 在VSRP实例2中,Router B作为VSRP主用设备,Router A作为VSRP备用设备。
从而实现业务数据的双向备份,使得Router A和Router B上的数据保持一致。
图7 VRRP双活组网,VRRP和VSRP联动组网图(VRRP标准协议模式下的多VRRP备份组)
(2) 通过配置VRRP负载均衡模式来实现双活,如图8所示。
创建一个备份组,使其工作在负载均衡模式,VRRP仍然会选举出Master路由器和Backup路由器。VRRP采用虚拟MAC地址和虚拟转发器技术使得不同主机的流量发送到不同的路由器,备份组中的每台路由器都能转发流量。负载均衡模式的报文转发流程大致如下:
a. Master路由器会为备份组中的每台路由器都生成一个虚拟MAC地址。
b. Master路由器使用不同的虚拟MAC地址应答主机的ARP/ND请求,例如,使用Router A的虚拟MAC地址答复Host A的ARP/ND请求,使用Router B的虚拟MAC地址答复Host A的ARP/ND请求。
c. Host A发送的报文的目的IP地址为备份组1的虚拟IP地址,目的MAC地址为Router A的虚拟MAC地址。
d. Host B发送的报文的目的IP地址为备份组1的虚拟IP地址,目的MAC地址为Router B的虚拟MAC地址。
e. Router A转发Host A的报文。
f. Router B转发Host B的报文。
VSRP的主备设备角色与VRRP备份组相同。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
负载均衡模式下的VRRP备份组工作机制(如Master路由器的选举、抢占、正切、回切等)和标准协议模式下的VRRP备份组工作机制相同。
图8 VRRP双活组网,VRRP和VSRP联动组网图(VRRP负载分担模式)
VRRP主备组网和双活组网正切工作机制相同。
VRRP协议规定,Master路由器周期性地发送VRRP报文,在虚拟路由器中公布其配置信息(优先级等)和工作状况。Backup路由器通过接收到VRRP报文的情况来判断Master路由器是否工作正常。
当Master路由器发生网络故障,而不能发送VRRP报文时,Backup路由器并不能立即知道其工作状况。Backup路由器等待一段时间之后,如果还没有接收到VRRP报文,则认为Master路由器无法正常工作,而把自己升级为Master路由器。新Master路由器发送源MAC地址为本机虚拟MAC地址的ARP广播请求报文给主机,主机刷新本地MAC地址表,以便主机将报文转发给新Master路由器处理,由新的Master路由器转发流量。
VSRP跟随VRRP备份组进行主备切换,即VSRP将Router B作为主用设备,进行角色的切换,如图9所示。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
图9 多机备份和VRRP备份组联动正切组网图
VRRP主备组网和双活组网回切工作机制相同。
VRRP正切后,如果原来故障的主用设备(Router A)恢复,VRRP要求初始创建的路由器工作在Backup状态,则Router A当前为Backup路由器。但Router A(Backup路由器)的优先级高于现有Master路由器(Router B),这时,Backup路由器(Router A)的工作方式(抢占方式和非抢占方式)决定是否重新选举Master:
· 非抢占方式:如果Backup路由器工作在非抢占方式下,则只要Master路由器没有出现故障,Backup路由器即使随后被配置了更高的优先级也不会成为Master路由器。
· 抢占方式:如果Backup路由器工作在抢占方式下,当它收到VRRP报文后,会将自己的优先级与通告报文中的优先级进行比较。如果自己的优先级比当前的Master路由器的优先级高,就会主动抢占成为Master路由器;否则,将保持Backup状态。
缺省情况下,备份组中的路由器工作在抢占方式,抢占延迟时间为0厘秒。如果Router A恢复,Router A会立即重新当选为Master路由器,流量回切到Router A转发。
VSRP跟随VRRP备份组进行主备切换,即VSRP将Router A切回到主用设备状态,将Router B切回到备用设备状态。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
S-Trunk(Smart Trunk)为我司私有协议,用于MPLS L2VPN中CE(Customer Edge,用户网络边缘)双归接入PE(Provider Edge,服务提供商网络边缘)的组网环境。S-Trunk是一种跨设备链路聚合的机制,通过多台设备间的链路聚合,将可靠性提高到设备级。
S-Trunk网络模型主要定义了以下概念:
· S-Trunk组:将两台PE设备上的接口聚合在一起形成的链路聚合组。
· S-Trunk组中设备优先级:用于在同一S-Trunk组中决策两台PE设备的主备状态。
· S-Trunk组中设备的角色:S-Trunk组中设备角色分为主用设备和备用设备。优先级高的为主用设备,优先级低的为备用设备。只有主用设备故障或者条件触发,备用设备才会切换成主设备。
· S-Trunk组成员接口:加入S-Trunk组的接口,在同一S-Trunk组中成员接口形成备份。
· S-Trunk组成员接口的角色:两台PE设备上同一S-Trunk组中成员接口的角色分为主用接口(Primary)和备用接口(Secondary)。
在S-Trunk组网中,是否转发流量由S-Trunk组成员接口的角色决定,只有Primary接口可以转发流量。
· 正常情况下,主用设备上的成员接口为Primary接口,备用设备上的成员接口为Secondary接口。
· S-Trunk组成员接口的角色会根据接口连通状况在Primary和Secondary之间切换。如果Primary接口故障,Secondary接口就会切换成Primary接口,转发流量。
在多机备份组网中,将VSRP和S-Trunk联动后,VSRP实例中两台设备的主备角色由S-Trunk组成员接口的角色决定。S-Trunk组中主用接口(Primary)所属设备在多机备份组中作为主用设备,S-Trunk组中备用接口(Secondary)所属设备在多机备份组中作为备用设备。
将VSRP和S-Trunk联动,S-Trunk组成功建立后,正常情况下,由S-Trunk组内主用设备上的成员接口进行报文转发。如图10所示,正常情况下,因为PE 1的S-Trunk优先级更高,所以,PE 1当选为S-Trunk的主用设备,PE 1的LAGG 1为S-Trunk的主用接口,其链路状态为UP。PE 2为S-Trunk的备用设备,PE 2的LAGG 1为S-Trunk的备用接口,其链路状态为S-Trunk DOWN。CE侧的用户流量通过PE 1的LAGG 1转发。
VSRP的主备设备角色与S-Trunk组成员接口的角色对应。PE 1为VSRP的主用设备,PE 2为VSRP的备用设备。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
图10 多机备份和S-Trunk组联动的组网图(正常情况)
(1) S-Trunk组中主用成员接口所在链路故障导致正切
S-Trunk组中主用接口所在链路故障后,由备用接口转发流量。如图11所示,如果CE到PE 1间的链路出现故障,PE 1向PE 2发送的Hello报文中会携带PE 1的LAGG 1故障信息。PE 2收到Hello报文后,发现PE 1的LAGG 1故障,则设备的主备角色不变,PE 2的LAGG 1变为主用接口,链路状态变为UP。这样CE的流量会通过PE 2转发,从而达到对CE的流量进行保护的目的。
VSRP的主备设备角色与S-Trunk组成员接口的角色对应,将PE 2切换成新的主用设备,将PE 1切换成备用设备。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
图11 多机备份和S-Trunk组联动的组网图(CE与PE 1之间链路故障导致正切)
(2) S-Trunk组中主用设备故障导致正切
S-Trunk组中主用设备故障后,由备用接口转发流量。如图12所示,如果PE 1出现故障,PE 2在定时器超时后仍然没有收到PE 1发送的Hello报文,则设备的主备角色不变,PE 2的LAGG 1变为主用接口,链路状态变为UP。这样CE的流量会通过PE 2转发,从而达到对CE的流量进行保护的目的。
VSRP的主备设备角色与S-Trunk组成员接口的角色对应,将PE 2切换成新的主用设备,将PE 1切换成备用设备。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
图12 多机备份和S-Trunk组联动的组网图(PE 1故障导致正切)
在多机备份的组网中,为了实现流量在两台设备间的平滑切换,我们建议主用设备和备用设备完全对称,即两台设备的型号和软、硬件配置均相同。网络管理员也可能根据网络实际情况,将性能更好、配置更高的设备规划成主用设备。所以,当导致S-Trunk发生正切的故障恢复,即组网恢复到正常状态,缺省情况下,S-Trunk会启动延时回切定时器。等延时回切定时器超时后,S-Trunk会将PE 1的LAGG 1恢复为主用状态,PE 2的LAGG 1恢复为备用状态,流量切回到PE 1。
VSRP的主备设备角色与S-Trunk组成员接口的角色对应,将PE 1恢复成主用设备,将PE 2恢复成备用设备。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
如果正切后,双机当前的主备用状态可以满足业务需求,为了避免回切过程中的流量倒换,管理员可以选择关闭回切功能。
在S-Trunk主备组网中,只有S-Trunk组Primary状态的接口转发流量,Secondary状态的接口被关闭,不能转发流量。为了提高链路利用率,我们可以通过命令行强制配置S-Trunk组的两个成员接口都处于Primary状态,使得S-Trunk在提供冗余备份功能的同时,两个成员接口都可以处理业务,转发报文,即S-Trunk支持双活组网。
在S-Trunk双活组网下,VSRP会使用防脑裂机制选举VSRP主用和备用设备角色,来指导业务模块进行数据备份。该场景下业务数据的备份处理请参见业务模块支持多机备份技术实现章节。
S-Trunk双活组网下,因为S-Trunk组中的两个成员接口均为Primary状态,所以,S-Trunk双活组网不存在正切和回切情况。
图13 S-Trunk双活组网,VSRP和S-Trunk联动组网图
如图14所示,当网络故障或者VRRP/S-Trunk协议故障,导致PE 1和PE 2均认为自己是VRRP/S-Trunk的主用设备,这种现象称为脑裂。脑裂情况下,因为没有备用设备,会严重影响甚至停止业务模块的数据备份。
为了解决脑裂问题,让业务模块可以继续进行数据备份,VSRP从VRRP/S-Trunk获取到双主后,VSRP会立即通过自己的控制通道,选举VSRP的主用、备用设备。选举规则为:比较本端和对端的IP地址,IP地址大的为VSRP主用设备,IP地址小的为VSRP备用设备,来防止脑裂。
图14 VSRP防脑裂组网图
多机备份的备份模式包括热备份和温备份两种:
· 热备份:当备用设备收到主用设备的备份信息后,立即下发备份信息到转发平面。这样,主用设备发生故障时,备用设备能马上指导报文转发,可以实现业务快速切换到备用设备。热备份适用于适用于1+1备份(一台主用设备加一台备用设备)的情况。
· 温备份:当备用设备收到主用设备的备份信息后,不会立即下发备份信息到转发平面,当主用设备发生故障后,设备的主备状态发生切换,备用设备才开始下发备份信息到转发平面,并指导报文转发。业务切换到备用设备上的时间,温备份比热备份稍长,温备份适用于N+1备份(N台主用设备加一台备用设备)的情况。对于N+1备份场景,因为备份数据较多,如果立即下发备份信息到转发平面,可能会导致大部分转发表项被暂时不用的数据占用,而即将需要用到的数据却获取不到表项资源无法备份。例如主用设备A、B、C、D共用备用设备E,如果E的转发表项规格为4000条,A、B、C、D每台设备有2000条数据,这些数据备份到E后,最多只能下发4000条,E设备的转发表项就会被占满,剩余的表项无法下发,E也无法创建新的转发表项,直到现有的转发表项老化。如果主设备故障,业务倒换到E上处理,则E可能会因为部分业务数据缺乏而影响业务的运行。
在实际组网中,热备份模式应用更广泛,本文重点描述热备份模式。
缺省情况下,多机备份组中的两台设备依靠TCP连接的状态来检查备份通道是否可用。为了快速检测出当前备份通道是否可用,可以采用NQA(Network Quality Analyzer,网络质量分析)、BFD(Bidirectional Forwarding Detection,双向转发检测)等监测主用设备和备用设备之间的链路状态,并通过Track功能将多机备份功能和NQA、BFD监测结果之间进行联动。
· 当NQA、BFD检测到备份通道通畅时,关联Track项的状态为Positive或Notready,多机备份模块尝试与对端设备建立或保持TCP连接,以便尽快备份业务数据。
· 当NQA、BFD检测到备份通道故障时,关联Track项的状态变成Negative,多机备份模块会立即断开备份通道,以便尽快停止备份业务数据。
ARP/ND支持多机备份功能可以使热备份模式下的主、备设备的ARP/ND表项保持同步。当发生流量切换时,新的主用设备可以快速转发流量,而不需重新学习ARP/ND表项,从而提高ARP/ND业务的可靠性。
ARP支持多机备份基本运行机制和ND支持多机备份基本运行机制相同,本文以ARP支持多机备份基本运行机制为例。
ARP支持多机备份基本运行机制如下:
(1) 多机备份实例确定主备设备角色。
(2) 在接口上将ARP功能与多机备份实例绑定后,ARP模块开始批量备份ARP表项。主、备设备分别将与多机备份实例绑定的处于up状态的接口的ARP表项信息,通过业务数据通道发送给多机备份对端。主备设备根据收到的ARP表项信息添加ARP表项。当主、备设备都将所有与多机备份实例绑定的接口的ARP表项信息发送给多机备份对端后,ARP模块批量备份阶段结束,进入实时备份阶段。
(3) ARP模块进行实时备份。主、备设备每隔0.1秒会分别检查与多机备份实例绑定的处于up状态的接口的ARP表项是否发生变化。如果发生变化则将变化的表项信息发送给多机备份对端进行备份。
(4) 通过表项的批量备份和实时备份,主备设备上与多机备份实例绑定的接口的ARP表项会实现同步。这样可以避免主备设备发生流量切换时,新的主用设备需要重新学习ARP表项。
不管主备组网还是双活组网,不管是两台设备正常运行,还是正切、回切场景,只要ARP/ND检测到接口up且学习到新的ARP/ND表项,均会备份到对端设备。如果备份链路故障,则停止备份。
ARP/ND不支持温备模式。如果仅要实现ARP/ND业务备份,可以不部署VRRP和S-Trunk。
如图15所示,接入设备上行链路采用OSPF进行路由学习和发布。接入设备Device A和Device B之间进行多机备份,具体要求如下:
· 在接入设备连接用户侧的一个子接口上运行VRRP协议,并在此接口上终结VRRP协议报文交互使用的VLAN 10。
· 接入设备使用直连链路构建多机备份数据备份通道,用于备份ARP表项信息。
图15 ARP支持多机备份联动VRRP备份组功能且以直连链路作为备份通道组网图
如图16所示,接入设备Device A和Device B之间进行多机备份,具体要求如下:
· 在接入设备连接用户侧的一个子接口上运行VRRP协议,并在此接口的子接口上终结上行报文VLAN 10。
· 接入设备使用直连链路构建多机备份数据备份通道,用于备份ND表项信息。
图16 ND支持多机备份联动VRRP备份组功能且以直连链路作为备份通道组网图
DHCP服务器支持多机备份功能,可以通过数据备份通道实现DHCP业务数据(包括合法租约和冲突租约)的批量备份和实时备份,保证在主用DHCP服务器故障时业务能够顺利地切换到备用DHCP服务器上,从而降低了DHCP业务中断的风险,提高了DHCP业务的可靠性。
目前,DHCP多机备份多用于BRAS组网环境中,与IPoE和PPPoE等接入功能配合使用,为需要接入的客户端提供IPv4或IPv6地址等信息。
DHCPv6服务器支持多机备份功能的实现原理与DHCPv4服务器基本一致,本章内容中涉及的DHCP服务器包括了DHCPv4和DHCPv6服务器。
DHCP服务器支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 配置DHCP服务器上的地址池关联多机备份实例。当与DHCP客户端连接的主用DHCP服务器和备用DHCP服务器的接口名不相同时,还需要在DHCP服务器与客户端相连的接口上绑定多机备份实例。
(3) 地址池与多机备份实例关联生效后,当多机备份实例为主用状态时,该地址池所在的DHCP服务器为主用设备,否则该地址池所在的DHCP服务器为备用设备。只有主用DHCP服务器才能为DHCP客户端分配地址租约;备用DHCP服务器不能为客户端分配租约。
(4) 主用和备用DHCP服务器之间建立一条基于TCP连接的DHCP数据备份通道,主用DHCP服务器会将已经存在的大量DHCP业务数据批量发送给备用DHCP服务器备份;当有新的DHCP用户上线时,主用DHCP服务器会将产生的新的业务数据实时备份到备用服务器。
(5) 当多机备份发生正切或回切时,主用DHCP服务器向备用DHCP服务器同步业务数据,用户将从原主用DHCP服务器切换到备用DHCP服务器上线。后续,新主用DHCP服务器将执行租约的分配工作,并将产生的业务数据备份到新备用DHCP服务器上。如果备用设备或数据备份通道发生故障,则不再执行备份操作。
在S-Trunk双活组网下,配置VSRP实例的备份模式为双活模式的热备份后,主用DHCP服务器和备用DHCP服务器同时工作,用户流量在主备服务器间负载分担。该组网环境下,多机备份模块仍能根据VSRP实例确定VSRP的主用设备角色和备用设备角色,DHCP和VSRP联动的机制同主备组网下DHCP和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
S-Trunk双活组网主要应用于DHCPv4和DHCPv6中继,DHCPv4服务器不支持S-Trunk双活组网,且只有当用户通过NDRS上线时,DHCPv6服务器才支持S-Trunk双活组网。
如图17所示,DHCP客户端经由二层网络以IPoE方式接入到BRAS接入设备,BRAS接入设备与DHCP服务器相连。为了提高DHCP业务的可靠性,在DHCP Server A和DHCP Server B两台设备之间部署多机备份。其中,DHCP Server A为主用设备,DHCP Server B为备用设备。当DHCP Server A发生故障时,由DHCP Server B接替DHCP Server A继续工作,提高DHCP业务的可靠性。
图17 DHCP服务器支持多机备份功能典型组网图
DHCP中继支持多机备份功能,可以通过数据备份通道实现DHCP业务数据(DHCP中继用户地址表项)的批量备份和实时备份,保证在主用DHCP中继故障时业务能够顺利地切换到备用DHCP中继上,从而降低了DHCP中继业务中断的风险,提高了DHCP中继业务的可靠性。
目前,DHCP中继多机备份多用于BRAS组网环境中,与IPoE和PPPoE等接入功能配合使用,为需要接入的客户端提供IP地址等信息。
DHCPv6中继支持多机备份功能的实现原理与DHCPv4中继基本一致,本章内容中涉及的DHCP中继包括了DHCPv4和DHCPv6中继。
DHCP中继支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 通过配置将DHCP中继连接DHCP客户端的接口与多机备份实例关联后,主用和备用DHCP中继之间会建立一条基于TCP连接的DHCP数据备份通道。DHCP模块会使用该通道将主用DHCP中继记录的用户地址表项备份到备用DHCP中继上。
(3) 当数据备份通道成功建立后,主用DHCP中继会将记录的大量DHCP业务数据批量发送给备用DHCP中继备份;当有新的DHCP中继用户上线时,主用DHCP中继会将产生的新的业务数据实时备份到备用服务器。
(4) 当多机备份发生正切或回切时,主用DHCP中继向备用DHCP中继同步业务数据,用户将从原主用DHCP中继切换到备用DHCP中继上线。后续,新主用DHCP中继将执行业务数据转发的工作,并将产生的业务数据备份到新备用DHCP中继上。如果备用设备或数据备份通道发生故障,则不再执行备份操作。
在S-Trunk双活组网下,配置VSRP实例的备份模式为双活模式的热备份后,主用DHCP中继和备用DHCP中继同时工作,用户流量在主备中继间负载分担。该组网环境下,多机备份模块仍能根据VSRP实例确定VSRP的主用设备角色和备用设备角色,DHCP和VSRP联动的机制同主备组网下DHCP和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
如图18所示,DHCP客户端经由二层网络以IPoE方式接入到BRAS接入设备,BRAS接入设备同时作为DHCP Relay与DHCP服务器相连。为了提高DHCP业务的可靠性,在DHCP Relay A和DHCP Relay B两台设备之间部署多机备份。其中,DHCP Relay A为主用设备,DHCP Relay B为备用设备。当DHCP Relay A发生故障时,由DHCP Relay B接替DHCP Relay A继续工作,提高DHCP业务的可靠性。
图18 DHCP中继支持多机备份功能典型组网图
IGMP/MLD支持多机备份功能,可以在两台接入设备连接用户侧的接口上开启IGMP/MLD多机备份功能,主用设备会自动将本设备上IGMP/MLD组播组信息备份到备用设备。当主用设备发生故障时,备用设备能够根据备份的IGMP/MLD组播组信息生成的组播转发表项接替主用设备完成组播流量的转发工作,确保组播业务不会中断。
IGMP/MLD支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 通过配置将组播业务与多机备份实例关联后,IGMP/MLD模块会在主、备用设备之间创建一条业务数据通道,该业务数据通道用于同步IGMP/MLD组播组信息。
(3) 业务数据通道成功建立后,主备设备会将从下游设备收到的IGMP/MLD成员关系报告报文实时备份给对端设备,实现主备设备的双向备份。
(4) 当多机备份发生回切时,当前主用设备会快速向下游设备发送IGMP/MLD查询报文,触发下游设备回复IGMP/MLD成员关系报告报文,获取IGMP/MLD组播组信息,实现快速备份。如果当前备用设备故障或者备份通道故障,则不执行备份操作。
在S-trunk双活组网的热备模式下,IGMP/MLD支持多机备份的负载分担功能。当设备上配置多机备份的负载分担功能后,主用设备和备用设备将形成负载分担,共同转发组播流量。主用设备转发组播组地址为奇数的组播流量,备用设备转发组播组地址为偶数的组播流量。
此时,多机备份组网发生正切后,原主用设备或者链路故障恢复时,可以选择配置回切或者不回切。属于同一个多机备份组的两台设备上,组播流量转发的回切模式需配置为一致,即要么都回切,要么都不回切:
· 当主备设备均配置了不回切时,所有的组播流量均由当前转发设备继续转发,故障恢复的设备不参与组播流量的转发。
· 当主备设备均配置了回切时,当前的主用设备转发组播组地址为奇数的组播流量,当前的备用设备转发组播组地址为偶数的组播流量。
如图19所示,用户通过IPoE认证接入网络,在接入设备Device A和Device B上部署多机备份,Device A作为主用设备,Device B作为备用设备,Device A和Device B之间会互相备份IGMP/MLD组播组信息。当Device A发生故障时,由Device B接替Device A继续工作,使得组播流量可以跟组Device B上生成的组播转发表项进行转发,确保组播报文转发不会中断。
图19 IGMP/MLD支持多机备份功能典型组网图(IPoE场景)
IPoE支持多机备份功能可以提高IPoE接入业务的可靠性。在两台BRAS设备上配置IPoE支持多机备份功能后,主用BRAS设备会自动将本机上IPoE用户的会话信息备份到备用BRAS设备。当主用BRAS设备发生故障时,备用BRAS设备能够接替主用BRAS设备继续工作,确保IPoE用户业务不会中断。
IPoE支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 通过配置将IPoE业务与多机备份实例关联后,IPoE业务模块会在主、备用设备之间创建一条业务数据通道,该业务数据通道用于同步IPoE用户的会话信息。
(3) 业务数据通道成功建立后,主用设备将当前需备份的所有数据快速批量备份到备用设备。后续:
¡ 对于在线IPoE用户的流量更新信息,主用设备的IPoE模块会根据设置的流量备份时间间隔或流量阈值将其增量备份到备用设备。
¡ 对于新上线IPoE用户的会话信息或已在线用户的授权属性变更信息,主用设备的IPoE模块会将其实时备份到备用设备。
(4) 当多机备份发生正切或回切时,IPoE模块始终以当前主用设备上的数据为准,自动将当前主用设备的IPoE用户的会话信息备份到当前备用设备。如果当前备用设备故障或者备份通道故障,则不执行备份操作。
在VRRP或S-trunk双活组网下,多机备份仍能确定VSRP的主用设备角色和备用设备角色,IPoE和VSRP联动的机制同主备组网下IPoE和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
如图20所示,DHCP客户端经由二层网络以IPoE方式接入到BRAS接入设备。为了提高IPoE业务的可靠性,在BRAS A和BRAS B两台设备之间部署多机备份。其中,BRAS A为主用设备,BRAS B为备用设备。当BRAS A发生故障时,由BRAS B接替BRAS A继续工作,提高IPoE业务的可靠性。
图20 IPoE支持多机备份功能组网图
PPPoE支持多机备份功能可以提高PPPoE接入业务的可靠性。在两台BRAS设备上配置PPPoE支持多机备份功能后,主用BRAS设备会自动将本机上PPPoE用户的会话信息备份到备用BRAS设备。当主用BRAS设备发生故障时,备用BRAS设备能够接替主用BRAS设备继续工作,确保PPPoE用户业务不会中断。
PPPoE支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 通过配置将PPPoE业务与多机备份实例关联后,PPPoE业务模块会在主、备用设备之间创建一条业务数据通道,该业务数据通道用于同步PPPoE用户的会话信息。
(3) 业务数据通道成功建立后,主用设备将当前需备份的所有数据快速批量备份到备用设备。后续:
¡ 对于在线PPPoE用户的流量更新信息,主用设备的PPPoE模块会根据设置的流量备份时间间隔或流量阈值将其增量备份到备用设备。
¡ 对于新上线PPPoE用户的会话信息或已在线用户的授权属性变更信息,主用设备的PPPoE模块会将其实时备份到备用设备。
(4) 当多机备份发生正切或回切时,PPPoE模块始终以当前主用设备上的数据为准,自动将当前主用设备的PPPoE用户的会话信息备份到当前备用设备。如果当前备用设备故障或者备份通道故障,则不执行备份操作。
在VRRP或S-trunk双活组网下,多机备份仍能确定VSRP的主用设备角色和备用设备角色,PPPoE和VSRP联动的机制同主备组网下PPPoE和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
如图21所示,Host作为PPPoE Client,运行PPPoE客户端拨号软件。为了提高PPPoE业务的可靠性,使用BRAS A和BRAS B两台设备作为PPPoE Server,进行多机备份。BRAS A为主用设备,BRAS B为备用设备。当BRAS A发生故障时,由BRAS B接替BRAS A继续工作,提高PPPoE业务的可靠性。
图21 PPPoE支持多机备份功能组网图
L2TP支持多机备份功能可以提高L2TP接入业务的可靠性。在主用和备用LAC设备上配置L2TP支持多机备份功能后,主用LAC设备会自动将本机上的L2TP隧道和L2TP会话信息备份到备用LAC设备。当主用LAC设备发生故障时,备用LAC设备能够接替主用LAC设备继续工作,确保L2TP用户业务不会中断。
L2TP支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 通过配置将L2TP业务与多机备份实例关联后,L2TP业务模块会在主、备用设备之间创建一条业务数据通道,该业务数据通道用于同步L2TP隧道和L2TP会话信息。
(3) 业务数据通道成功建立后,主用设备将当前需备份的所有数据快速批量备份到备用设备。后续:
¡ 对于在线L2TP用户的流量更新信息,主用设备的L2TP模块会根据设置的流量备份时间间隔或流量阈值将其增量备份到备用设备。
¡ 对于新建立的L2TP隧道和L2TP会话信息,或已在线L2TP用户的授权属性变更信息,主用设备的L2TP模块会将其实时备份到备用设备。
(4) 当多机备份发生正切或回切时,L2TP模块始终以当前主用设备上的数据为准,自动将当前主用设备的L2TP隧道和L2TP会话信息备份到当前备用设备。如果当前备用设备故障或者备份通道故障,则不执行备份操作。
在VRRP或S-trunk双活组网下,多机备份仍能确定VSRP的主用设备角色和备用设备角色,L2TP和VSRP联动的机制同主备组网下L2TP和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
目前仅L2TP LAC支持多机备份功能,并且只支持NAS-Initiated模式下的PPPoE类型的用户接入,因此要实现L2TP业务的多机备份,LAC设备上还必须配置PPPoE Server支持多机备份功能。
如图22所示,为了提高L2TP业务的可靠性,在两台LAC设备之间部署多机备份。其中,LAC 1作为主用设备,LAC 2作为备用设备。当LAC 1发生故障时,由LAC 2接替LAC 1继续工作,提高L2TP业务的可靠性。
图22 L2TP支持多机备份功能组网图
Portal支持多机备份功能可以提高Portal接入业务的可靠性,在两台接入设备上开启Portal多机备份功能后,主用设备会自动将本设备上Portal用户信息备份到备用设备。当主用设备发生故障时,备用设备能够接替主用设备继续工作,确保Portal业务不会中断。
Portal支持多机备份基本运行机制如下:
(1) 多机备份确定多机备份实例中两台设备的主、备用角色。
(2) 通过配置将Portal业务与多机备份实例绑定关联后,Portal模块会在主、备用设备之间创建一条业务数据通道,该业务数据通道用于同步Portal用户信息。
(3) 业务数据通道成功建立后,主用设备将当前需备份的所有数据快速批量备份到备用设备。后续,主用设备的Portal模块会根据设置的流量备份时间间隔或流量阈值,将主用设备运行过程中新产生的Portal用户信息增量备份到备用设备。
(4) 当多机备份发生正切或回切时,Portal模块以当前设备上的数据为准,自动将当前主用设备上的Portal用户信息备份到当前备用设备。如果当前备用设备故障或者备份通道故障,则不执行备份操作。
在VRRP或S-trunk双活组网下,多机备份仍能确定VSRP的主用设备角色和备用设备角色,Portal和VSRP联动的机制同主备组网下Portal和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
如图23所示,用户使用DHCP动态分配地址方式,通过Portal认证接入网络。接入设备上行链路采用OSPF进行路由学习和发布。接入设备Device A和Device B上均部署多机备份,Device A作为主用设备,Device B作为备用设备。当主设备Device A故障或链路故障时,主设备Device A通过指定的多机备份实例将其上的Portal用户信息备份到备用设备Device B上,从而保证主用设备Device A故障时,主用设备上的Portal业务可以自动切换到备用设备Device B上,已上线的Portal用户不需要重新认证,计费、授权信息不丢失。
图23 Portal支持多机备份典型组网图
在两台设备上将NAT实例与VSRP多机备份实例绑定后,主用设备会自动将本机上的NAT用户表等信息备份到备用设备。当主用设备发生故障时,备用设备能够接替主用设备继续工作,并使用主用设备备份过来的用户表等信息指导本机处理NAT业务,从而提高了NAT业务的可靠性。
NAT支持多机备份基本运行机制如下:
(1) NAT实例与多机备份实例绑定关联后,主用设备通过VSRP备份通道将用户表等信息(用户表中包含地址映射关系等信息)备份到备用设备。
(2) 当多机备份发生正切或回切时,新的主用设备使用本机中的备份用户表等信息进行地址转换,并为首次访问外部网络的流量创建新的用户表等信息。同时将本机的完整用户表等信息备份到备用设备。
在VRRP或S-trunk双活组网下,多机备份仍能确定VSRP的主用设备角色和备用设备角色。NAT业务流量被引到备用设备后,备用设备会通过保护隧道,将NAT业务流量转发给主用设备处理,所以,在VRRP或S-trunk双活组网下,仍是主用设备创建用户表等信息,并将用户表等信息自动备份到备用设备,NAT和VSRP联动的机制同主备组网下NAT和VSRP联动的机制。
如图24所示,为了提高NAT业务的可靠性,Router A和Router B组成VRRP备份组,正常情况下,Router A是VRRP的主节点,Router A上的CGN单板是备份组中的主节点,由Router A上的CGN单板处理NAT业务,并将业务数据备份到Router B设备上的CGN单板。当主节点Router A上CGN单板出现故障时,Router B成为VRRP的主节点,其上的CGN单板也成为备份组的主节点,这时由Router B上的CGN单板处理NAT业务,保证NAT业务不会中断。
将Router A和Router B上的NAT实例与多机备份实例绑定,NAT通过多机备份建立数据备份通道,该数据备份通道用于备份用户表。
图24 1:1双机CGN框间热备组网图
MEC(Multi-access Edge Computing,多接入边缘计算)应用于3GPP(Third Generation Partnership Project,第三代合作伙伴计划)规范的4G或5G网络。
如图25所示,MEGW(Mobile Edge GateWay,移动边缘分流网关)设备部署在基站与核心网之间。通过应用MEC策略,MEGW可以分流本地业务流量,例如,终端用户访问业务时,如果该业务已在本地业务网络部署(一般为用户频繁访问的业务,如视频教学、论坛、邮件服务和FTP服务等),可以由本地业务网络中的业务服务器直接响应,而不再经过核心网处理。
图25 MEC典型组网
MEC支持多机备份功能可以提高MEC业务的可靠性。在基站与核心网之间部署两台MEGW设备,并在两台MEGW设备上配置支持多机备份功能后,主用MEGW设备会自动向备用MEGW设备备份QoS流表、隧道关联表等业务信息。当主用MEGW设备发生故障时,备用MEGW设备能够接替主用MEGW设备继续工作,确保用户业务不会中断。
MEC支持多机备份的基本运行机制如下:
(1) 多机备份确定多机备份实例中两台MEGW设备的主、备用角色。
(2) 主备MEGW设备之间建立业务数据通道,通道为TCP连接。
(3) 业务数据通道成功建立后,主用MEGW设备会通过该业务数据通道,将已生成的所有QoS流表、隧道关联表等业务信息批量备份到备用MEGW设备。同时,主用MEGW设备还会将由实时业务新产生的QoS流表、隧道关联表等业务信息立即备份到备用MEGW设备。
(4) 当发生主备切换(正切或回切)时,新的主用MEGW设备根据之前备份的业务数据执行业务数据转发,并向备用MEGW设备执行一次业务数据批量备份。新的主用MEGW设备继续通过业务数据通道向备用MEGW设备实时备份业务信息。
(5) 此外,当发生备用MEGW重启、数据通道重建等情况时,主用MEGW设备也会向备用MEGW设备批量备份业务数据。
在VRRP或S-trunk双活组网下,多机备份仍能确定VSRP的主用设备角色和备用设备角色,MEC和VSRP联动的机制同主备组网下MEC和VSRP联动的机制,主用设备上的数据会自动备份到备用设备。
同一MEGW设备上只能绑定一个多机备份实例。
为了保证流量的正常切换,且避免频繁切换,请为主、备MEGW设备设置相同的VRRP优先级,并让VRRP备份组工作在抢占模式。
如图26所示,MEC工作在二层组网,MEGW设备使用二层接口分别与基站和核心网相连,使用三层接口与本地业务网络相连。为了提高MEC业务的可靠性,在MEGW A和MEGW B上部署多机备份。MEGW A作为主用设备,MEGW B作为备用设备。当MEGW A发生故障时,由MEGW B接替MEGW A继续工作,保证报文转发不会中断。
图26 MEC支持多机备份二层组网图
如图27所示,MEC工作在三层组网,MEGW设备使用三层接口分别与基站、核心网和本地业务网络相连。为了提高MEC业务的可靠性,在MEGW A和MEGW B上部署多机备份。MEGW A作为主用设备,MEGW B作为备用设备。当MEGW A发生故障时,由MEGW B接替MEGW A继续工作,保证报文转发不会中断。
图27 MEC支持多机备份三层组网图