01-可靠性概述
本章节下载 (145.00 KB)
1 可靠性概述······································································································································ 1-1
1.1 可靠性需求······························································································································ 1-1
1.2 可靠性度量······························································································································ 1-1
1.3 可靠性技术······························································································································ 1-2
1.3.1 故障检测技术················································································································· 1-2
1.3.2 保护倒换技术················································································································· 1-2
随着网络的快速普及和应用的日益深入,各种增值业务(如IPTV、视频会议等)得到了广泛部署,网络中断可能影响大量业务、造成重大损失。因此,作为业务承载主体的基础网络,其可靠性日益成为受关注的焦点。
在实际网络中,总避免不了各种非技术因素造成的网络故障和服务中断。因此,提高系统容错能力、提高故障恢复速度、降低故障对业务的影响,是提高系统可靠性的有效途径。
可靠性需求根据其目标和实现方法的不同可分为三个级别,各级别的目标和实现方法如表1-1所示。
表1-1 可靠性需求的级别
级别 |
目标 |
实现方法 |
1 |
减少系统的软、硬件故障 |
· 硬件:简化电路设计、提高生产工艺、进行可靠性试验等 · 软件:软件可靠性设计、软件可靠性测试等 |
2 |
即使发生故障,系统功能也不受影响 |
设备和链路的冗余设计、部署倒换策略、提高倒换成功率 |
3 |
尽管发生故障导致功能受损,但系统能够快速恢复 |
提供故障检测、诊断、隔离和恢复技术 |
在上述三个级别的可靠性需求中,第1级别需求的满足应在网络设备的设计和生产过程中予以考虑;第2级别需求的满足应在设计网络架构时予以考虑;第3级别需求则应在网络部署过程中,根据网络架构和业务特点采用相应的可靠性技术来予以满足。
通常,我们使用MTBF(Mean Time Between Failures,平均故障间隔时间)和MTTR(Mean Time to Repair,平均修复时间)这两个技术指标来评价系统的可靠性。
MTBF是指一个系统无故障运行的平均时间,通常以小时为单位。MTBF越多,可靠性也就越高。
MTTR是指一个系统从故障发生到恢复所需的平均时间,广义的MTTR还涉及备件管理、客户服务等,是设备维护的一项重要指标。
MTTR的计算公式为:MTTR=故障检测时间+硬件更换时间+系统初始化时间+链路恢复时间+路由覆盖时间+转发恢复时间。公式中各项的值越小,MTTR也就越少,可靠性也就越高。
通过前面的介绍可知,提高MTBF或降低MTTR都可以提高网络的可靠性。在实际网络中,各种因素造成的故障难以避免,因此能够让网络从故障中快速恢复的技术就显得非常重要。本节介绍的各种可靠性技术将主要从降低MTTR的角度,为满足第23级别的可靠性需求来提供技术手段。
可靠性技术的种类繁多,我们根据其解决网络故障的侧重不同,将其大致分为故障检测技术和保护倒换技术两大类。
故障检测技术侧重于网络的故障检测和诊断。CFD、DLDP和以太网OAM都属于链路层的故障检测技术;BFD是一种通用的故障检测技术,可用于各层面的故障检测;NQA用于对网络质量进行诊断和评估;Track通过故障检测的联动机制来与其它可靠性技术进行配合。对这些技术的进一步介绍如表1-2所示。
名称 |
简介 |
详细介绍 |
CFD |
全称Connectivity Fault Detection(连通错误检测),遵循IEEE 802.1ag的CFM(Connectivity Fault Management,连通错误管理)协议和ITU-T的Y.1731协议,是一种二层链路上基于VLAN的端到端OAM(Operation, Administration and Maintenance,操作、管理和维护)机制,主要用于在二层网络中检测链路连通性、确认故障并定位故障 |
可靠性配置指导/CFD |
DLDP |
全称Device Link Detection Protocol(设备链路检测协议),用于监控光纤或铜质双绞线的链路状态。当发现单向链路后,会根据用户配置,自动关闭或通知用户手工关闭相关端口,以防止网络问题的发生 |
可靠性配置指导/DLDP |
以太网OAM |
一种监控网络故障的工具,主要用于解决以太网接入“最后一公里”中常见的链路问题。用户通过在两个点到点连接的设备上启用以太网OAM功能,可以监控这两台设备之间的链路状态 |
可靠性配置指导/以太网OAM |
BFD |
全称Bidirectional Forwarding Detection(双向转发检测),是一个通用的、标准化的、介质无关、协议无关的快速故障检测机制,用于快速检测、监控网络中链路或IP路由的转发连通状况 |
可靠性配置指导/BFD |
NQA |
全称Network Quality Analyzer(网络质量分析),通过发送测试报文,对网络性能、网络提供的服务及服务质量进行分析,并为用户提供网络性能和服务质量的参数,如时延抖动、TCP连接时延、FTP连接时延和文件传输速率等 |
网络管理和监控配置指导/NQA |
Track |
用于实现联动功能。联动功能由应用模块、Track模块和监测模块三部分组成,它通过建立联动项来实现不同模块间的联动,即由监测模块通过Track模块触发应用模块来执行某种操作。监测模块负责对链路状态、网络性能等进行探测,并通过Track模块将探测结果通知给应用模块;应用模块感知到网络状态变化后,及时进行相应处理,从而避免通信的中断或服务质量的降低 |
可靠性配置指导/Track |
保护倒换技术侧重于网络的故障恢复,主要通过对硬件、链路、路由信息和业务信息等进行冗余备份以及故障时的快速切换,从而保证网络业务的连续性。对各种保护倒换技术的具体介绍如表1-3所示。
名称 |
简介 |
详细介绍 |
主备倒换 |
支持该功能的设备上有两块主控板:主用主控板和备用主控板,备用主控板与主用主控板的配置保持一致。当主用主控板发生故障或被拔出时,备用主控板将迅速自动取代主用主控板,以此来保证设备的不间断运行 |
可靠性配置指导/主备倒换 |
以太网链路聚合 |
简称链路聚合,它通过将多条以太网物理链路捆绑在一起成为一条逻辑链路,实现了增加链路带宽的目的,而这些捆绑在一起的链路通过相互间的动态备份,可以有效地提高链路的可靠性 |
二层技术-以太网交换配置指导/以太网链路聚合 |
Smart Link |
实现了双上行组网主备链路的冗余备份,并在主用链路发生故障后使流量能够迅速切换到备用链路上,具备较高的收敛速度 |
可靠性配置指导/Smart Link |
MSTP |
全称Multiple Spanning Tree Protocol(多生成树协议),是一种二层管理协议,它通过选择性地阻塞网络中的冗余链路来消除二层环路,同时还具备链路备份的功能 |
二层技术-以太网交换配置指导/MSTP |
RPR |
全称Resilient Packet Ring(弹性分组环),是一套用来建立IP环网的国际标准,作为一种新型的MAC层技术,它结合以太网的经济性和光纤环网的高带宽、高可靠性等优点于一身,为宽带IP城域网运营商提供了灵活高效的组网方案 |
可靠性配置指导/RPR |
RRPP |
全称Rapid Ring Protection Protocol(快速环网保护协议),是一个专门应用于以太网环的链路层协议。它在以太网环完整时能够防止数据环路引起的广播风暴,而当以太网环上一条链路断开时能迅速恢复环网上各个节点之间的通信通路,具备较高的收敛速度 |
可靠性配置指导/RRPP |
FRR |
全称Fast ReRoute(快速重路由),是一种实现网络局部保护的技术。它通过为主路由或路径建立备份路由或路径,当主路由或路径出现故障时能够迅速切换到备份路由或路径,从而减少网络故障引起的数据丢失。支持该技术的协议有RIP、OSPF、IS-IS、静态路由和RSVP-TE等 |
三层技术-IP路由配置指导、MPLS配置指导/相关协议内容 |
GR |
全称Graceful Restart(平滑重启),是一种保证转发业务在设备进行IP/MPLS转发协议(如BGP、IS-IS、OSPF、LDP和RSVP-TE等)重启或主备倒换时不中断的技术。它需要周边设备的配合来完成路由等信息的备份与恢复 |
三层技术-IP路由配置指导、MPLS配置指导/相关协议内容 |
NSR |
全称Nonstop Routing(不间断路由),是一种保证数据传输在设备进行主备倒换时不中断的技术。它通过将IP/MPLS等转发信息从主用主控板备份到备用主控板,从而在设备进行主备倒换时,无需周边设备配合即可完成上述信息的备份与恢复。支持该技术的协议有IS-IS |
三层技术-IP路由配置指导/IS-IS |
双机热备 |
通过两台设备之间的业务备份,当其中一台设备发生故障时,利用VRRP或动态路由机制将业务流量切换到备份设备,由于该设备已备份有故障设备的业务信息,业务数据便可从该设备上通过,从而在很大程度上避免了网络业务的中断 |
可靠性配置指导/双机热备 |
VRRP |
全称Virtual Router Redundancy Protocol(虚拟路由器冗余协议),是一种容错协议,在具有组播或广播能力的局域网(如以太网)中,使设备出现故障时仍能提供缺省链路,有效地避免了单一链路发生故障后出现网络中断的问题 |
可靠性配置指导/VRRP |
从前面的介绍可知,可靠性技术的种类繁多,面对越来越复杂的网络环境,要想依靠单一的技术来解决所有的可靠性问题几乎无法实现。因此,需要在对网络环境和用户需求进行细致分析的基础上,综合运用各种可靠性技术来提高网络的可靠性。此外,在建网之初还应充分考虑组网的可靠性,譬如:根据业务现状或业务预测,边缘层的节点在接入时应采用冗余备份机制,分别与汇聚层的节点相连;核心层的各节点之间尽量采用全连接的方式,等等。
总之,提高网络可靠性是一个系统工程,需要网络设计和管理者在网络的设计、建设与维护过程中加以全面考虑。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!