华为S系列交换机二层环路故障原因分析

一、确认是否为近期操作导致
1、确认是否由于近期施工操作引入环路
如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程,特别是新增线路、新增接入设备的细节,结合拓扑结构,确认后排除物理环路。

2、确认是否由于近期修改配置引入的环路
常见的由于修改配置引入环路的命令行如下图:
修改配置引入环路的命令行

二、确认是否属于典型环路问题
1、交换机单端口自环出现环路
在网络部署的过程中,经常出现接口Tx-Rx(Tx表示光纤发送端,Rx表示光纤接收端)自环的问题,比如光纤插错、本接口被高压击坏等情况都可能导致接口Tx-Rx自环。如图所示,Switch的接口发生自环,从而导致从接口发出的报文又环回到本接口,导致流量异常、MAC地址漂移等问题。

交换机自环出现环路

前置条件:交换机未配置STP等破环协议以及LDT环路检测功能

问题现象:端口出方向和入方向流量持续增加。

问题原因:端口自环或者链路环回,即光纤或者网线误接造成单端口收发环回或者设备上两个端口环路。

处理方法:

在端口下去使能loopback internal。
拆除误接的连线。

2、交换机下游设备自环出现环路
如图所示,Switch下挂的网络或设备发生环路,从接口Interface1发出的报文经过Switch下挂网络或设备后被环回至本接口。

下游设备自环出现环路

前置条件:交换机未配置STP等破环协议以及LDT环路检测功能,本端设备未环回。

问题现象:端口入方向和出方向流量持续增大,环回链路在下游设备。

问题原因:下游链路环回或者自环,即下游设备单端口收发环回或者下游设备上两个端口环路

处理方法:

逐跳向下游寻找环路的链路。
在下游设备端口下去使能loopback internal。
拆除误接的连线。

3、交换机双端口环路导致协议震荡
如图所示,Switch所在的网络或Switch不同接口之间形成了环路,从Interface1发出的报文被环回至Interface2。

设备双接口环路示意图

前置条件:设备部署STP、RRPP、SEP或者SMLK等破环协议。

问题现象:环路一段时间收敛正常,一段时间收敛失败,或者持续震荡。

问题原因:网络上链路存在震荡,导致环网协议报文转发失败,反复超时震荡。比如:

链路存在丢包、错包,即协议报文被丢弃。
未知单播抑制、不合理的QoS等配置导致协议报文被丢弃。
处理方法:
如出现错包、丢包,建议更换问题网线、光纤或者光模块。
如因为被配置抑制功能导致丢包,建议修改单播抑制和不合理的QoS配置。
观察当前网络带宽,确认是否是网络流量拥塞,导致协议报文丢失,超时放开堵塞端口导致临时环路,此类问题需要进行网络优化。

4、下游设备报文转发异常导致伪环路问题
上面列举的二层环路现象描述主要是由于组网和配置产生了环路。现网中还存在由于单产品报文特殊转发或者是和其他厂商对接产生了类似环路的现象描述,例如出现流量突发、MAC地址漂移告警、协议报文拥塞等,但故障本质并非环路,这类现象被称为伪二层环路类故障,如下图所示。

交换机对接其他厂商设备导致报文转发异常形成环路

前置条件:二层网络环路收敛正常,堵塞端口状态下发正常

问题现象:在交换机LSW3形成频繁的MAC地址漂移告警,出现疑似环路现象描述。

问题原因:二层网络的边缘设备,由于个别厂家实现差异,对于无法处理的报文,会反弹转发,常见的对端设备有机顶盒等。

处理方法:由于报文反弹,此类问题非交换机自身问题,需要客户更换边缘设备解决。

 

ICP备案号:晋ICP备18007549号-1
站长微信:13613567205