、    

 

华为S系列交换机有线接入认证异常【802.1X认证失败】认证域及相关配置错误

执行命令display authentication mode确认NAC配置模式:
unified-mode:统一模式。
common-mode:传统模式。

统一模式

统一模式下,认证域之间存在优先级,终端在优先级高的认证域中进行认证:指定接入类型的强制域 > 非指定接入类型的强制域 > 用户名中携带的合法域 > 指定接入类型的默认域 > 非指定接入类型的默认域 > 全局默认域。

首先确认认证接口下绑定的认证模板是否通过access-domain指定了默认域或强制域,然后再确认全局默认域。可以执行以下步骤进行检查。

1、执行命令display authentication-profile configuration检查认证模板下认证域是否配置。

执行命令display authentication-profile configuration检查认证模板下认证域是否配置

●未配置时,请确认是否需要配置。如果无需配置,请执行步骤2;如果需要配置,请在认证模板视图下执行命令access-domain domain-name dot1x [ force ]。

●已配置时,请确认配置是否正确。如果不正确,请在认证模板视图下执行命令access-domain domain-name dot1x [ force ]。

2、执行命令display aaa configuration确认全局默认域。

执行命令display aaa configuration确认全局默认域。

根据全局默认域,执行命令display domain name domain-name确认该域下的认证、计费方案以及绑定的认证服务器配置。

传统模式

认证域之间存在优先级,终端在优先级高的认证域中进行认证:接口下指定的802.1X认证域 > 用户名中携带的合法域 > 全局默认域。

先确认接口下是否指定了802.1X认证域,最后再确认全局默认域。可以执行以下步骤进行排查。

1、执行命令display current-configuration | include dot1x domain查看802.1X认证用户强制域是否配置

执行命令display current-configuration | include dot1x domain查看802.1X认证用户强制域是否配置

●如果未配置,请在接口视图下执行命令dot1x domain domain-name。
●如果已配置,请执行步骤2。

2、执行命令display aaa configuration确认全局默认域。

执行命令display aaa configuration确认全局默认域。

根据全局默认域,执行命令display domain name domain-name确认该域下的认证、计费方案以及绑定的认证服务器配置。

执行命令display domain name domain-name确认该域下的认证

然后执行命令display authentication-scheme、display accounting-scheme、display radius-server configuration template确认配置是否正确。如果不正确,请执行相应的命令修改。

华为S系列交换机二层环路故障【配置不合理:交换机和S6500 RSTP互连端口DOWN后重新UP,但RSTP无法快速收敛】

组网情况
如图所示,两台S6500和Switch组成RSTP环,稳定状态下阻塞点为Switch与S6500-2相连的端口

Switch和S6500 RSTP互连端口DOWN了重新UP后RSTP无法快速收敛组网图

Switch和S6500 RSTP互连端口DOWN了重新UP后RSTP无法快速收敛组网图

现象描述
通过shutdown S6500-1与Switch相连的端口,再恢复该端口来检查RSTP快速收敛机制,发现S6500-1与Switch之间的链路恢复后,S6500-1与Switch的端口一直为discarding状态,30s后才转换为forwarding状态。

原因分析

使用命令debugging stp all,查看Flags字段是否有Agreement标记,如下只有Proposal

使用命令debugging stp all,查看Flags字段是否有Agreement标记

S6500-1与Switch相连的端口UP后,S6500-1发出的Proposal报文,没有携带Agreement标记,导致接口无法快速迁移,即Proposal/Agreement机制不生效。

操作步骤

在Switch与S6500相连的接口下配置stp no-agreement-check

建议与总结

当Switch和其他厂商的设备进行互通时,需要根据其他厂商设备的Proposal/Agreement机制,使用stp no-agreement-check命令来选择接口使用增强的快速迁移机制还是普通的快速迁移机制。

华为S系列交换机二层环路故障【配置不合理:多实例配置错误RRPP破环失败故障案例】

组网情况
如图所示,SwitchA、SwitchB和SwitchC构成RRPP环,SwitchB是环上主节点,SwitchC和SwitchA是环上的传输节点,SwitchA、SwitchB和SwitchC上的保护VLAN保护实例0下的VLAN。

多实例配置错误RRPP破环失败组网图

多实例配置错误RRPP破环失败组网图

现象描述
部署主节点SwitchB时,未关注设备上的多实例配置,导致非0实例下的VLAN数据成环,造成很多接入设备脱管。

原因分析

1、检查SwitchB上RRPP的配置。
执行命令display current-configuration configuration rrpp-domain-region查看RRPP域的配置。

检查SwitchB上RRPP的配置

2、检查多实例配置
执行命令display stp region-configuration查看SwitchB的多实例配置。

检查多实例配置

3、检查VLAN配置
执行命令display vlan查看实例1中的VLAN下的接口。

SwicthB的配置如下:

检查VLAN配置

SwitchC的配置如下:

SwitchC的配置如下

SwitchA的配置如下:

SwitchA的配置如下

发现环上的每个接口都允许VLAN 2500通过,且有环外的端口也允许VLAN 2500通过,VLAN 2500在实例1下,RRPP环保护实例0下的VLAN,导致VLAN 2500的数据成环。

操作步骤

此案例中,部署RRPP环的目的是保护所有VLAN,可以将实例1删除。以SwitchB为例

部署RRPP环的目的是保护所有VLAN,可以将实例1删除

建议与总结

部署RRPP环的时候,需要关注设备之前的多实例配置是否对部署有影响。

华为S系列交换机二层环路故障【配置错误:交换机上SmartLink主从切换后流量中断】

组网情况
如图所示,交换机SwitchA上配置SmartLink,接口GE1/0/2和GE1/0/3分别为主接口和从接口。

交换机上SmartLink主从切换后流量断流问题案例组网图

交换机上SmartLink主从切换后流量断流问题案例组网图

现象描述
SwitchA上SmartLink因为接口GE1/0/2链路故障发送主从切换后发生断流,必须手动刷新MAC和IP地址,业务才可以恢复正常。

原因分析

当Smart Link组发生链路切换时,原有的转发表项将不适用于新的拓扑网络,需要整网进行MAC表项和ARP表项的更新。这时,Smart Link组通过发送Flush报文通知其他设备进行地址表的刷新操作。必须在上行设备配置Flush报文接收功能,才能正常接收刷新的MAC表项和ARP表项,否则无法正常接收下游设备发送的Flush报文,链路切换后无法正常转发报文。

对于该问题,SwitchD上对应的端口上没有配置接受Flush报文,当SwitchA切换的时候发送的Flush报文到SwitchD,SwitchD没有刷新对应的ARP表项(应该从SwitchA的GE1/0/2刷新到SwitchA的GE1/0/3),经过SwitchD的流量还是发送到切换前的链路,但是原来链路已经阻塞,报文无法通过,导致流量中断。

操作步骤

在SwitchB、SwitchC和SwitchD三台设备主、备链路上的接口下(即SwitchB的接口GE1/0/2和GE1/0/3、SwitchC的接口GE1/0/3和GE1/0/4、SwitchD的接口GE1/0/4和GE1/0/5)查看是否配置了命令:smart-link flush receive control-vlan vlan-id。

经过查看,发现没有相关的命令,在SwitchB、SwitchC和SwitchD三台设备主、备链路上的接口下配置命令:smart-link flush receive control-vlan vlan-id,且配置的Flush控制VLAN和密码与SwitchA上配置发送的相关信息必须相同。

建议与总结

只有为接口配置了控制VLAN编号并将接口加入该VLAN,接口才能接收到Flush报文。

并非需要在相关设备的所有接口上都配置从指定控制VLAN接收Flush报文功能,只有那些处于从Smart Link设备到其目的设备主、备链路上的接口才需进行此配置。

华为S系列交换机二层环路故障【配置错误:交换机误配置loopback internal导致环路】

组网情况
如图所示,Switch通过L2 Switch交换机下挂PC用户,PC用户希望访问内网服务器Server。

交换机误配置loopback internal导致环路故障案例组网图

交换机误配置loopback internal导致环路故障案例组网图

现象描述
当Switch下挂PC用户访问服务器Server时,发现丢包严重,业务中断。

原因分析
设备上存在loopback internal误配置,导致MAC漂移,通信异常。

操作步骤
1、删除L2 Switch上误配置的loopback internal。

在Switch的VLAN视图下执行命令loop-detect eth-loop alarm-only,使能MAC-Flapping检测机制。

2、执行命令display trapbuffer,查看告警信息,找寻是否存在MAC Flapping以及漂移的端口告警。通过告警得知Switch上接口GE0/0/1下接口存在MAC漂移,可以先排查下游设备配置。

3、登录L2 Switch设备,执行命令display current-configuration,查询L2 Switch接口配置,发现有接口下配置了loopback internal,导致Server的MAC地址学习到Switch与L2 Switch相连的端口。

建议与总结
对于二层转发丢包,MAC漂移是较常见的一种原因。当出现此类问题时,可以查看设备是否发生了MAC漂移,并排除此故障。

华为S系列交换机二层环路故障【配置错误:未关注多实例配置部署RRPP环导致环路】

组网情况
如图所示,SwitchA、SwitchB和SwitchC构成RRPP环,SwitchB是环上主节点,SwitchC是环上的传输节点,SwitchA上的端口GE2/0/4和GE1/0/5允许RRPP环的控制VLAN 2515通过,SwitchB和SwitchC上的保护VLAN保护实例0下的VLAN。

未关注多实例配置部署RRPP环导致环路组网图

未关注多实例配置部署RRPP环导致环路组网图

现象描述
部署主节点SwitchB时,未关注设备上的多实例配置,导致非0实例下的VLAN数据成环,造成非常多的接入设备脱管。

原因分析

1、检查SwitchB上RRPP的配置。

2、执行命令display current-configuration configuration rrpp-domain-region,查看RRPP域的配置。

查看RRPP域的配置

3、检查多实例配置
执行命令display stp region-configuration,查看SwitchB的多实例配置。

检查多实例配置

4、检查VLAN配置
执行命令display vlan,查看实例1中的VLAN对应的接口信息。

检查VLAN配置

5、SwitchB的配置如下:

SwitchB的配置

6、SwitchC的配置如下:

SwitchC的配置如下

分析上述回显信息,发现环上的每个接口都允许VLAN 2500通过,且有环外的端口也允许VLAN 2500通过,VLAN 2500在实例1下,而RRPP协议保护是实例0下的VLAN,导致VLAN 2500的数据成环。

操作步骤

部署RRPP环的目的是保护所有VLAN,因此可以将实例1删除。以SwitchB为例。

部署RRPP环的目的是保护所有VLAN,因此可以将实例1删除

建议与总结
部署RRPP环的时候,需要关注设备之前的多实例配置是否对部署影响。

华为S系列交换机二层环路故障【配置错误:RRPP环网链路切换传输节点无法登录】

组网情况
如图所示,SwitchA作为RRPP环的主节点,正常情况下GE1/0/0为Primary port、GE2/0/0为Secondary port(block)。

RRPP环网链路切换传输节点无法登录案例组网图

RRPP环网链路切换传输节点无法登录案例组网图

现象描述
当某个传输节点的Primary port down了再恢复后,此传输节点以及环上后面的节点会无法登录,几分钟后恢复

原因分析
RRPP主节点和传输节点RRPP工作模式不一致,主节点RRPP为GB模式,传输节点RRPP为HW模式,导致传输节点无法正常处理主节点的FLUSH报文。

操作步骤
查看设备的RRPP工作模式是GB还是HW模式:即配置是rrpp working-mode gb,还是rrpp working-mode hw。

执行display rrpp brief命令查看RRPP Working Mode字段,查看环上RRPP点该字段是否一致。

<Quidway> display rrpp brief
Abbreviations for Switch Node Mode :
M – Master , T – Transit , E – Edge , A – Assistant-Edge
RRPP Protocol Status: Disable
RRPP Working Mode: HW
RRPP Linkup Delay Timer: 1 sec (0 sec default)
Number of RRPP Domains: 1

建议与总结
出现该问题时,先查看下设备的MAC表和ARP表切换前后表项是否正常刷新了,如果没有则检查RRPP模式是否一致。

华为S系列交换机二层环路故障【配置错误:RRPP主节点模式和其他传输节点模式不一致,导致不能刷新MAC表项】

组网情况
如图所示,SwitchA、SwitchB、SwitchC和SwitchD构成RRPP环,SwitchA是主节点,SwitchB、SwitchC和SwitchD为传输节点。

RRPP主节点模式和其他传输节点模式不一致组网图

RRPP主节点模式和其他传输节点模式不一致组网图

现象描述
RRPP主节点SwitchA上配置的RRPP模式是国标模式,SwitchB、SwitchC和SwitchD上使用的是默认的华为模式。当传输节点出现故障后,RRPP主节点SwitchA发送的common或者complete报文在传输节点上不处理,导致MAC和ARP没有刷新,流量受到影响

原因分析
1、判断RRPP的主节点为SwitchA:
<SwitchA> display rrpp verbose domain 1
Domain Index : 1
Control VLAN : major 2 sub 3
Protected VLAN : Reference Instance 1
Hello Timer : 1 sec(default is 1 sec) Fail Timer : 6 sec(default is 6 sec)
RRPP Ring : 2
Ring Level : 1
Node Mode : Master //这个表示是RRPP主节点

2’、查看RRPP主节点SwitchA的配置:
rrpp working-mode GB //配置RRPP工作模式为国际模式
rrpp enable
RRPP其他传输节点配置为:

rrpp enable //没有配置工作模式,就是默认的华为工作模式。

由上述配置可以看出:RRPP主节点SwitchA全局配置RRPP的工作模式为国标模式(rrpp working-mode GB),其他传输节点是默认的配置(默认配置为华为模式)

建议与总结
RRPP环上所有节点都必须配置一样的工作模式,要么都为默认的华为工作模式,要么都配置为国标模式。

华为S系列交换机二层环路故障【配置错误:部署RRPP多实例未考虑端口默认加入VLAN1导致RRPP临时环路】

组网情况
如图所示,SwitchA、SwitchB、SwitchC和SwitchD构成RRPP环。开始规划的时候,RRPP环保护VLAN10和VLAN20的数据,将VLAN10和VLAN20加入到实例1,保护VLAN配置引用实例1。

部署RRPP多实例未考虑端口默认加入VLAN1导致RRPP临时环路组网图

部署RRPP多实例未考虑端口默认加入VLAN1导致RRPP临时环路组网图

现象描述
在上述组网中,VLAN1数据成环。

原因分析
1、执行命令display current-configuration interface GigabitEthernet 1/0/1查看RRPP环上的端口下配置,没有undo port trunk allow-pass vlan 1说明端口默认加入了VLAN1。
[SwitchA] display current-configuration interface GigabitEthernet 1/0/0
#
interface GigabitEthernet1/0/0
port link-type trunk
port trunk allow-pass vlan 10 20
stp disable
#
return

2、执行命令display stp region-configuration,查看多实例划分情况。
[SwitchA] display stp region-configuration
Oper configuration
Format selector :0
Region name :00e084701700
Revision level :0

Instance VLANs Mapped
0 1 to 9, 11 to 19, 21 to 4094
1 10, 20

3、执行命令display current-configuration configuration rrpp-domain-region,查看RRPP的相关配置,RRPP域保护实例1中的VLAN,VLAN1不在实例1下,RRPP环不能保护VLAN1的数据,导致VLAN1的数据在RRPP环上没有破环,造成环路。
[SwitchA] display current-configuration configuration rrpp-domain-region
#
rrpp domain 1
control-vlan 1025
protected-vlan reference-instance 1
ring 1 node-mode transit primary-port GigabitEthernet1/0/1 secondary-port GigabitEthernet1/0/2 level 0
ring 1 enable
#
return

操作步骤

有以下2种方法解决VLAN1的环路问题:

方法一:在SwitchA、SwitchB、SwitchC和SwitchD上,将VLAN1规划到实例1中。以下以SwitchA为例。

在SwitchA、SwitchB、SwitchC和SwitchD上,将VLAN1规划到实例1中

方法二:如果VLAN1没有用处,可以将接入RRPP环的端口下的VLAN1删除。以下以SwitchA为例。

[SwitchA] interface GigabitEthernet1/0/1
[SwitchA-GigabitEthernet1/0/1] undo port trunk allow-pass vlan 1

建议与总结
在规划RRPP环保护VLAN的时候,需要关注端口下默认加入VLAN1的情况,防止没有将VLAN1规划到保护VLAN中,造成环路。

华为S系列交换机二层环路故障【配置错误:两端设备配置的MSTP报文的协议格式不一致导致端口DOWN】

组网情况
如图所示,Switch-1、Switch-2与两台H3C S6500组成MSTP环。

 两端设备MSTP报文的协议格式不一致导致端口DOWN组网图

 两端设备MSTP报文的协议格式不一致导致端口DOWN组网图

现象描述
将Switch-1整机重启并重新上电后,S6500-1的GE0/0/4端口会自动shutdown,必须手动undo shutdown才能恢复。且设备上打印如下告警:设备上打印如下告警

原因分析
Switch和S6500互连端口均没有配置MSTP报文的协议格式,使用默认值。但是默认值不一致,导致S6500接口被Shutdown。

Switch端口的MSTP报文的协议格式stp compliance默认为auto并发送dot1s格式报文,S6500默认发送legacy格式报文。S6500端口UP后连续发送3个legacy报文,Switch端口UP后发送1个dot1s报文,S6500回复1个dot1s报文,Switch回复S6500的legacy报文,后续两端交互dot1s报文。

S6500在进行报文格式检查时有特殊的处理机制:10秒内收到的legacy和dot1s报文都大于等于3个时,将端口Shutdown。

操作步骤
1、在Switch整机启动端口UP后,在S6500上执行命令display stp interface,查看直连UP端口的信息,发现MSTP BPDU format为legacy:

查看直连UP端口的信息

2、执行命令stp compliance legacy,将Switch连接S6500的端口强制配置为legacy模式。

建议与总结

在与其他厂商设备对接时,需要关注对端接口收发MSTP报文的协议格式是否默认为auto,是否有特殊的检查机制。

当Switch端口配置为非auto格式,端口收到的报文格式与配置不一致时,打印如下日志:

MSTP/3/PACKET_ERR_COMPLIAN:The port compliance protocol type of the packet received by MSTP from the port [port-name] is invalid.

出现该情况后,建议按照如下方法处理:

1、使用获取报文工具记录收到的错误报文。

2、记录查询对端的接口信息,如设备厂商、版本、配置。
如果是华为设备,使用命令display version,display interface或display current-configuration查询设备的版本、配置等。
如果是其他厂商设备,则根据该厂商的设备命令获取信息。

3、由于此时MSTP收到非法报文,计算出来的STP状态错误,有可能导致出现二层环路(使用display stp brief命令查看接口STP状态,可确认是否存在环路),建议先shutdown接口,防止形成广播风暴。确认不存在环路后,使用undo shutdown命令恢复接口。

ICP备案号:晋ICP备18007549号-1