H3C网管交换机二层流量转发丢包故障排查

1. 故障描述
设备二层转发丢包,即源端和目的端在同一二层网络的同一 VLAN 内,通信过程中有丢包。
2. 常见原因
• 端口下有错包
• 报文因 ACL 规则被丢弃
• 端口处于 block 状态
• 拥塞丢包
3. 故障分析
二层流量转发丢包故障诊断流程图
4. 处理步骤
(1) 查看端口下是否有错包
使用 display interface 命令查看端口下是否有错包。如果有错包,请前往步骤 2,如果没有错包,请前往步骤 3 进行后续步骤的检查。

(2) 端口下有错包
端口下有错包有以下几种可能的故障原因,可使用排除法定位:
. 端口本身硬件故障:通过将连接端口的线缆连接到配置相同且可正常工作的端口查看是否端口本身硬件故障。如果是端口本身硬件故障,请将线缆连接到可正常工作的端口。
. 链路上光模块、光纤或以太网双绞线故障:通过更换完好的光模块、光纤或以太网双绞线定位是否光纤或以太网双绞线故障。如果是光模块、光纤或以太网双绞线故障,请更换完好的光模块、光纤或以太网双绞线。
. 对端配置问题,查看对端速率、双工模式的配置是否和本端一致。如果对端速率和双工模式的配置与本端不一致,请更新配置保证本端和对端速率和双工模式的配置一致。
. 当通过上述方法无法解决错包问题需要联系技术支持时,请先通过如下方法收集信息,然后前往步骤 7。
Probe 视图下,使用 debug port mapping 命令确认面板端口对应的芯片端口。

查到 Twenty-FiveGigE1/0/17 对应的芯片端口名字为 xe24,然后执行下面命令两次或两次以上,查看是否有接收丢包统计(RDBGC)和发送丢包统计(TDBGC)计数。如果有将相关信息反馈技术支持。
(3) 报文因匹配 ACL 被过滤
a. 检查端口、VLAN以及全局下是否配置了 ACL或 QoS 策略,如果配置了 ACL 或 QoS策略,请检查端口进入的报文是否因匹配了 ACL 或 QoS 策略的流分类而被丢弃,包括端口下的packet-filter(使用 display packet-filter 查看)、qos policy(使用 display qos policy查看),vlan policy(使用 display qos vlan-policy 查看)以及 global policy(使用 display qos policy global 查看)。如果报文因匹配了 ACL 或 QoS 策略的流分类而被丢弃,请参考 ACL 或 QoS 的配置方法通过更新配置使报文不被丢弃。
b. 检查是否因匹配一些特性自动创建的的 ACL 而被过滤,在以太网接口视图下使用 display this 命令查看端口下是否配置了下面特性或使用特性相关的具体命令查看:
− 端口是否配置 ip source binding 或 ip verify source,使用 display ip source binding或 display ipv6 source binding 可以查看绑定表项信息。如果端口配置了 ip source  guard 且通过上述 display 命令发现没有匹配报文的表项,请根据您使用的绑定表项的生成方法进一步排查。
− 查看端口是否配置了 Portal 认证,如果配置了 Portal 认证,则没有通过 Portal 认证的用户,报文会被该端口丢弃。使用 display portal interface 可以显示指定 VLAN 接口的Portal 配置信息。请用户根据实际情况确定是否可以取消 Portal 认证,在端口所属 VLAN的对应 VLAN虚接口下使用 undo portal server server-name 可以取消三层 Portal 认证。
− 使用 display dot1x 命令查看端口是否使能了 EAD 快速部署。如果使能了 802.1X 的EAD 快速部署功能,那未认证成功的用户访问除 Free IP 以外的网段时就会丢包。请定位用户是否是未认证成功用户,且未认证成功用户访问的是否是 Free IP 以外的网段来进一步确认丢包原因。
− 端口所在 VLAN 是否配置了 MFF,使用 display mac-forced-forwarding vlan 命令显示指定 VLAN 的 MFF 信息,如果显示信息中没有 Gateway 信息,请根据 MFF 运行的模式查看 ARP Snooping 是否正确配置。
(4) 端口被协议设置为 block 状态
.使用display stp brief命令查看端口是否被STP设置为discarding状态。如果端口被STP设置为 discarding 状态,请根据 STP 的相关配置进一步排查。H3C 建议您将连接终端设备的端口配置为边缘端口或关闭该端口的 STP 功能。
. 如果端口属于某个聚合组,使用 display link-aggregation verbose 命令查看聚合口的详细信息,当该端口 Status 为 Unselected 状态时,该端口无法收发数据报文。请定位端口成为 Unselected 状态的原因,如聚合组内成员端口的属性类配置与参考端口不一致,进一步排查解决。
. 查看端口是否被 Smartlink 阻塞:使用 display smart-link group 命令查看端口状态,当State 为 STANDBY 或 DOWN时端口不能转发数据。如果 State 为 DOWN,请定位端口成为 DOWN 状态的原因,如上行链路上的设备配置了 Monitor Link 功能造成该端口 DOWN,或该端口所在链路连接发生故障或端口被 shutdown,进一步排查解决;如果 State 为STANDBY,请将该设备 Smart Link 组的主、从端口互换。
(5) 配置相关丢包
. 在以太网接口视图下使用 display this 命令查看端口是否在报文所属 VLAN 中。如果端口不在报文所属 VLAN 中,请将端口加入该 VLAN。
. 使用 display mac-address blackhole 命令查看是否因为匹配了黑洞 MAC 地址表项被丢包。请根据实际情况确定是否可以取消该黑洞 MAC。如果需要删除该黑洞 MAC,请使用undo mac-address blackhole mac-address vlan vlan-id 命令删除。
. 使用 display qos lr interface 查看是否有端口限速的配置。如果端口有限速的配置,请查看令牌生成速度和突发流量配置值是否合理,可以通过使用 qos lr { inbound |outbound } cir committed-information-rate [ cbs committed-burst-size ]命令调整令牌生成速度和突发流量配置值定位解决。
.在以太网接口视图下使用 display this 命令查看端口是否有风暴抑制相关配置,包括广播风暴抑制比(broadcast-suppression),组播风暴抑制比(multicast-suppression),未知单播风暴抑制比(unicast-suppression)。如果端口下配置了风暴抑制比,可以通过将风暴抑制比的数值调大定位解决。
(6) 拥塞丢包
通过 display qos queue interface 命令查看端口是否有拥塞丢包。请参考拥塞管理的相关内容定位解决拥塞问题。
(7) 寻求技术支持
如果上述检查完成后故障仍无法排除,请联系 H3C 技术支持

退出移动版
ICP备案号:晋ICP备18007549号-1
站长微信:15534641008