故障现象
某地区如下所示的三个站点设备不定期出现脱管和业务中断现象。
故障分析
因为三个站点成环形,很可能是由于广播风暴造成的脱管和业务中断。
故障处理
1、查询设备上的告警信息,有大量的ARP冲突告警,如下所示。
An alarm 19714 level 6 occurred at 14:28:01 02/08/2001 UTCsent by MCP %ARP%
The arp packet of mac address 4cac.0ad6.2dd2, which conflicts with our mac address of vlan1538, is discarded
An alarm 19714 level 6 occurred at 14:27:54 02/08/2001 UTCsent by MCP %ARP%
The arp packet of mac address 4cac.0ad6.2dd2, which conflicts with our mac address of vlan2, is discarded
An alarm 19714 level 6 occurred at 14:27:54 02/08/2001 UTCsent by MCP %ARP%
The arp packet of mac address 4cac.0ad6.2dd2, which conflicts with our mac address of vlan2, is discarded
An alarm 19714 level 6 occurred at 13:43:34 02/08/2001 UTCsent by MCP %ARP%
The arp packet of mac address 4cac.0ad6.2dd2, which conflicts with our mac address of vlan430, is discarded
An alarm 19714 level 6 occurred at 13:43:34 02/08/2001 UTCsent by MCP %ARP%
The arp packet of mac address 4cac.0ad6.2dd2, which conflicts with our mac address of vlan430, is discarded
其中VLAN2和VLAN430为管理VLAN,VLAN1538为语音业务VLAN,MAC地址为设备自身的MAC地址。
2、查询设备上联口的统计信息,查询结果如下所示。
CB620MD2-M01Z-C-EG#show interface gei_1/20/1
gei_1/20/1 is up,line protocol is up
Description is none
Keepalive set:10 sec
The port negotiation is disable
The port is optical
Duplex full
scramble payload-enable
VLAN mode is hybrid, pvid 1 BW 1000000 Kbits
Last clearing of "show interface" counters never
120 seconds input rate :74816215 Bps, 1115277 pps
120 seconds output rate: 103095426 Bps, 1040299 pps
Interface peak rate:
input104982336 Bps, output105363991 Bps
Interface utilization: input-2147483648%,output-2147483648%
Input:
Packets: 2081483551 Bytes : 148150310680
Unicasts: 2077721517 Multicasts: 3632835
Broadcasts: 129197Undersize: 0
Oversize: 3 CRC-ERROR: 1
Dropped: 223Fragments: 1
Jabber : 0 MacRxErr : 0
Output:
Packets: 2858008473 Bytes : 221967894161
Unicasts: 2824177468 Multicasts: 33675832
Broadcasts: 155173Collision: 0
LateCollision: 0 SingleCollision: 0
MultCollision: 0 Dropped: 7071
Input detail:
64B : 1652263148 65-127B: 406754315
128-255B: 17380865256-511B : 1613828
512-1023B : 1224242 1024-2047B: 2249705
经查询,上联口的输入输出速率以及端口利用率数据非常大。经分析,正是因为广播风暴原因导致设备发出的包经过环路后又返回至本设备,数据携带的源MAC地址没变,因此产生MAC地址冲突告警。而大量数据在环路中不停的增加和转发,导致上联口的统计数据非常高,远超出端口本身的性能极限。
3、开启所有网元的STP功能,解决环型网络的产生。
STP生成树计算需要环内所有设备都参与,因此需要保证环内的交换机设备也开启相同的STP功能,否则会导致生成树失效。对于SW为其他厂商的设备,ZXA10 C300M提供了修改BPDU包类型的命令【
spanning-tree packet-type】 以保证STP计算的正确性。
开启ZXA10 C300M的RSTP功能(如果存在多个VLAN建议开启MSTP功能),开启命令如下。
C300M(config)#spanning-tree enable
C300M(config)#spanning-tree mode rstp
C300M(config)#interface gei_1/19/1
C300M(config-if)#spanning-tree enable
C300M(config)#interface gei_1/20/1
C300M(config-if)#spanning-tree enable
NOTE:
针对广播风暴关闭其中一个站点的一个端口,同时清理MAC地址表可以使网管和业务立刻恢复正常,但是这样不能实现环路拓扑的保护功能。因此建议在网络中开启STP功能,解决环形链路的产生。
总结
对于环状网络,建议在全网设备中开启STP功能,防止环形链路的产生。
扫码关注5G通信官方公众号,免费领取以下5G精品资料
1、回复“YD5GAI”免费领取《中国移动:5G网络AI应用典型场景技术解决方案白皮书》
2、回复“5G6G”免费领取《5G_6G毫米波测试技术白皮书-2022_03-21》
3、回复“YD6G”免费领取《中国移动:6G至简无线接入网白皮书》
4、回复“LTBPS”免费领取《《中国联通5G终端白皮书》》
5、回复“ZGDX”免费领取《中国电信5G NTN技术白皮书》
6、回复“TXSB”免费领取《通信设备安装工程施工工艺图解》
7、回复“YDSL”免费领取《中国移动算力并网白皮书》
8、回复“5GX3”免费领取《 R16 23501-g60 5G的系统架构1》