错误 #3758
由 孙 泽林 在 6 个月 之前添加.
更新于 12 天 之前.
描述
3.0基站,3.1.2pre1T5版本更换3745cu小包
站间环境,终端做下行50M udp业务,同频XN来回切换;中间突然eth2口不通,导致站间xn通信异常,上报A3但是无法切换,导致状态机异常。
网线直连eth2,wireshark抓包arp有发送但是收不到,重启光口后恢复正常通信。
后续压力暂未复现。
历史记录
从抓包上看eth2 网卡会不断的往外发送数据包,但不能接收到数据包。
在光口插拔网线不能引起eth网卡状态的变化, 插拔光口设置会被重置。一会就可以ping通对端。
从泽林的使用环境中看, eth2 网卡的卡舌断了,很容易卡不住。 重新插上后,肉眼能看出往外移动。 重新插拔后,可以恢复通信。 怀疑是环境影响的。
对8.171 eth2 不通时,对eth2进行抓包,不断往外发送arp包,未收到arp返回包,但能收到LLDP包, 突然数据包全能抓到,怀疑跟网络环境有关。
对同一块4008板卡, 用不同的核心网,8.218, 8.219 用iperf 进行压力测试。
对udp 数据包,核心网发送, 4008 接收显示,8.219 只能达到100Mb/s,反向速度可以达到800Mb/s 。8.218正反项速度都可以达到800Mb/s。
对tcp 数据包,速度都可以达到1Gb/s。
用两台基站板卡 进行速度测试,udp 可达 1.4Gb/s, tcp 可达 2.8Gb/s .
现在怀疑 1. 环境 2. 4008网卡驱动。
根据泽林的复现,从核心网发送数据包到基站会出现偶尔丢包的情况, 从基站侧抓包确实没有收到来自核心网的ping包。
需要在核心网,基站两侧同时抓包,确认核心网已发送到基站,且mac地址正确。
在展厅测试的苏州,保山出现emmc卡死的问题时, 测试人员会将两根网线同时接入核心网, 核心网的这两个eth设置的ip相同,会引起4008发送的数据包有问题。在两侧抓包看,4008 发出的arp请求不是广播地址。
导出 Atom
PDF