错误 #4235
baseService优化phy的基站服务异常告警的判断逻辑
0%
描述
判断PHY核是否挂死的命令修改成test_mem 0xB7E06150 32
如下
root@driver:~# test_mem 0xB7E06150 32
addr = 0xb7e06150,len = 32
phy_addr=0xb7e06150, mmap_addr=0xb7e06000,len = 32
0xb7e06150: 0x00837c0a    0x00000000    0x00837c0a    0x00000000    
0xb7e06160: 0x00837c0a    0x00000000    0x00837c0a    0x00000000
取出其中0x00837c0a四个地址信息;
另外之后cu可单独重启,因此为了稳定,增加逻辑:cu在连续3次不在位后再上报cu的服务异常告警
历史记录
由 李 玮璇 更新于 6 天 之前
- 状态 从 新建 变更为 进行中
 
【问题原因】
phy的心跳检测之前的不准确需要改成test_mem 0xB7E06150 32,检查四项;
但是该检测在reboot后,phy启动还没建立小区的时候phy心跳一直是0x00000000,因此需要排除该场景
【修改方案】
1、添加phy的基站服务异常配置
2、优化phy心跳检测命令为test_mem 0xB7E06150 32,并且排除掉reboot首次启动phy心跳一直为0x00000000的告警;因此reboot后如果没有小区建立,就不上报phy基站服务异常告警
3、基站服务异常告警检测phy、du、cu某个异常只会上报其中一个;因为有cu重启小区重建场景,所以cu的异常服务异常告警是在三次连续监测不到cu才报
【回归方法和注意事项】
在协议栈启动的各种场景下,验证phy和其他的基站服务异常告警是否合理;
穿插baseService重启后,验证phy和其他的基站服务异常告警是否合理;
3秒内只重启cu不会报cu基站服务异常告警,超过3秒才会报
由 孙 浩 更新于 5 天 之前
- 状态 从 转测试 变更为 已解决
 
基于Rel_3.1.3_Pre1T7版本,替换玮璇提供baseService、baseService arm.ini文件后,验证如下场景,都符合预期,问题已解决;
1、三层都启动且正常情况下,phy、du、cu模块不上报任何告警; 2、phy、du、cu模块,某一个或多个模块异常只会上报最先异常的一个告警; 3、然后基站reboot后,三层未启动前,会上报“gnb_du的基站服务异常”告警; 4、在启动三层,三层正常后,“gnb_du的基站服务异常”告警会恢复; 5、触发小区重建后,不上报任何告警; 6、小区去激活后,不应该上报gnb_cu的基站服务异常的任何告警。