项目

一般

简介

错误 #4235

baseService优化phy的基站服务异常告警的判断逻辑

李 玮璇22 天 之前添加. 更新于 一天 之前.

状态:
已关闭
优先级:
一般
指派给:
开始日期:
2025-10-13
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
YZMM
发现问题版本:
Rel_3.1.3
目标解决问题版本:
Rel_3.1.4

描述

判断PHY核是否挂死的命令修改成test_mem 0xB7E06150 32
如下
root@driver:~# test_mem 0xB7E06150 32
addr = 0xb7e06150,len = 32
phy_addr=0xb7e06150, mmap_addr=0xb7e06000,len = 32
0xb7e06150: 0x00837c0a 0x00000000 0x00837c0a 0x00000000
0xb7e06160: 0x00837c0a 0x00000000 0x00837c0a 0x00000000
取出其中0x00837c0a四个地址信息;
另外之后cu可单独重启,因此为了稳定,增加逻辑:cu在连续3次不在位后再上报cu的服务异常告警

历史记录

#1

李 玮璇 更新于 22 天 之前

  • 指派给 被设置为 李 玮璇
#2

李 玮璇 更新于 6 天 之前

  • 状态新建 变更为 进行中

【问题原因】
phy的心跳检测之前的不准确需要改成test_mem 0xB7E06150 32,检查四项;
但是该检测在reboot后,phy启动还没建立小区的时候phy心跳一直是0x00000000,因此需要排除该场景

【修改方案】
1、添加phy的基站服务异常配置
2、优化phy心跳检测命令为test_mem 0xB7E06150 32,并且排除掉reboot首次启动phy心跳一直为0x00000000的告警;因此reboot后如果没有小区建立,就不上报phy基站服务异常告警
3、基站服务异常告警检测phy、du、cu某个异常只会上报其中一个;因为有cu重启小区重建场景,所以cu的异常服务异常告警是在三次连续监测不到cu才报

【回归方法和注意事项】
在协议栈启动的各种场景下,验证phy和其他的基站服务异常告警是否合理;
穿插baseService重启后,验证phy和其他的基站服务异常告警是否合理;
3秒内只重启cu不会报cu基站服务异常告警,超过3秒才会报

#3

李 玮璇 更新于 6 天 之前

  • 状态进行中 变更为 反馈
  • 指派给李 玮璇 变更为 杨 杨乐
#4

李 玮璇 更新于 6 天 之前

  • 状态反馈 变更为 审视
#5

杨 杨乐 更新于 5 天 之前

  • 状态审视 变更为 转测试
  • 指派给杨 杨乐 变更为 孙 浩
#6

孙 浩 更新于 5 天 之前

  • 状态转测试 变更为 已解决

基于Rel_3.1.3_Pre1T7版本,替换玮璇提供baseService、baseService arm.ini文件后,验证如下场景,都符合预期,问题已解决;

1、三层都启动且正常情况下,phy、du、cu模块不上报任何告警;
2、phy、du、cu模块,某一个或多个模块异常只会上报最先异常的一个告警;
3、然后基站reboot后,三层未启动前,会上报“gnb_du的基站服务异常”告警;
4、在启动三层,三层正常后,“gnb_du的基站服务异常”告警会恢复;
5、触发小区重建后,不上报任何告警;
6、小区去激活后,不应该上报gnb_cu的基站服务异常的任何告警。
#7

孙 浩 更新于 一天 之前

  • 状态已解决 变更为 已关闭

在Rel_3.1.3_Pre1T8版本,验证如下场景,都符合预期,问题关闭。

> 1、三层都启动且正常情况下,phy、du、cu模块不上报任何告警;
> 2、phy、du、cu模块,某一个或多个模块异常只会上报最先异常的一个告警;
> 3、然后基站reboot后,三层未启动前,会上报“gnb_du的基站服务异常”告警;
> 4、在启动三层,三层正常后,“gnb_du的基站服务异常”告警会恢复;
> 5、触发小区重建后,不上报任何告警;
> 6、小区去激活后,不应该上报gnb_cu的基站服务异常的任何告警。

导出 Atom PDF