项目

一般

简介

错误 #2920

du2phy挂死,phy连续打印DU2PHY_api_error_check_use_empty_channels字段20次导致phy被拉死,主要原因为du内存分配失败问题导致

程 鹏2 个月 之前添加. 更新于 25 天 之前.

状态:
转测试
优先级:
普通
指派给:
类别:
-
开始日期:
2025-03-04
计划完成日期:
2025-03-31
% 完成:

0%

预期时间:
问题归属:
DU, PHY, 系统
发现问题版本:
Rel_2.1.16P
目标解决问题版本:
Rel_2.1.16P
FPGA板卡类型:
CPU类型:

描述

du2phy挂死,phy连续打印DU2PHY_api_error_check_use_empty_channels字段20次导致phy被拉死,主要原因为du内存分配失败问题导致


文件

2222222.jpg (1.78 MB) 2222222.jpg 程 鹏, 2025-03-04 16:47
1111111.jpg (2.71 MB) 1111111.jpg 程 鹏, 2025-03-04 16:47
3333333.jpg (1.78 MB) 3333333.jpg 程 鹏, 2025-03-04 16:47
4444444.jpg (2.51 MB) 4444444.jpg 程 鹏, 2025-03-04 16:47

历史记录

#1

由 匿名用户 更新于 大约 2 个月 之前

该问题现象为同频组网测试场景,长跑一段时间之后,一个大小为96的内存块,在某一点之后就出现只增不减的情况,也就是刚开始做业务的时候96大小的内存块还是有增有减的,所以推测大概率是在某一个点走到了异常的分支,需找到内存开始只增不减的拐点的日志分析。
该问题暂未复现;

#2

由 匿名用户 更新于 大约 2 个月 之前

  • 状态新建 变更为 进行中
  • 指派给匿名用户 变更为 周 立伟
#3

周 立伟 更新于 大约一个月 之前

已定位为空口质量差,4UE接入后,上下行业务反馈全错,无状态报告反馈,导致内存均积压在RLC队列中未释放而出现内存耗尽情况。

规避方案:基于17P_T1对DU所有规格的共享内存进行内存耗尽监测,如果某一规格的内存出现耗尽且连续3分钟不恢复,DU上报此告警,通知agent重启3层。

#4

周 立伟 更新于 大约一个月 之前

  • 指派给周 立伟 变更为 韩 伟
#5

韩 伟 更新于 大约一个月 之前

在DU侧已做内存监控,当du相关两个内存块占用到一定门限,会在F1口进行丢包,给DU预留一定量的内存块供使用,防止对内存块的使用量太大,影响其他点申请内存,以防du2phy跑死。代码已合入。

#6

周 立伟 更新于 29 天 之前

MAC上行RLF定时器存在不超时处理问题,属定时器机制存在问题。MAC上行RLF暂时不采用定时器触发;设置crc_fail上限为120,超过120次就发起上行RLF流程。
已修改待合入,验证中。

#7

韩 伟 更新于 25 天 之前

  • 状态进行中 变更为 转测试

基于F1口下行的内存监控功能验证合入。

#8

韩 伟 更新于 25 天 之前

  • 指派给韩 伟 变更为 王 旭初

导出 Atom PDF