项目

一般

简介

错误 #4084

3.1.3T5版本测试,du内存耗尽,主动reboot

程 鹏大约 2 个月 之前添加. 更新于 21 天 之前.

状态:
进行中
优先级:
指派给:
类别:
-
开始日期:
2025-09-17
计划完成日期:
2025-10-31
% 完成:

0%

预期时间:
问题归属:
DU
发现问题版本:
Rel_3.1.2
目标解决问题版本:
Rel_3.1.4
FPGA板卡类型:
CPU类型:

描述

3.1.3T5版本测试,7D2U场景,4终端,每终端下行灌包200M,其中一部终端上行灌包200M,确保基站上下行都是峰值运行。大概30分钟左右基站reboot。
du界面不停的打印:SPstWTsk failed get memory event34 size88 listValidBkt:Set0
随后reboot基站


文件

123.jpg (1.28 MB) 123.jpg 程 鹏, 2025-09-17 18:30

历史记录

#1

周 立伟 更新于 大约一个月 之前

  • 状态新建 变更为 进行中

场景:7D2U 双流,4UE;各UE 下行200M,一UE上行200M。
现象:长跑约30分钟~1小时后,PHY的核2挂死,所有上行物理信道全都停止工作,导致DU下行反馈全部DTX,下行用户面数据积压,DU内存耗尽;
处理:1、DU开发UE主动释放功能,(CRC/uci 连续DTX120次,主动发起UE释放),--解决DU内存耗尽问题(已修改验证)
2、需进一步定位此场景下PHY挂死问题(tti=2,tti=4均有此问题)

#2

周 立伟 更新于 22 天 之前

  • 目标解决问题版本Rel_3.1.2 变更为 Rel_3.1.4

DU内存池扩展一个512byte规格内存(51200块),目的是让worker线程的ssTskInfo消息内存从256byte规格中独立出来,避免用户面内存耗尽时影响worker线程的运行。
在du3.0_dev中已修改合入

#3

周 立伟 更新于 22 天 之前

由于更容易出PHY的核2挂死问题,DU内存耗尽问题仍在复现中

#4

周 立伟 更新于 21 天 之前

WORKER线程处理增加异常保护,已合入3.1.3_Pre1T6,待继续复现。

导出 Atom PDF