项目

一般

简介

错误 #4084

3.1.3T5版本测试,du内存耗尽,主动reboot

程 鹏5 个月 之前添加. 更新于 大约一个月 之前.

状态:
已解决
优先级:
指派给:
开始日期:
2025-09-17
计划完成日期:
2025-10-31
% 完成:

0%

预期时间:
问题归属:
DU
发现问题版本:
Rel_3.1.2
目标解决问题版本:
Rel_3.1.4

描述

3.1.3T5版本测试,7D2U场景,4终端,每终端下行灌包200M,其中一部终端上行灌包200M,确保基站上下行都是峰值运行。大概30分钟左右基站reboot。
du界面不停的打印:SPstWTsk failed get memory event34 size88 listValidBkt:Set0
随后reboot基站


文件

123.jpg (1.28 MB) 123.jpg 程 鹏, 2025-09-17 18:30

历史记录

#1

周 立伟 更新于 4 个月 之前

  • 状态新建 变更为 进行中

场景:7D2U 双流,4UE;各UE 下行200M,一UE上行200M。
现象:长跑约30分钟~1小时后,PHY的核2挂死,所有上行物理信道全都停止工作,导致DU下行反馈全部DTX,下行用户面数据积压,DU内存耗尽;
处理:1、DU开发UE主动释放功能,(CRC/uci 连续DTX120次,主动发起UE释放),--解决DU内存耗尽问题(已修改验证)
2、需进一步定位此场景下PHY挂死问题(tti=2,tti=4均有此问题)

#2

周 立伟 更新于 4 个月 之前

  • 目标解决问题版本Rel_3.1.2 变更为 Rel_3.1.4

DU内存池扩展一个512byte规格内存(51200块),目的是让worker线程的ssTskInfo消息内存从256byte规格中独立出来,避免用户面内存耗尽时影响worker线程的运行。
在du3.0_dev中已修改合入

#3

周 立伟 更新于 4 个月 之前

由于更容易出PHY的核2挂死问题,DU内存耗尽问题仍在复现中

#4

周 立伟 更新于 4 个月 之前

WORKER线程处理增加异常保护,已合入3.1.3_Pre1T6,待继续复现。

#5

程 鹏 更新于 大约一个月 之前

  • 项目2.0基站产品化测试 变更为 3.0基站产品测试
#6

周 立伟 更新于 大约一个月 之前

  • 状态进行中 变更为 审视

已修改走查验证通过,并合入3.1.3版本。

#7

周 立伟 更新于 大约一个月 之前

  • 状态审视 变更为 转测试
  • 指派给周 立伟 变更为 程 鹏

验证通过,可转测。

#8

程 鹏 更新于 大约一个月 之前

  • 状态转测试 变更为 已解决

导出 Atom PDF