项目

一般

简介

错误 #4964

[3.0产品测试] 4UE压力测试中,du出现挂死

黄 毅4 天 之前添加. 更新于 4 天 之前.

状态:
进行中
优先级:
一般
指派给:
开始日期:
2026-03-05
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
DU
发现问题版本:
Rel_3.2.1
目标解决问题版本:
Rel_3.2.1

描述

测试版本:Rel3.2.1_Pre1T2版本
测试设备:军特整机192.168.8.234,网管:192.168.8.181
测试用例:4UE压力测试
基站配置:1D3U
测试终端:星创CPE*4
测试场景:基站启动正常,终端接入做上行业务。每个终端上行灌包100M
问题描述:压力测试中,du出现挂死


文件

20260305-160921.jpg (525 KB) 20260305-160921.jpg 黄 毅, 2026-03-05 16:09
core.WORKER_0_2.rar (45.7 MB) core.WORKER_0_2.rar 黄 毅, 2026-03-05 16:10
coredump调用栈信息.png (60.5 KB) coredump调用栈信息.png 韩 伟, 2026-03-05 17:21
异常ue内存.png (51.7 KB) 异常ue内存.png 韩 伟, 2026-03-05 17:40
站上在线UE信息记录查询.png (9.1 KB) 站上在线UE信息记录查询.png 韩 伟, 2026-03-05 20:56
通过环形队列确认释放UE信息.png (17.7 KB) 通过环形队列确认释放UE信息.png 韩 伟, 2026-03-05 20:56
UE_17116_释放Log.png (42.6 KB) UE_17116_释放Log.png 韩 伟, 2026-03-05 20:57

历史记录

#1

韩 伟 更新于 4 天 之前

该问题已在定位修改中。目前看跑死位置

初步分析原因为:ue实例异常后继续被使用,直接导致挂死。

#2

韩 伟 更新于 4 天 之前

异常ue实例进行解引用时挂死,一下为挂死ue实例内存情况:

#3

韩 伟 更新于 4 天 之前

因为内存已经被修改,无法确定异常ue的rnti信息,暂无法确认该ue是否确实已经被释放了。

#4

韩 伟 更新于 4 天 之前

通过core记录信息,确认ue=0x7d6e09183确实已经释放


后通过core文件记录到的nrupDlMsgQ环形队列中信息,确认释放UE=0x7d6e091830的rnti为17116

#5

韩 伟 更新于 4 天 之前

后再通过Log查找,找到17116终端确实在基站挂死前进行了释放:

#6

韩 伟 更新于 4 天 之前

基于这些信息,可以确认ue=17116已经放生了释放,但是消息队列中还缓存有该ue相关的消息待处理,在ue-17116释放后,ue实例内存释放后,缓存的消息在进行处理时,由于防护不到位,导致访问了已经释放的内存信息,直接导致挂死,针对此问题,对代码进行了修改和防护增强。

导出 Atom PDF