项目

一般

简介

错误 #4348

3.1.3T5版本测试,4UE场景DU COREDUMP问题 timer list内存被踩导致du挂死

程 鹏大约 2 个月 之前添加. 更新于 大约一个月 之前.

状态:
已解决
优先级:
指派给:
开始日期:
2025-10-30
计划完成日期:
2025-11-30
% 完成:

0%

预期时间:
问题归属:
DU
发现问题版本:
Rel_3.1.3
目标解决问题版本:
Rel_3.1.3

描述

4UE场景有一个DU COREDUMP问题 timer list内存被踩


文件

corestack.png (37.6 KB) corestack.png 韩 伟, 2025-10-30 10:32
corestack.png (37.6 KB) corestack.png 韩 伟, 2025-10-30 10:33
异常节点内存块快照.png (33.7 KB) 异常节点内存块快照.png 韩 伟, 2025-10-30 11:01
正常节点内存块快照.png (32.4 KB) 正常节点内存块快照.png 韩 伟, 2025-10-30 11:01
正常节点内存块快照.png (32.4 KB) 正常节点内存块快照.png 韩 伟, 2025-10-30 11:01

历史记录

#1

周 立伟 更新于 大约 2 个月 之前

  • 指派给周 立伟 变更为 魏 幸幸
#2

周 立伟 更新于 大约 2 个月 之前

  • 指派给魏 幸幸 变更为 韩 伟
#3

韩 伟 更新于 大约 2 个月 之前

该问题coredump解析,显示在处理定时器消息过程中异常。

#4

韩 伟 更新于 大约 2 个月 之前

corestack:

#5

韩 伟 更新于 大约 2 个月 之前

core记录数据分析,显示链表:
(gdb) p *(CmTqType *) 0xe7a5a8
$9 = {
first = 0x7d4a5bb164,
tail = 0x7d4b9b4430
}
中存在一个异常节点
(gdb) p *(CmTimer *) 0x7d4a5bb164
$18 = {
tmrEvnt = 125,
tqExpire = 50331649,
cb = 1247523124,
next = 0x0,
prev = 0xffffffff00000000,
ent2bUpd = 0 '\000',
entIdx = 0
}
链表中其他节点均正常,当处理到这个异常节点访问其内存时挂死,通过现有定时器机制分析及异常内存块分析,该定时器内存块应该已经释放掉了,又被其他位置申请,并进行修改,即链表中维护的这个异常节点为残留节点,需要对链表中的节点进行合法性校验,同时也需要自动对链表中异常残留节点进行删除,保障链表节点的有效性。

#6

韩 伟 更新于 大约 2 个月 之前

异常节点内存块快照

正常节点内存块快照

#7

韩 伟 更新于 大约 2 个月 之前


正常节点内存块快照

#8

韩 伟 更新于 大约 2 个月 之前

目前针对此种情况,已对定时器链表节点合法性进行校验,并对非法节点进行清理进行了修改,以保障链表可以正常处理下去。修改版本自测通过,无害验证已完成。

#9

韩 伟 更新于 大约 2 个月 之前

  • 状态进行中 变更为 审视
  • 指派给韩 伟 变更为 周 立伟

版本已合入T8。

#10

周 立伟 更新于 大约一个月 之前

  • 状态审视 变更为 转测试
  • 指派给周 立伟 变更为 程 鹏

已自验暂未复现,已合入3.1.3_Pre1T8版本,可转测

#11

程 鹏 更新于 大约一个月 之前

  • 状态转测试 变更为 已解决

导出 Atom PDF