项目

一般

简介

错误 #368

访问srLst内存错误引起DU挂了

由 张 志乾 在 超过 4 年 之前添加. 更新于 超过 4 年 之前.

状态:
已关闭
优先级:
普通
指派给:
-
类别:
gNB-DU
开始日期:
2021-01-12
计划完成日期:
2021-01-14
% 完成:

100%

预期时间:
问题归属:
发现问题版本:
目标解决问题版本:
FPGA板卡类型:
CPU类型:

描述

当4个CPE所接的笔记本做视频下载业务时,出现CU挂掉。相关日志已经转给习文。

历史记录

#1

由 匿名用户 更新于 超过 4 年 之前

  • 状态新建 变更为 进行中

#0 0x00000000004654a5 in cmLListDelFrm (lCp=0x7f8b3ff3e2a0, node=0x7f8b81e77300)
at /root/DU/ran/DU_Alpha/src/cm/cm_llist.c:517
517 /root/DU/ran/DU_Alpha/src/cm/cm_llist.c: No such file or directory.
[Current thread is 1 (Thread 0x7fa540cd8700 (LWP 9386))]
(gdb) p *lCp
$1 = {first = 0x7f8b80913300, last = 0x7f8b80913300, crnt = 0x0, count = 2}

访问srLst时出现内存错误,实际srLst中仅有一个节点,但链表count不为1;
而且链表中节点并不是当前要删除的节点;
需要定位该双向链表的添加和删除查找问题。

#2

由 匿名用户 更新于 超过 4 年 之前

[01-12 17:08:03.614][DEBUG]rgSCHTomUtlMoveSrNxtOccasion(Delete List): crntTime[584 3] ueId17019 srPrdcty40 srOffset17 nSrTrIdx177 srLstNode[0x7f58c076c020] srLstCnt1
[01-12 17:08:03.614][DEBUG]rgSCHTomUtlMoveSrNxtOccasion(Add List): crntTime[584 3] ueId17019 srPrdcty40 srOffset17 nSrTrIdx217 srLstNode[0x7f58c076c020] srLstCnt1
[01-12 17:08:03.614][DEBUG]rgSCHTomUtlMoveSrNxtOccasion(Delete List): crntTime[584 3] ueId17029 srPrdcty40 srOffset17 nSrTrIdx177 srLstNode[0x7f58c1a8a020] srLstCnt0
[01-12 17:08:03.614][DEBUG]rgSCHTomUtlMoveSrNxtOccasion(Add List): crntTime[584 3] ueId17029 srPrdcty40 srOffset17 nSrTrIdx217 srLstNode[0x7f58c1a8a020] srLstCnt2

两个UE在加入srLst的时候是相同的nSrTrIdx,但加入和删除的cnt数有些乱,需要再仔细看看代码为何会导致cnt错乱

#3

由 匿名用户 更新于 超过 4 年 之前

  • 优先级紧急 变更为 普通

出现场景不易复现,修改优先级为普通

#4

由 匿名用户 更新于 超过 4 年 之前

  • 主题访问内存错误引起DU挂了 变更为 访问srLst内存错误引起DU挂了
  • 计划完成日期 被设置为 2021-01-14
  • 状态进行中 变更为 已解决
  • % 完成0 变更为 100

添加Log,经过多次测试问题复现;
分析所抓取log,发现该srLst访问的错误是由CRNTI MAC CE中添加的旧UE的srLst添加之前未在原链表中删除导致;

修改方法:先将srLst的node在原链表中删除,然后添加到下一个SR周期的srLst中。

经测试验证,CPE尝试不断重复接入未复现该问题,问题关闭。

#5

高 峰 更新于 超过 4 年 之前

  • 状态已解决 变更为 已关闭

导出 Atom PDF