项目

一般

简介

错误 #1198

VONR 视频通话拨打超过两次DU挂死

由 匿名用户 在 大约 2 年 之前添加. 更新于 大约一年 之前.

状态:
已关闭
优先级:
普通
指派给:
-
类别:
-
开始日期:
2023-07-04
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
DU
发现问题版本:
Rel_2.1.13P
目标解决问题版本:
Rel_2.1.14P
FPGA板卡类型:
CPU类型:

描述

VONR 视频通话,多次测试观察,拨打次数超过两次,DU挂死,必现


相关的问题

关联到 2.0基站产品化测试 - 错误 #1163: VONR视频通话异常挂断终端掉线已关闭2023-06-14

Actions

历史记录

#1

由 匿名用户 更新于 大约 2 年 之前

(gdb) bt
#0 0x0000000000466b83 in cmLListDelFrm (lCp=0x7ffe51008190, node=0x7ffe2530a200) at /root/DU/ran/DU_Alpha_Rel/src/cm/cm_llist.c:520
#1 0x0000000000d3fc67 in rgSCHSlctrStopTmr (slctrCb=0x7ffe51008020, tmrNode=0x7ffe2530a1f0) at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c:1304
#2 0x0000000000d45ea4 in rgSCHSlctrUlLcCfg (schdSpfcCb=0x7ffe51008020, ue=0x7ffe51404020, cfg=0x7ffdff156328, err=0x7ffe8c947b70)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c:4917
#3 0x0000000000c544e2 in rgSCHLvl1CmnRgrLchCfg (cell=0x7ffdfff1fd10, ue=0x7ffe51404020, dlLc=0x7ffe09694020, lcCfg=0x7ffdff156328, err=0x7ffe8c947b70)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_cmn_lvl1.c:981
#4 0x0000000000c20eaa in rgSCHLvl1CfgRgrLchCfg (cell=0x7ffdfff1fd10, ue=0x7ffe51404020, lcCfg=0x7ffdff156328, errInfo=0x7ffe8c947b70)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_cfg_lvl1.c:4598
#5 0x0000000000c96482 in rgSCHLvl1GomHndlCfgReq (instCb=0x9bd4200 <rgSchLvl1Cb>, cfg=0x7ffdff156320, errInfo=0x7ffe8c947b70, gUeCb=0x7ffe25588020)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_gom_lvl1.c:537
#6 0x0000000000c95a9e in rgSCHLvl1GomCfgReq (instCb=0x9bd4200 <rgSchLvl1Cb>, transId=..., cfgReqInfo=0x7ffdff156310, gUeCb=0x7ffe25588020)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_gom_lvl1.c:216
#7 0x0000000000c9578f in rgSCHLvl1GomHndlCfg (instCb=0x9bd4200 <rgSchLvl1Cb>, transId=..., cfgReqInfo=0x7ffdff156310, gUeCb=0x7ffe25588020)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_gom_lvl1.c:107
#8 0x0000000000cacc0b in RgUiRgrSchLvl1CfgReq (schGCb=0x9a7d4e8 <cmGCb+2216>, cfgType=0, transId=0, gUeCb=0x7ffe25588020, cfgReqInfo=0x7ffdff156310)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_lvl1.c:136
#9 0x0000000000c4c84a in rgSchLvl1ActvTsk (tskInfo=0x7ffe0344c720) at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_cmn_hdl.c:83
#10 0x0000000000ae719d in gnb_du::gnb_du_schd_lvl1_cmn_entity::process_task (this=0x7ffe00401924, p_task=0x7ffe0344c720)
at /root/DU/ran/DU_Alpha_Rel/src/du_app/gnb_mgr/build/../include/gnb_du_worker_entity.h:371
#11 0x0000000000ad8541 in gnb_du::gnb_du_worker_thread_instance::process_message (this=0x7ffe00402b24, p_task=0x7ffe0344c720, priority=0)
at /root/DU/ran/DU_Alpha_Rel/src/du_app/gnb_mgr/build/../src/gnb_du_worker_thread.cpp:420
#12 0x0000000000871292 in ngp::thread_pool<gnb_du::gnb_du_worker_thread_instance, ssTskInfo>::thread_worker::run (this=0xae27720)
at /root/DU/ran/DU_Alpha_Rel/src/du_app/gnb_mgr/build/../../../../../../ngp/include/ngp_thread_pool.h:334
#13 0x0000000000ea5877 in ngp::thread_entry_function (param=0xae27720) at /root/DU/ngp/thread/build/../src/ngp_sys_thread.cpp:110
#14 ngp::thread_start (param=0xae27720) at /root/DU/ngp/thread/build/../src/ngp_sys_thread.cpp:123
#15 0x00007ffff61e16ba in start_thread (arg=0x7ffe8c948700) at pthread_create.c:333
#16 0x00007ffff5f1741d in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:109
(gdb) p slctrLcgCb->smplTmr
$15 = {
tmrEvent = RG_SLCTR_UL_LCG_SMPL_TMR,
tmrDistance = 1,
remTmrDistance = 1,
tmrIndx = 3,
tmrLnk = {
next = 0x7ffe09692158,
prev = 0x0,
node = 140729522364912
},
data = 140729522364864,
tmrType = RG_SLCTR_10MS_SMPL_TMR_TYPE
}
(gdb) p slctrLcgCb
$16 = (RgSchSlctrLcgCb *) 0x7ffe2530a1c0
(gdb) f 1
#1 0x0000000000d3fc67 in rgSCHSlctrStopTmr (slctrCb=0x7ffe51008020, tmrNode=0x7ffe2530a1f0) at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c:1304
1304 in /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c
(gdb) p slctrLcgCb->smplTmr.tmrLnk
No symbol "slctrLcgCb" in current context.
(gdb) f 2
#2 0x0000000000d45ea4 in rgSCHSlctrUlLcCfg (schdSpfcCb=0x7ffe51008020, ue=0x7ffe51404020, cfg=0x7ffdff156328, err=0x7ffe8c947b70)
at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c:4917
4917 in /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c
(gdb) p slctrLcgCb->smplTmr.tmrLnk
$17 = {
next = 0x7ffe09692158,
prev = 0x0,
node = 140729522364912
}
(gdb) p &slctrLcgCb->smplTmr.tmrLnk
$18 = (CmLList *) 0x7ffe2530a200
(gdb) p slctrCb->slctrSmplTmrQ[tmrNode->tmrType][7].smplTmrQ
No symbol "tmrNode" in current context.
(gdb) f 1
#1 0x0000000000d3fc67 in rgSCHSlctrStopTmr (slctrCb=0x7ffe51008020, tmrNode=0x7ffe2530a1f0) at /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c:1304
1304 in /root/DU/ran/DU_Alpha_Rel/src/5gnrsch/rg_sch_selector.c
(gdb) p slctrCb->slctrSmplTmrQ[tmrNode->tmrType][7].smplTmrQ
$19 = {
first = 0x0,
last = 0x0,
crnt = 0x0,
count = 0
}
(gdb) p slctrCb->slctrSmplTmrQ[tmrNode->tmrType][8].smplTmrQ
$20 = {
first = 0x7ffe2530a200,
last = 0x7ffe09692158,
crnt = 0x7ffe09692158,
count = 3
}

从复现的堆栈和现场信息看,视频通话时会同时创建两个同一LCG ID的两个不同DRB承载,挂断后释放,
但代码中有一个timer变量是由lcgId来访问并且初始化和运作的,因此在建立和释放中存在问题,导致访问异常挂死。
具体出现问题的逻辑还在详细查看。

#2

由 匿名用户 更新于 大约 2 年 之前

  • 状态新建 变更为 进行中
#3

由 匿名用户 更新于 大约 2 年 之前

  • 关联到 错误 #1163: VONR视频通话异常挂断终端掉线 已添加
#4

由 匿名用户 更新于 大约 2 年 之前

增加log和多次复现问题后,找到问题的根源,
上行删除逻辑信道的过程中,如果存在两个逻辑信道,会执行stop timer,又重新启动timer的过程;
但是该过程中没有对链表中节点的node进行重置,导致第二个上行逻辑信道的删除无法正常对timer进行操作,
从而导致后续访问异常挂死。

修改后版本自测多次没有再出现DU挂死,版本已提供给CU同事进行测试。

#5

由 匿名用户 更新于 大约 2 年 之前

  • 状态进行中 变更为 转测试
#6

由 匿名用户 更新于 大约 2 年 之前

  • 状态转测试 变更为 已解决

后续测试未复现DU挂死

#7

高 峰 更新于 大约一年 之前

  • 状态已解决 变更为 已关闭

导出 Atom PDF