项目

一般

简介

错误 #2232

[15p_pre2T4升级验证]网管上挂无效用户,终端接入个数会递增,同时shell卡死无法登录

刘 抒放11 个月 之前添加. 更新于 8 个月 之前.

状态:
已解决
优先级:
指派给:
开始日期:
2024-10-10
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
CU, 系统
发现问题版本:
Rel_2.1.15P
目标解决问题版本:
Rel_2.1.15P
FPGA板卡类型:
CPU类型:

描述

在有用户接入时,在线终端数会一直累积。终端释放时,在线终端可以显示为 0 。 同时发现shell卡死,shell phy打印状态和信令出问题以后就不更新了。同时发现各个子系统日志在16:39 时间点之后产出的也都不进行转储
杨乐初步分析:从日志分析,问题是14的线程核心卡死了,14线程运行了baseService和cu的吞吐率线程;当卡死发生时,导致了cu在线数量一直增加;也可能会导致shell连接失败。
怀疑有如下两种可能性,暂时不能确定
1.cu的吞吐率代码出现死循环,可能性很低
2.baseService的日志转储出现了死循环,可能性稍高
建议:重启173服务器后,执行命令停止baseService:systemctl stop baseservice;然后按照之前的方式尝试复现,看问题是否出现


文件

1010_网管上挂载多个无效用户复现.rar (35.2 MB) 1010_网管上挂载多个无效用户复现.rar 刘 抒放, 2024-10-10 18:20
1010_baserv&&gnb_run.rar (45.5 MB) 1010_baserv&&gnb_run.rar 刘 抒放, 2024-10-10 18:20
perf.rar (1.98 MB) perf.rar 刘 抒放, 2024-10-10 18:20
xftp看到日志堆积未转储.jpg (61.1 KB) xftp看到日志堆积未转储.jpg 刘 抒放, 2024-10-10 18:20
基站网管截图.jpg (2.22 MB) 基站网管截图.jpg 刘 抒放, 2024-10-10 18:20

历史记录

#1

杨 杨乐 更新于 11 个月 之前

  • 状态新建 变更为 转测试
  • 指派给杨 杨乐 变更为 刘 抒放

【问题原因】
当只有1个UE,且UE经常掉线的场景。如下的代码,在ue_size为1,m_tr_mgrs.m_ue_ul_datas为空时,会导致程序进入死循环
std::map<uint32_t, ue_throught_rate_save>::iterator iter = m_tr_mgrs.m_ue_ul_datas.begin();
for (uint32_t i = 0; i < ue_size; ++i, ++iter) {
tr->m_ue_tr[i].copy_ul(iter->second);
}
【修改方案】
增加m_tr_mgrs.m_ue_ul_datas是否为空的判断
std::map<uint32_t, ue_throught_rate_save>::iterator iter = m_tr_mgrs.m_ue_ul_datas.begin();
for (uint32_t i = 0; i < ue_size && iter != m_tr_mgrs.m_ue_ul_datas.end(); ++i, ++iter) {
tr->m_ue_tr[i].copy_ul(iter->second);
}
【回归方法和注意事项】
按照原因中描述的场景,测试12到24小时,如果不复现可考虑关单

#2

刘 抒放 更新于 8 个月 之前

  • 状态转测试 变更为 已解决

实测问题已解决,问题关闭

导出 Atom PDF