项目

一般

简介

错误 #2796

16P_Pre1T2: DU模块cpu占有率超100%,终端无法接入

黄 毅3 个月 之前添加. 更新于 3 个月 之前.

状态:
已解决
优先级:
普通
指派给:
类别:
-
开始日期:
2025-02-13
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
DU
发现问题版本:
Rel_2.1.16P
目标解决问题版本:
Rel_2.1.16P
FPGA板卡类型:
CPU类型:

描述

问题描述:5.8G环境起站后,4终端做上下行UDP业务(每个终端上行灌包50M,下行灌包30M),DU模块cpu占有率超100%,终端无法接入。
网管上有告警提示,模块名称:gnb_du, 线程名称:UDP_RX,Cpu占用率:99.00% 门限值():90.00,见附件。
网管上基站上行测量无信号,见附件。
DU初步分析可能是DU像是内存出问题了。


文件

20250213-175231.jpg (458 KB) 20250213-175231.jpg 黄 毅, 2025-02-13 17:53
20250213-175239.jpg (78 KB) 20250213-175239.jpg 黄 毅, 2025-02-13 17:53
20250213-175245.jpg (186 KB) 20250213-175245.jpg 黄 毅, 2025-02-13 17:53
0213-DU模块cpu占有率超100_.rar (37.9 MB) 0213-DU模块cpu占有率超100_.rar 黄 毅, 2025-02-13 17:54

历史记录

#1

周 立伟 更新于 3 个月 之前

  • 状态新建 变更为 进行中

初步分析:udp_rx分配2000bytes内存失败(内存头校验失败),出现死循环,导致udp_rx所在CPU占用率超过90%。需进一步使用GDB复现此问题。

#2

周 立伟 更新于 3 个月 之前

16P_T2:
北京176环境多次复现,容易出现UDP_RX申请2000BYTE大小内存异常的问题;
西安70环境,相同参数配置和业务场景下,多次验证未复现此问题;
考虑高误码场景下,流量已出现大的波动,申请内存块时,出现校验头失败时,将bkt->crntMemBlkSetElem = NULLP,来纠正已出现的内存异常情况。

#3

周 立伟 更新于 3 个月 之前

  • 状态进行中 变更为 转测试
  • 指派给周 立伟 变更为 黄 毅

代码已合入,落入17P_T1版本

#4

黄 毅 更新于 3 个月 之前

  • 状态转测试 变更为 已解决

进行压力测试,问题未出现。

导出 Atom PDF