项目

一般

简介

错误 #4620

[3.0产品测试] 5.8G整机上行300M压力测试,出现了bus error导致基站挂死

黄 毅大约 2 个月 之前添加. 更新于 28 天 之前.

状态:
已解决
优先级:
一般
指派给:
开始日期:
2025-12-17
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
CU
发现问题版本:
Rel_3.1.3Pre2
目标解决问题版本:
Rel_3.1.3Pre2

描述

测试版本:Rel3.1.3_Pre2T1版本+du小包(#4517)
测试设备:军特整机192.168.8.234 核心网 192.168.8.219
测试用例:单用户速率测试
基站配置:1D3U
测试终端:星创CPE
测试场景:1D3U,上行300M压力测试,基站配置了1个相邻基站
问题描述:用户接入后,上行速率正常,压力测试60小时,出现了一个bus error导致基站挂死
研发分析:du分析内存已经有问题了,系统内存被吃光了。CU分析内存问题与配置了1个相邻基站有关。
关闭相邻基站后,复测40小时未出现内存异常,基站未挂死。


文件

20251217-101532.jpg (46 KB) 20251217-101532.jpg 黄 毅, 2025-12-17 10:17
20251217-101657.jpg (522 KB) 20251217-101657.jpg 黄 毅, 2025-12-17 10:17
core.WORKER_0_1.rar (55.4 MB) core.WORKER_0_1.rar 黄 毅, 2025-12-17 10:17
20251229-102023.jpg (514 KB) 20251229-102023.jpg 黄 毅, 2025-12-29 10:30

历史记录

#1

杨 杨乐 更新于 大约一个月 之前

  • 状态新建 变更为 进行中

【问题原因】
1.每个socket分配的slab内存太大
2.由于socket对象在ping邻区时,因为ping不通而被频繁的创建和释放;这样频繁的释放,对于系统来说可能回收不及时。然后占用大量内存
导致了系统内存被耗尽的现象

【修改方案】
1.根据线程数量分配socket对象
2.修改socket等网络资源分配的资源数量

【回归方法和注意事项】
设置一个或多个ping不通的邻区,然后长跑测试

#2

杨 杨乐 更新于 大约一个月 之前

  • 状态进行中 变更为 审视
#3

杨 杨乐 更新于 大约一个月 之前

  • 状态审视 变更为 转测试
  • 指派给杨 杨乐 变更为 黄 毅
#4

黄 毅 更新于 大约一个月 之前

Rel_3.1.3_Pre2T2版本长跑60多小时复现内存耗尽问题。

#5

杨 杨乐 更新于 29 天 之前

【问题原因】
1.相邻基站,可以Ping通,但是CU未启动;导致本基站会持续的链接相邻基站
2.当socket执行sctp_connectex的链接时,系统会分配约4k的slab内存,每次链接都使用同样的套接字,导致了资源持续积累

【修改方案】
每次链接后,如果链接失败,则释放该套接字,这样会释放对应的4k的slab内存

【回归方法和注意事项】
设置一个或多个能ping通的邻区,但是该邻区不启动cu,然后长跑测试

#6

杨 杨乐 更新于 29 天 之前

  • 状态反馈 变更为 审视
#7

杨 杨乐 更新于 29 天 之前

  • 状态审视 变更为 转测试
  • 指派给杨 杨乐 变更为 黄 毅
#8

黄 毅 更新于 28 天 之前

  • 状态转测试 变更为 已解决

Rel_3.1.3_Pre2T2已验证

导出 Atom PDF