项目

一般

简介

错误 #4743

西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站时cu必现挂死

孙 浩19 天 之前添加. 更新于 15 天 之前.

状态:
已解决
优先级:
一般
指派给:
开始日期:
2026-01-15
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
CU
发现问题版本:
Rel_3.1.5
目标解决问题版本:
Rel_3.1.5

描述

【问题描述】西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本,启动基站就cu挂死;


文件

cu启动挂死截图.jpg (350 KB) cu启动挂死截图.jpg 孙 浩, 2026-01-15 10:19

历史记录

#1

孙 浩 更新于 19 天 之前

  • 主题西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站就cu挂死 变更为 西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站cu偶现挂死
#2

孙 浩 更新于 19 天 之前

  • 主题西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站cu偶现挂死 变更为 西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站cu必现挂死
#3

孙 浩 更新于 19 天 之前

  • 主题西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站cu必现挂死 变更为 西安241基站从Rel_3.1.4_Pre1T4升级到Rel_3.1.5_Pre1T1版本启动基站时cu必现挂死
#4

杨 杨乐 更新于 18 天 之前

  • 状态新建 变更为 进行中

【问题原因】
1.问题出现在241基站上,241基站配置了一个邻区,邻区IP为:192.168.62.242
2.基站192.168.62.242的机器启动了,但是cu一直没有启动
3.基站启动后会首先ping192.168.62.242,可以ping通
4.基站会去连接192.168.62.242,但是由于242的CU没启动,sctp连接失败了;失败后将241的xn客户端的套接字close了,该套接字的数字比如为:9
5.随后基站241调用accept接入F1的客户端,代码如下,accept接收到了F1的客户端newfd也是9
int32_t newfd = -1;
if ((newfd = accept(client_fd, NULL, 0)) != -1) // newfd为客户端连接的套接字 {
//不为-1,代表有xn或f1的客户端接入
ngp::sctp_sock_apis* tmp = it_fd->second;
if (ret_t::FAILURE == epoll_register_fd(newfd, EPOLLIN, tmp)) {
close(newfd);
continue;
}
}
6.由于之前XN客户端的套接字:9,已经存入了map容器m_all_fd_map中,但是在xn客户端连接失败时没有从容器中移除
7.f1客户端端接入后,套接字还是9,调用epoll_register_fd时,会判断在m_all_fd_map中已经存在,执行epoll_ctl的动作变成了EPOLL_CTL_MOD;由于之前xn客户端使用9时链接xn服务端失败时调用了close;
调用close会导致m_epoll_fd的监控socket中移除该套接字。导致f1客户端接入时无法完成epoll_ctl的Mod动作,因为epoll_ctl不允许不增加就Mod,然后就释放了f1客户端
8.然后f1的客户端就会在短时间内频繁的建立和断开连接,发送大量的F1SetupRequest,同时cu无法在短时间内处理这么多F1SetupRequest;然后下发了F1SetupFailure
9,CU中发送F1SetupFailure,会将gnb_mgr_du对象中的指针ongoing_msg置为空指针;在之后又一次收到F1SetupRequest后,会使用ongoing_msg,但是没有判断,导致程序崩溃
【修改方案】
1.在xn客户端连接xn服务器时,如果失败了则从m_all_fd_map中移除该套接字
2.在使用ongoing_msg前做有效性判断

【回归方法和注意事项】
1.配置一个开机的邻基站,但是不启动三层
2.多次开机,关注是否能正常启动,如果可以则关闭该问题单

该版本代码在Rel_3.1.5_Pre1T2已合入,在Rel_3.1.5_Pre1T2版本验证

#5

杨 杨乐 更新于 18 天 之前

  • 状态进行中 变更为 审视
#6

杨 杨乐 更新于 18 天 之前

  • 状态审视 变更为 转测试
  • 指派给杨 杨乐 变更为 孙 浩
#7

孙 浩 更新于 15 天 之前

  • 状态转测试 变更为 已解决

Rel_3.1.5_Pre1T2版本基站正常启动多次未出现挂死,问题解决。

导出 Atom PDF