韩 伟
- 注册于: 2024-12-10
- 最后登录: 2026-01-19
问题
项目
- 解决方案集成测试 (开发人员, 报告人员, 2024-12-10)
- eMBB2.0 BBIT (开发人员, 报告人员, 2024-12-10)
- 研发产品测试 (开发人员, 报告人员, 2024-12-10)
- 2.0基站产品化测试 (开发人员, 报告人员, 2024-12-10)
- 3.0基站产品测试 (开发人员, 报告人员, 2024-12-10)
- 客户局点问题 (开发人员, 报告人员, 2026-01-14)
活动
2026-01-30
- 16:34 3.0基站产品测试 错误 #4809: 【Rel_3.1.4Pre1T4_E500多用户】7D2U,TTI=2,128UE进行上下行udp业务压力20小时,du内存耗尽,下行无速率
- 定位过程中发现环境存在终端频繁掉线的情况
!ue%E6%8E%89%E7%BA%BF.png!
针对这个异常情况,针对代码梳理,发现现有gUeCb异常释放过程中,对其所挂载的环形队列,仅对对列自身进行了内存释放,但未对队列中因业务... - 16:29 3.0基站产品测试 错误 #4809: 【Rel_3.1.4Pre1T4_E500多用户】7D2U,TTI=2,128UE进行上下行udp业务压力20小时,du内存耗尽,下行无速率
- !fapi%E6%89%93%E5%8D%B0.png!
下行流量从原始640+,下降到无流量。
!%E5%86%85%E5%AD%98%E6%89%93%E5%8D%B0.png!
通过内存统计查看,在这个时间点起内存泄漏到大... - 16:27 3.0基站产品测试 错误 #4809 (进行中): 【Rel_3.1.4Pre1T4_E500多用户】7D2U,TTI=2,128UE进行上下行udp业务压力20小时,du内存耗尽,下行无速率
- 该问题流量异常,定位原因为DU内存泄漏,CU下发流量到DU,因内存泄漏到达门限,F1口全部丢包,下行无流量。
- 09:41 3.0基站产品测试 错误 #4781: Rel_3.1.5_Pre1T2版本16UE长保DU coredump
- 通过对代码分析,存在在竞争解决释放情况下提前删除ueCb,且rel_trans定时器不感知,且是在超时后去使用了已被释放的内存。针对此情况一方面增加rel_trans异常保护,另一方面对异常释放流程进行修改。修改已合入。
- 09:37 3.0基站产品测试 错误 #4781: Rel_3.1.5_Pre1T2版本16UE长保DU coredump
- 所以在rel_trans定时器超时释放ueCb时异常:
!rel_trans_event.png!
- 09:37 3.0基站产品测试 错误 #4781: Rel_3.1.5_Pre1T2版本16UE长保DU coredump
- 但是实际该终端对应的ueCb已经被RLF释放:
!rlf%E9%87%8A%E6%94%BE%E6%A0%87%E8%AE%B0.png!
!del_ue.png!
- 09:31 3.0基站产品测试 错误 #4781: Rel_3.1.5_Pre1T2版本16UE长保DU coredump
- !%E5%BC%82%E5%B8%B8%E7%BB%88%E7%AB%AF.png!
解堆栈,发现异常时终端为17027 - 09:28 3.0基站产品测试 错误 #4781: Rel_3.1.5_Pre1T2版本16UE长保DU coredump
- !core_stack.png!
调用栈信息如上
2026-01-29
- 21:00 3.0基站产品测试 错误 #4781 (进行中): Rel_3.1.5_Pre1T2版本16UE长保DU coredump
- 该问题已定位,挂死原因为ue释放流程中rel_trans定时器超时,访问待释放终端ueCb时,ueCb所在内存块已被释放,且内存已被其他点申请走,并进行了内存重写,因此挂死。
2026-01-20
- 19:27 3.0基站产品测试 错误 #4756 (审视): 【3.1.5PRe1T2版本】网管上-用户下行速率指标为零,du已定位
- 修改版本验证,网管KPI指标刷新已正常。
导出 Atom