项目

一般

简介

错误 #2479

15Ppre1_T5版本,异频xn乒乓切换一段时间后,上报A5不再发起切换。

孙 泽林9 个月 之前添加. 更新于 8 个月 之前.

状态:
已解决
优先级:
普通
指派给:
类别:
-
开始日期:
2024-11-29
计划完成日期:
% 完成:

0%

预期时间:
问题归属:
CU
发现问题版本:
Rel_2.1.15P
目标解决问题版本:
Rel_2.1.16P
FPGA板卡类型:
CPU类型:

描述

15Ppre1_T5版本,3.3G-3.5G频段,异频xn乒乓切换一段时间后,上报A5不再发起切换。
研发定位为上次切换,目标侧还没有收到源侧的end maker,切换流程没走完,导致后续切换异常。
目前研发增加日志打印,复现定位中。


文件

end mark.rar (6.81 MB) end mark.rar 孙 泽林, 2024-11-29 09:56

历史记录

#1

席 振斌 更新于 9 个月 之前

  • 指派给 被设置为 席 振斌
#2

席 振斌 更新于 9 个月 之前

  • 状态新建 变更为 进行中
#3

席 振斌 更新于 9 个月 之前

问题原因:
初步分析:通过后来复现的any报文分析,通过报文可以看到目标侧及时收到了源侧发送的end maker,但是目标侧一直没有进行 end maker的处理,且从日志看在收到end maker的udp socket到endmaker的处理函数没有看到任何异常的返回;同时通过baseservice的日志看,udp_rx_dl线程在问题发生的时间段cpu占用率一直是99.002%,此线程在平常峰值灌包时最高才达到70%,从西安的环境上看不带任何业务时cpu占用率在0.7%~1.4%之间,但是触发问题的环境不带任何业务的切换在发生问题前后有段时间cpu占用率很高;
定位方法:
1、之前basesevice的日志打印是10s一次,现在修改为1s一次,重点看一下问题发生时此线程的是不是确实是占用率很高;
2、在udp接受socket的函数,recvfrom后将endmaker的消息打印看目标侧有没有在发生问题时收到end maker消息;

#4

席 振斌 更新于 9 个月 之前

目前是出包给了测试等待复现

#5

席 振斌 更新于 9 个月 之前

问题原因:cu目标侧代码在udp_rx_dl线程处理endmaker时,对存在扩展信元但是扩展内容为全0值时的场景,代码异常防护不够导致跳不出while循环,udp_rx_dl线程cpu拉满,本次切换的endmaker信令也无法处理下去,目标侧始终处理不到end maker消息,切换完成的状态机没有修改过来,A5事件上报到目标侧时,因状态机没有更换过来,全都没有处理;
目前修改完成,出包给产测

#6

席 振斌 更新于 9 个月 之前

  • 状态进行中 变更为 转测试
  • 指派给席 振斌 变更为 孙 泽林
#7

孙 泽林 更新于 8 个月 之前

  • 状态转测试 变更为 已解决

16PT2版本测试中,未出现end mark问题。

导出 Atom PDF