功能 #650
功能 #649: 【PHY】PBCH Polar 译码模块移植 (UCI)
【PHY】PBCH polar 译码C代码修改使用AVX2加速
状态:
已解决
优先级:
高
指派给:
guo hanlin
开始日期:
2021-09-23
计划完成日期:
2021-09-30
% 完成:
100%
预期时间:
问题归属:
CPU类型:
描述
使用指令集修改C代码的polar译码,比对加速后的运行时间,评估可行性
指令加速前运行速度:¶
Fee5GRAN PBCH polar解速率匹配 和 polar译码运行时间为:1384 us
总运行时间: 1.365 ms ==== 1384 us
解速率匹配: 0.041ms ==== 41 us
Polar 译码: 1.266ms ==== 1266 us (最大)
逆矩阵相乘: 1.153ms ==== 1153 us
其他时间: 58 us
指令加速后运行速度:¶
逆矩阵相乘: 13 us
译码和解速率匹配: 55 us
为加快速度,逆矩阵相乘处的输入输出变量均优化为int8_t,输入可能需要做DAGC, 饱和可能会影响译码性能