功能 #650
由 guo hanlin 更新于 超过 3 年 之前
使用指令集修改C代码的polar译码,比对加速后的运行时间,评估可行性
------------------------------------------------------------------
h2. 指令加速前运行速度:
Fee5GRAN PBCH polar解速率匹配 和 polar译码运行时间为:1384 us
总运行时间: 1.365 ms ==== 1384 us
解速率匹配: 0.041ms ==== 41 us
Polar 译码: 1.266ms ==== 1266 us (最大)
逆矩阵相乘: 1.153ms ==== 1153 us
其他时间: 58 us
--------------------------------------------------
h2. 指令加速后运行速度:
逆矩阵相乘: 13 us
译码和解速率匹配: 55 us
--------------------------------------------------
为加快速度,逆矩阵相乘处的输入输出变量均优化为int8_t,输入可能需要做DAGC, 饱和可能会影响译码性能
------------------------------------------------------------------
h2. 指令加速前运行速度:
Fee5GRAN PBCH polar解速率匹配 和 polar译码运行时间为:1384 us
总运行时间: 1.365 ms ==== 1384 us
解速率匹配: 0.041ms ==== 41 us
Polar 译码: 1.266ms ==== 1266 us (最大)
逆矩阵相乘: 1.153ms ==== 1153 us
其他时间: 58 us
--------------------------------------------------
h2. 指令加速后运行速度:
逆矩阵相乘: 13 us
译码和解速率匹配: 55 us
--------------------------------------------------
为加快速度,逆矩阵相乘处的输入输出变量均优化为int8_t,输入可能需要做DAGC, 饱和可能会影响译码性能