FFT(快速傅里叶变换)在无线通信、语音识别、图像处理和频谱分析等领域有着广泛应用。在FFT运算中,核心操作是蝶形运算,而蝶形运算的主要操作是向量旋转,实现向量旋转可用复数乘法运算来实现,但复数乘耗费了FFT运算中大量的乘法器资源。CORDIC算法只需简单的移位与加减运算就能实现向量旋转,具有使用资源少、硬件规模小等优势。因此在FFT蝶形运算中用其代替传统FFT运算中的复数乘法器,可以获得更好的性能。但传统CORDIC算法中每次CORDIC迭代方向需由剩余角度的计算来确定,影响了工作速度。为此,本文根据定点FFT复乘中旋转因子的旋转方向可预先确定的特点,对CORDIC算法做了一些改进,在节省资源的同时保证了工作速度。
1 CORDIC算法原理
假设直角坐标系中有一向量A(Xa,Ya),逆时针旋转?兹角度后得到另一个向量B(Xb,Yb),这个过程可用如下矩阵表示:
针对这一特点,可在CORDIC算法上做一点改进,把旋转因子所对应的CORDIC旋转系数预先存在ROM中(人工计算旋转系数比较麻烦,可用MATLAB编一段程序来计算,并把旋转系数存为.mif文件以便ROM初始化),而不是把旋转因子角度预先存在ROM中。这样,在进行CORDIC运算时,直接从ROM中取出旋转系数,从而减少计算Zi来确定下一步旋转方向的步骤,减少CORDIC模块设计的复杂性,提高了运算速度,并且旋转系数不比旋转因子角度占用的ROM资源多。另外由于旋转因子需要进行0°、-90°或+90°三种预旋转,所以预旋转还要分配两位二进制数,这样存储旋转系数的ROM就为18位的ROM。
改进的CORDIC算法结构如图1所示,所有旋转因子所对应的CORDIC旋转系数都存储在ROM中,通过地址产生器的控制实现序列与相应的旋转因子的复乘运算。与传统CORDIC算法相比去掉了预旋转角与已旋转角之差的计算来确定下一次旋转方向的结构,不但增加了系数寄存器模块,而且总体上结构更为简单。此CORDIC算法还采用流水线结构提高了运算的速度,从当前VLSI的发展趋势上来看,芯片内的门资源相对富裕,对流水线CORDIC的实现规模约束很小。此外,流水线CORDIC不存在迭代式CORDIC的反馈回路,使得单元结构更加规则,有利于VLSI实现。