2.2 性能分析
分别使用库函数和源函数可完成FFT运算。并可用 CCS 自带的剖析工具“ Profiler ”来分析两个函数由于编程方式的不同所带来的运行时间上的差异。改变输入数组的长度,可得到如表1所列的一组数据。由表1可以看出,库函数的效率远远高于源函数,其效率的提高量随着输入数据长度的变化而变化,最高的效率可提高40倍(40.98-1=39.98),最低仍在25倍左右,而且该 DSP Lib的其他库函数也有相近的测试结果。虽然用该DSP Lib的库函数后,程序效率可以提高一个数量级,对于时间限制较为严格的系统,特别是实时系统,这仍然是非常有用的。
库函数和源函数相比,其效率有了很大提高,但这种提高是有代价的。它主要表现为通用性降低。其原因是为了最大限度的提高效率,在对代码进行手工优化的过程中,引入了一些强假设,同时,使用了大量的操作合并、并行处理等简化手段,这必然导致库函数的通用性降低。例如,库函数“DSPF_sp_cfftr2_dit()”使用时就会受到以下条件的限制:
(1)输入数组的长度必须是2的幂级数,且不得小于32;
(2)输入数组x和旋转因子数组w必须按双字对齐方式存储,即数组起始地址的末3位必须是零;
(3)数据的存储格式必须是小端模式(Little Endian);
(4)执行期间可接收中断,但不予响应,这可能导致一些实时事件得不到及时响应。
如果使用“DSPF_sp_cfftr2_dit()”时不考虑到这些限制,就有可能导致程序运行异常。因此,库函数的效率虽然高,但不能盲目的滥用,在程序开发时,必须根据实际情况在通用性和效率之间进行折衷,以合理的使用库函数。
3 TMS320C67x Fast RTS Library的应用
在DSP进行数据处理时,除了一些典型的操作外,还存在大量常规的操作,如除法操作、对数运算、三角函数等,这些操作也是很费时的,提高这些操作的代码效率,也能显著提高整个软件的效率。TMS320C67x FastRTS Library就是这样的一个DSP Lib,它通常由Lib文件夹、include文件夹和doc文件夹组成。其中lib文件夹内含库文件fastrts67x.lib(Little Endian)、fastrts67xe.lib(Big Endian)和源文件fastrts67x.SRC;include文件夹内含头文件fastrts67x.h和recip.h;而doc文件夹内含帮助文件。
3.1 TMS320C67x FastRTS Library的使用
TMS320C67x FastRTS Library(以下简称FastRTS Library)主要用于处理一些常规的操作。由于在通常情况下,CCS已经有一个RTSLib-rary来完成这些操作(例如,“rts6700.lib”就是一个适用于TMS320C67x的RTS Library文件),因此,如果要使用FastRTS Library,就必须在编译链接过程中先于“rts6700.lib”来编译链接“fastrts67x.lib(或fastrts67xe.lib)”,相应的编译链接命令选项为:
-l fastrts67x.lib - rts6700.lib或 -l fastrts67xe.lib - rts6700.lib
FastRTS Library同样需要注意头文件的使用,它有两个头文件: “fastrts67x.h”和“recip.h”。如果使用FastRTS Library中的特殊函数(三角函数,对数函数等),则必须包含“fastrts67x.h”;而如果使用求倒数操作,则必须包含“recip.h”。FastRTS Library的使用方式如下:
3.2 性能分析
分别使用FastRTS Library和RTS Library可完成一些常用操作,使用剖析工具可得到各个操作所需的时钟周期个数,具体如表2所列(所有的操作均处理单精度浮点数)。对比表2中的数据可以发现,和RTS Library相比,FastRTS Library大大提高了程序的效率。
4 DSP Lib的编写
事实上,程序员并非只能被动的使用DSP Lib。只要遵循相应的规则,程序员也可以自己编写一个DSP Lib。编写一个最简单的DSP Lib的步骤如下:
(1)新建一个工程newLibrary,将其属性设为“Library(.lib)”,图l所示是新工程设置示意图;
(2)编写高效率代码文件myLibl.asm、myLib2.asm、myLib3.asm,……
(3)将myLibl.asm、myLib2.asm、myLib3.asm,……等文件添加到工程new Library中;
(4)编译链接工程new Library;
完成上面4步后,工程中就会出现库文件newLibrary.lib,这样,一个DSP Lib就制作成功了。为了使DSP Lib具有保密性,通常情况下,只需保留工程中的newLibrary.lib文件,而将其他文件,特别是源代码文件*.asm删除或保密存放。这样,用户就只能使用库文件,而无法从中得到源代码的信息。
5 结束语
本文以TMS320C67x DSP Library和TMS320C67x FastRTS Library为例,详细介绍了如何在程序开发中使用TI DSP Library,并分析了使用TI DSP Library所带来的程序效率的提高。最后,还给出了编写TI DSP Library的一个应用实例。