2 FPGA计算系统模型
在通常的并行系统设计中,微处理器在空间维上是固定的,而在时间维上是可变的;而连接的专用芯片在空间维和时间维上都是固定的。这样的系统往往只能适用于特定应用场合下的特定算法。为了使系统具有更加优良的性能和灵活性,随着可编程器件FPGA的应用深入,一种新的通用处理模块结构呈现在我们面前——FPGA计算系统结构。
FPGA是二十世纪80年代后期出现的新型的大规模可编程器件,由逻辑单元和互连线网络两部分组成,两者均可编程。逻辑单元能完成一些基本操作。逻辑单元经互连线网络互连,通过对基本逻辑块和互连线网络编程,可以实现非常复杂的逻辑功能。由于FPGA是基于SRAM结构的器件,所有的可编程逻辑加载在芯片内部的SRAM上,因此可以通过一定的步骤在系统运行时进行编程来改变该器件的功能,从而实现更大的灵活性。
FPGA计算系统就是充分利用FPGA的高集成度和硬件可编程性在系统中用FPGA实现除了必要模块(如微处理器和存储器等)之外的其它逻辑和硬件互连,从而使系统具有空间上的可编程性。系统的空间可编程性是FPGA计算系统引入的新特征。它是指通过对FPGA的重新编程和配置来改变系统体系结构等一系列硬件逻辑结构。系统的空间可编程性是系统可重构的前提,它使得硬件系统的设计趋于软件编程化。然而需要指出的是,由于FPGA内部结构的完全分布性和内部单元的百分之百的互连连通性,系统的硬件互连编程不象由中央处理单元引起的软件编程那样可以充分总结指令集。但在具体的系统设计中,可以根据实际的
数据流结构进行部分限制,这样可以为用户提供一些可选择的重构方案,方便用户使用。
3 基于FPGA计算系统模型的双DSP实时图像处理系统
为了尽可能地获得高性能,我们提出以两个TMS320C62x为中央处理核心构成双DSP处理系统,由FPGA(这里采用ALTERA的FLEX系列)实现系统互连。系统分为处理器模块、FPGA组模块和各总线接口模块等,如图1所示。
其中处理器模块包含TMS320C62x、内存空间以及相应逻辑。处理器作为最小处理单元模块而存在,可以完成相应的处理子任务。在我们的系统中设置了两个这样的处理模块。这两个处理模块都是在系统核心FPGA控制下运行的。而FPGA作为系统中心,负责两个微处理器互相通信、互相协调以及它们与外界(这里通过主从总线和互连总线)的信息交换。同时,系统处理子任务可以由 FPGA直接派发给处理器。灵活的FPGA体系结构设计是该系统有效性的保证。在实际应用中,可以根据系统的任务,通过配置FPGA控制两个微处理器按流水线方式运行,也可以控制它们按MIMD方式并行处理同一输入图像。为了提高数据交换的效率,在FPGA控制下的数据交换中心设置了灵活的系统存储空间。而这块存储空间与DSP的局部存储空间构成了一种分布共享式的结构。然而不同于一般的分布共享式存储结构的是,我们的系统存储空间相对独立,不是直接挂接在各DSP的地址空间中,而是通过两者的HPI口进行互连。从严格意义上讲,这种结构不能算分布共享式存储结构,而应称之为一种松散的分布共享式存储结构。由于并行效率的要求,我们将系统存储空间设置为两个Bank结构,两个Bank是独立控制和运行的,系统的实现框图见图2。
由于系统的互连、各个接口以及数据通道都是通过FPGA完成,并在FPGA内部实现除一些必要逻辑之外的其它所有逻辑,因此系统的重构非常方便。这是系统设计中的最大特点。另外系统还有可测性好,可裁减性,系统设计的方便性等其它优点。