首 页文档资料下载资料维修视频汽修在线平台
请登录  |  免费注册
当前位置:精通维修下载 > 文档资料 > 电子技术 > 嵌入式技术
基于BWDSP指令Cache的PLRU替换算法研究
来源:本站整理  作者:佚名  2013-01-22 08:44:23


    ③若命中Cache的way2,则根据lru [4:5]值为b00 ,B01,b10,b11 4种情况更新lru[0:7]的值:

 

    if (lru [ 4:5]=b00)

      {lru[6:7]F-lru[6:7]-1;lru[4:5] ←b11;lru[2:3]

                        ←lru [ 2:3]-1;lru[0:1 ] ←lru [0:1]-1;}

    else if(lru[4:5]==b01)

        { if (lru[0:1]==b00) lru [ 0:1] ←lru[0:1];

                              else lru [ 0:1] ←lru[0:1]-1;

        if (lru [ 2:3]==b00)lru[2:3] ←lru[2:3];else lru [ 2 : 3 ]

                                              ←lru[2:3]-1;

 

 

 

        if (lru[6:7]==b00) lru [ 6:7] ←lru [ 6:7];else lru [ 6:7]

                                            ←lru[6:7]-1;

        lru[4:5] ←b11}

    else if(lru[4:5]==b10)

              {if (lru [ 1:0]==b11)lru[0:1] ←ru[0:1]-1;

                                  else lru[0:1 ] ←lru[0:1];

            if (lru [ 2:3]==b11)lru[2:3 ] ←lru [ 2:3]-1;

                                  else liu [ 2:3] ←lru[2:3];

            if (lru[6:7]==b11)lru[6:7] ←lru[6:7]-1;

                                  else lru [ 6:7] ←lru[6:7];

            lru [4:5]=b11;}

    else (lru[2:3]==b11)

              {lru [ 6:7] ←lru[6:7];lru [ 4:5] ←lru[4:5];

                    lru[2:3 ] ←lru [ 2:3];lru [ 0:1 ] ←-lru [ 0:1];}

 

 

 

 

 

 

    ④若命中Cache的way3,则根据lru [6:7]值为b00 ,b01 ,b10,bll 4种情况更新lru[0:7]的值:

 

    if (lru[6:7]==b00) {lru[6:7] ←b11;lru [ 4:5] ←lru[4:5]-1;

                lru [ 2:3] ←lru[2:3]-1;lru[0:1 ] ←lru[0:1]-1;}

    else if(lru[6:7]= =b01)

        {if (lru[0:1] ==b00) lru [ 0:1] ←lru[0:1];

                                else lru[0:1] ←ru[0:1]-1;

        if (lru [ 2:3]==b00)lru[2:3] ←lru[2:3];

                                else lru [ 2:3] ←lru[2:3]-1;

        if (lru( 4:5)==b00)lru[4:5] ←lru [ 4:5];

                              else lru[4:5] ←lru[4:5]-1;

          lru [ 6:7] ←b1 1}

    else if (lru [ 6:7]= =b10)

              {if (lru[ 1:0]==b11 )lru[0:1] ←lru[0:1]-1;

                                    else lru[0:1 ] ←lru[0:1];

              if (lru [ 2:3]==b11)lru[2:3] ←lru[2:3]-1;

                                  else lru [ 2:3] ←lru[2:3];

              if (lru [ 4:5]==b11)lru[4:5] ←lru[4:5]-1;

                                    else lru[4:5] ←lru[4:5];

              lru [ 6:7]=b11;1

    else (lru[6:7]= =b11)

              {lru[6:7] ←lru[6:7];lru[4:5] ←lru[4:5];

                    lru [2:3] ←lru[2:3];lru [ 0:1] ←lru[0:1];}

 

    (3)如果Cache缺失,则按照下述替换算法替换Cache的数据块,并更新对应的lru[0:7]的值。

    if (lru [ 0: 1]==b00),

      {替换way0中的数据块;

        同时要更新对应lru[0:7]的值:lru[6:7]=lru[6:7]-1;

        lru[4:5]=lru[4:5]-1;lru[2:3]=lru[2:3]-1;lru[0:1]=11;}

    if (lru[2:3]==b00)

      {替换way 1中的数据块;

        同时要更新对应 Iru[0:7]的值:lru[6:7]=Iru[6:7]-1;

        lru[4:5]=lru[4:5]-1; Iru[2:3]=b11;Iru[0:1 ]=Iru[0:1]-1;}

    If (lru [4:5]==b00)

      {替换way2中的数据块;

 

        同时要更新对应lru[0:7]的值:lru[6:7]=lru[6:7]-1 ,

        lru [ 4:5]=b11,lru [ 2:3]=1ru[2:3]-1,lru[0:1]

        =1ru[0:1]-1;1

    if (lru[6:7]==b00)

      {替换way3中的数据块;

        同时要更新对应lru[0:7]的值:lru[6:7]=b11;

        lru [ 4:5]=lru [ 4:5]-1;lru[2:3]=lru [ 2:3]-1;lru[0:1]=

        lru[0:1]-1;}

 

3仿真与实验结果

    BWDSP模拟器包含了编译器、BWDSP指令集、汇编器,能够编译用高级语言(C语言)编写的雷达信号处理的程序代码和产生基于BWDSP体系结构的目标代码。BWDSP模拟器的主频为1 MHz, l11级流水线,其内核发射的宽度为8条指令,指令存储器为1 Mb,指令Cache大小为256 Kb, 4路组相联映射,数据存储器为2 Mb。用4个典型雷达信号处理程序xd_ lib_ test2_1_ Cache. out ,xd_ lib_ test2_1_part_cache.out,xd_ lib_ test2_1_ Cache.out,dsp.out在BWDSP模拟器验证平台上对本文提出的PLRU替换算法进行仿真实验,并与直接映射、FIFO, RLU , Random替换算法进行对比,从指令Cache的访问次数、命中次数、缺失次数和命中率来统计指令Cache的性能,其仿真结果如表1所示。

 

    表1的仿真结果表明,本文提出的PLRU替换算法其命中率高于其他三种替换算法,且实现PLRU替换算法的硬件代价相对于LRU替换算法要低。通过验证,高性能BWDSP处理器其整体性能都高于其他三种方法的1.12倍。

 

    高性能DSP处理器是未来DSP发展趋势,高速缓存器的多层次存储器体系结构是提高数字信号处理器系统性能的重要方法。本文在32 bit BWDSP基础上提出了基于PLRU替换算法的512 bit指令包的指令Cache研究,通过实验仿真,指令Cache的PLRU替换算法在指令Cache的命中率比FIFO , RLU , Random替换算法都要高出约5.0%。

上一页  [1] [2] [3] 

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分)
Copyright © 2007-2017 down.gzweix.Com. All Rights Reserved .
页面执行时间:58,035.16000 毫秒