TI 名为“KeyStone”的多内核 SoC 架构不仅功能强大而且极富创新性,从而使基站厂商能够从 LTE 等最新技术中显著受益。该架构具备的众多关键组件不仅可支持新的 LTE 功能,同时也可用于提升 WCDMA 等现有无线技术的性价比。图 6 对 KeyStone 架构进行了说明。
6
图 6 – KeyStone 多内核架构
TI KeyStone多内核架构拥有高度的灵活性,可同时集成定点与浮点运算、定向协处理与硬件加速,以及优化的内核间/组件间通信。此架构包括多个 C66x DSP 内核,能够支持高达 256 GMAC 的定点运算性能以及 128GFLOP 的浮点运算性能。另外,此架构还包括综合而全面的连接功能层:TeraNet2 能够与各种处理组件无缝互连;多内核共享内存控制器能直接接入片上共享存储器与外部第三代双倍数据速率 (DDR3) 存储器;多内核导航器可助于管理整个 SoC 架构的通信;以及 HyperLink 50 可与额外的协处理器或其他 TI SoC 等同伴器件实现互通互连。部分此类关键处理组件可在 TI SoC 上实现 LTE L2 与传输处理。
网络协处理器 网络协处理器是一款硬件加速器,能够减轻 DSP 内核处理往返于核心网络的以太网分组的工作量。网络协处理器包含 6 个微精简指令集计算 (&mICro;RISC) 内核,可加速自主的分组对分组处理。网络协处理器中的硬件模块 —— 分组加速器与安全加速器可在传输网络层以及深层无线电广播网络层实现快速通道处理。
网络协处理器在 LTE 传输/回程侧的功能特性包括:以太网/IP/包络安全有效负载 (ESP)/用户数据报协议 (UDP) 报头处理;循环冗余校验 (CRC) 验证与生成;IPSec 检测、认证、加密与解密;通用路由包络 (GRE) 隧道;基于 IPv4/6、传输控制协议 (TCP)/UDP、SCTP 端口或 GTP-U 隧道数据包的分类与路由;以及,基于 GTP-U 的服务质量。
7
在无线电广播端,网络协处理器可支持基于特定配置文件匹配(例如根据【RFC】4995 批注请求的未压缩大型数据包)与 3GPP 空中加密与解密的 RoHC。网络协处理器支持每秒 150 万个数据包(1Gbps 以太网线速)的处理速度,带相关安全上下文高速缓存的 64 条独立 IPSec 隧道,安全上下文在主存储器中的 8,192 条 IPSec 隧道,以及 8,192 个 GTP-U 隧道 ID 查询条目。
多内核导航器 多内核导航器使用一套队列管理器子系统与数据包直接存储器存取 (DMA) 子系统来控制与实施设备内的高速数据包移动,从而能够显著降低设备 DSP 的传统内部通信负载,进而提高整体系统性能。多内核导航器采用零复制方案在所有层进行数据处理优化。多内核导航器还支持分类与排序、多内核访问存储、存储器管理、分段与重组以及跨多个内核或器件进行交付。
队列管理器子系统包含 8,192 个硬件队列,负责加速数据包队列的管理。在队列管理器模块的特定存储器映射位置中写入 32 位描述符地址,即可将数据包添加至数据包队列。可通过读取特定队列相同地址来解除队列。
数据包 DMA 子系统包含 6 个数据包DMA,能够在 Serial RapidIO ® (SRIO)、第二代空中接口 (AIF2) 以及数据包加速器等器件中为管理数据包缓冲器的基础局端提供其它子系统。数据包 DMA是一个其数据目的地由一个目的地与自由描述符队列索引(而非绝对存储器地址)来决定的DMA。
快速通道处理与零复制方案 本部分探讨了如何使用 TI KeyStone 架构的关键处理组件来加速 LTE L2 网络与传输处理。上面介绍过的关键处理组件与 LTE L2 网络及传输处理功能相关。这些组件实现的快速通道处理与零复制方案对于使用 LTE 实现低时延与高吞吐量性能非常重要。
传输层处理 图 7 说明了如何使用网络协处理器来加速 LTE 传输层的处理。
图 7 – 传输层处理的加速
8
在核心网络端,数据包既可以通过具有内置串行千兆介质独立接口 (SGMII) 的千兆以太网接口也可以通过 SRIO 接口进入网络协处理器。数据包报头首先经过检验和验证(例如以太网 MAC 地址),然后被传输至 IPSec 终端。经过 IPSec 终端后,网络协处理器可检验内部报头是否与 GTP-U/UDP/IP 相匹配。随即执行 32 位 GTP-U ID 值的查找,并使用关联的 QoS 与无线电广播承载队列 (RBQ) 对进入的数据包进行分类。
RoHC 硬件可寻找描述匹配。可将数据包路由至软件RoHC处理(例如支持 RTP/UDP/IP报头压缩的 VoIP 数据包),或在经过 RoHC 硬件模块(例如根据 RFC4995 规定的未压缩大型数据包)执行最基本的“全硬件”处理后直接对 3GPP 进行加密。如果需要进行软件 RoHC 处理,在报头压缩后,RoHC SW 模块将数据包返回至网络协处理器进行 3GPP 空中加密。加密后,数据包被路由至相关的无线广播承载硬件队列,并在其中根据用于相似 QoS 数据包的算法来进行调度。向 RLC/MAC 模块交付调度授权后,其根据需要从 RBQ 弹出的数据包可将这些授权传递至 RLC/MAC 协议栈,并根据所授权的长度创建 MAC PDU。
总之,网络协处理器可创建全加速的自主快速通道处理,在大多数情况下可完全终止 S1-U/X2 用户层处理并为软件运行交付已分类的 RLC SDU。
L2 数据层处理 多内核导航器可为 LTE L2 数据(用户)层处理提供数据包基础局端。数据包基础局端可减轻从 DSP 分类的工作量,从而为零复制操作提供硬件,并为分段与重组提供硬件辅助。二者结合起来即可大幅加速 LTE L2 数据层的处理,以获得低时延、高吞吐量性能。