瑞萨科技(
Renesas Technology)日前宣布,已开发出一种适用于图像和音频多媒体数据处理、基于矩阵架构的大规模并行可编程处理器,具有紧凑的2,048个处理单元和1Mb SRAM,可在
200MHz的时钟频率下实现40GOPS(每秒运行10亿次)的性能。
图像和音频多媒体数据处理能力对数字家电和其他电子产品至关重要。迄今为止,对这些运算的处理通常是使用硬连接逻辑电路或专门用于数字信号处理的DSP。最近随着像素数迅速增加的多媒体应用的戏剧性进展,增加了改善多媒体数据处理性能的需求。与此同时,为了简化对各种多媒体数据标准的支持,利用可编程器件实现这种处理的需求也在日益增长。
改善处理性能的一种方式是通过使用更精细的半导体工艺来提高工作频率。然而,在继续保持更低功耗的同时获得性能方面的重要改善,并利用传统的DSP和类似的架构实现所需的性能是很困难的。虽然粗粒度多指令多数据(MIMD)处理器已经发布,它可作为一种提高处理性能的架构,不过它也存在降低功耗的问题。
为了解决这些问题,瑞萨科技利用源于DSP或MIMD类型处理器的一种独特的存储器技术开发了一种矩阵型处理器。这种新型处理器是细粒度单指令多数据(SIMD)类型的大规模平行可编程器件,它具有以下的结构特点。
1. 基本配置:2位处理单元和作为专用数据寄存器的512位SRAM
2. 2,048个PE和总共1Mb的SRAM,以及与PE之间的紧密连接
这种处理器提高性能的关键在于如何有效地使处理单元独立工作。同时,布局和处理单元及数据寄存器的连接是降低占板面积和功耗的重要因素。
采用新技术的原型处理器是以90nm CMOS工艺在一个3.1mm2内核区域实现的,可实现
200MHz时钟频率下40GOPS的处理性能,其功耗为250mW。与传统的内置DSP相比,这些特性表明按照单位面积比和单位功率比计算,能量效率分别提高了70倍和13倍。