解决GPU难题,ARM发布的DPU有啥用?
安谋(Arm)日前推出了Mali-D71、CoreLink MMU-600及Assertive Display 5这三项全新的显示解决方案。 其中,Mali-D71是安谋推出的新概念方案,称为显示处理器(DPU),定位为绘图处理器(GPU)的协处理器。 该处理器可支持4K 120FPS画面输出,有助于降低GPU工作量,对运算任务吃重的VR应用而言,将是一大福音。
有鉴于VR带动市场对高阶行动装置屏幕的需求逐渐上升,4K以上分辨率以及更高的帧率,衍生出不少系统效能方面的难题。 对此,Mali-D71采用固定功能的硬件组件来执行迭加、旋转、高质量缩放以及其他图像处理,GPU完全不须参与这些作业,故可有效降低GPU工作量。
Arm多媒体处理器部区域市场经理吕建英表示,虽GPU运算能力很强大,但若将所有的处理工作都放在GPU上,势必会使其功耗过大,若能将固定的处理工作放到Mail显示处理器上,将可有效降低整体的系统功耗,并有助于效能上的提升。
事实上,这样的架构在业界已行之多年,但过去主要是由联发科等SoC厂商自行开发,例如在GPU后加上显示子系统(Display Sub-system)。 Arm此次推出的硅智财(IP)便是补上这个缺口,实现运算任务分配的优化。 除此之外,在数据传输的部分,由于VR 4K显示所需的带宽势必很大,因此Arm也提供自家的数据压缩格式,有助于缩小系统内存与纾解带宽压力。
吕建英进一步表示,由于GPU的能力主要是在绘图而非在显示数据的处理上,因此若没有DPU的协助,要处理VR装置的显示数据,是比较费力的。 具体而言,虽GPU也可进行压缩,但其处理方式与DPU大不相同。 相较于DPU可处理完多项任务后进行压缩与一次性输出,GPU则必须进行多次读取、处理与输出,不利于降低整体系统功耗。
此外,不同于前一代的Mali-DP650,Mali-D71将能在相同数据吞吐量的情况下,容许系统总线上4倍的延迟。 当要呈现4K分辨率的画面时,帧率至少必须达到120FPS,显示处理器使用系统总线的时间也必须优化。 当没有显示画面时,显示处理器必须预先撷取画素信息,才能在缓冲区一直保有充分的内容,并容忍更高的延迟。