管兆康*,张志伟**.基于NVDLA与FPGA结合的神经网络加速器平台设计[J].高技术通讯(中文),2021,31(5):479~488 |
基于NVDLA与FPGA结合的神经网络加速器平台设计 |
|
|
DOI:10.3772/j.issn.1002-0470.2021.05.003 |
中文关键词: 英伟达深度学习加速器(NVDLA); 现场可编程门阵列(FPGA); 硬件加速; 模块优化 |
英文关键词: |
基金项目: |
|
摘要点击次数: 2755 |
全文下载次数: 1536 |
中文摘要: |
随着深度神经网络对算力的需求不断增加,传统通用处理器在完成推理运算过程中出现了性能低、功耗高的缺点,因此通过专用硬件对深度神经网络进行加速逐步成为了深度神经网络的重要发展趋势。现场可编程门阵列(FPGA)具有重构性强、开发周期短以及性能优越等优点,适合用作深度神经网络的硬件加速平台。英伟达深度学习加速器(NVDLA)是英伟达开源的神经网络硬件加速器,其凭借自身出色的性能被学术界和工业界高度认可。本文主要研究NVDLA在FPGA平台上的优化映射问题,通过多种优化方案高效利用FPGA内部的硬件资源,同时提高其运行性能。基于搭建的NVDLA加速器平台,本文实现了对RESNET-50神经网络的硬件加速,完成了在ImageNet数据集上的图像分类任务。研究结果表明,优化后的NVDLA能显著提高硬件资源使用效率,处理性能最高可达30.8 fps,实现了较边缘中央处理器(CPU)加速器平台28倍的性能提升。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |