文章摘要
陈朋,陈庆清,王海霞,张怡龙,刘义鹏,梁荣华.基于改进动态配置的FPGA卷积神经网络加速器的优化方法[J].高技术通讯(中文),2020,30(3):240~247
基于改进动态配置的FPGA卷积神经网络加速器的优化方法
  
DOI:doi:10.3772/j.issn.1002-0470.2020.03.004
中文关键词: 卷积神经网络(CNN); 现场可编程门阵列(FPGA); 模块复用; 流水线; 动态定点
英文关键词: 
基金项目:
作者单位
陈朋  
陈庆清  
王海霞  
张怡龙  
刘义鹏  
梁荣华  
摘要点击次数: 2550
全文下载次数: 1614
中文摘要:
      卷积神经网络(CNN)已广泛应用于各种计算机视觉任务,基于GPU的卷积神经网络加速器往往存在功耗较高、体积较大和成本较高的问题。针对上述问题,文中提出一种基于改进动态配置的现场可编程门阵列(FPGA)卷积神经网络加速器的优化方法。使用高层次综合工具,在引入分割参数的基础上,通过在资源约束情况下基于流水线结构的层间模块复用,采用8 16位动态定点设计方案,以有限的硬件资源实现性能优化的卷积神经网络硬件结构,提升计算效率的同时缩短了开发周期。利用该方法在ZCU102平台上构建实现了AlexNet网络和VGG网络。在最大精度损失0.63%的条件下,将加速器性能分别从46.3fps和37.2fps提高到290.7fps和54.4fps,计算能效分别达到了TITAN X的1.78倍和3.89倍。实验数据充分说明,采用改进动态配置的优化方法,利用高层次综合工具进行开发的FPGA卷积加速器,既满足了计算实时性的要求,同时也解决了功耗和体积问题,验证了本方法的有效性。
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮