吴林阳,杜伟健,陈小兵,庄毅敏.一种运算和数据协同优化的深度学习编译框架[J].高技术通讯(中文),2020,30(2):120~125 |
一种运算和数据协同优化的深度学习编译框架 |
|
|
DOI:doi:10.3772/j.issn.1002-0470.2020.02.002 |
中文关键词: 深度学习; 深度学习处理器; 编译器; 编译优化 |
英文关键词: |
基金项目: |
|
摘要点击次数: 2753 |
全文下载次数: 1729 |
中文摘要: |
近年来,深度学习算法和深度学习处理器已被广泛应用于工业界,如何从软件层面充分挖掘深度学习处理器的性能成为目前编译器领域研究的热点和难点。现有的深度学习编译框架更侧重于对程序的运算部分进行优化,对数据的优化非常有限,这并不能发挥深度学习处理器的峰值性能。本文分析了深度学习算法和硬件平台的特点,提出一种运算和数据协同优化的深度学习编译框架CDUCA,它包含计算图引擎、代码生成器、数据优化器3个不同层次的组件,在多个层次对运算和数据进行协同优化,最终生成高效的可部署模型。本文在现场可编程门阵列(FPGA)平台上评估了CDUCA,实验结果表明,对于典型的深度学习应用,CDUCA生成的模型性能能达到手工优化模型性能的86.5%。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|