张立志* ** ***,赵士彭* ** ***,章隆兵* ** ***.GPU-Hi:GPU RTL平台实现及效率分析[J].高技术通讯(中文),2022,32(5):484~492 |
GPU-Hi:GPU RTL平台实现及效率分析 |
GPU-Hi: GPU RTL platform implementation and efficiency analysis |
|
DOI:10.3772/j.issn.1002-0470.2022.05.005 |
中文关键词: 图形处理器(GPU); 性能分析; glmark2; 流处理器集群 |
英文关键词: graphics processing unit (GPU), performance analysis, glmark2, stream processors cluster |
基金项目: |
作者 | 单位 | 张立志* ** *** | (*计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京 100190)
(**中国科学院计算技术研究所北京 100190)
(***中国科学院大学北京 100049) | 赵士彭* ** *** | (*计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京 100190)
(**中国科学院计算技术研究所北京 100190)
(***中国科学院大学北京 100049) | 章隆兵* ** *** | (*计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京 100190)
(**中国科学院计算技术研究所北京 100190)
(***中国科学院大学北京 100049) |
|
摘要点击次数: 1488 |
全文下载次数: 1111 |
中文摘要: |
实现了寄存器传输级(RTL)图形处理器(GPU)研究平台 ——GPU-Hi。GPU-Hi支持OpenGL 2.0 API,支持统一着色器渲染架构,使用专用集成电路(ASIC)完成图形流水线的固定功能算法,使用单指令多线程(SIMT)架构流处理器完成图形流水线的可编程着色器模块。在使用28nm工艺的情况下,该平台的物理设计面积为7.9μm2。使用glmark2的测试集作为性能测试程序,完成了该平台的功能正确性验证,同时使用该测试集研究了3D图形应用的计算特性,并进行了GPU微结构级的性能分析。测试结果表明,图形应用的光栅化任务与像素着色任务不随图形应用分辨率等比例增大;同时GPU硬件的光栅化模块性能受着色程序处理能力与显存访问能力的影响。本平台的实现对GPU RTL平台的研究发展有重要的借鉴价值,本文中得到的结论对GPU性能优化具有重要参考意义,有力支持了GPU硬件研究的发展。 |
英文摘要: |
GPU-Hi register-transfer level (RTL) graphics processing unit (GPU) research platform is established. GPU-Hi supports OpenGL 2.0 API (application programming interface), supports unified shader rendering architecture, uses application-specific integrated circuit (ASIC) to complete the fixed function algorithm of graphics pipeline, and uses single instruction multiple thread (SIMT) architecture to complete the programmable shader module of the graphics pipeline. In the case of using a 28nm process, the physical design area of the platform is 7.9μm2. Using glmark2 test set as the performance test program, the functional correctness of the platform is verified. At the same time, the test set is used to study the computing characteristics of 3D graphics applications, and the performance analysis of GPU microstructure level is performed. The test results show that the rasterization tasks and pixel shading tasks of graphics applications do not increase in proportion to the resolution of graphics applications; at the same time, the performance of the rasterization module of GPU hardware is affected by the processing power of the shading program and the ability of video memory access. The implementation of this platform is important for the research and development of the GPURTL platform. The conclusions obtained in this article have important reference significance for GPU performance optimization and strongly support the development of GPU hardware research. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |