余磊,刘志勇,马宜科,宋风龙,徐卫志,叶笑春.众核结构上分块LU分解算法的研究[J].高技术通讯(中文),2011,21(3): |
众核结构上分块LU分解算法的研究 |
Study on blocked LU decomposition on many-core architecture |
|
DOI: |
中文关键词: 计算机体系结构;众核;加速比;负载均衡;LU分解 |
英文关键词: |
基金项目:863计划,973计划,国家自然科学基金,国家杰出青年科学基金,国家自然科学基金创新研究群体科学基金,北京自然市自然科学基金 |
余磊,刘志勇,马宜科,宋风龙,徐卫志,叶笑春 |
余磊,马宜科,徐卫志,Yu Lei,Ma Yike,Xu Weizhi(中国科学院计算技术研究所系统结构重点实验室,北京100190;中国科学院研究生院,北京100039) ;刘志勇,宋风龙,叶笑春,Liu Zhiyong,Song Fenglong,Ye Xiaochun(中国科学院计算技术研究所系统结构重点实验室,北京,100190)
|
摘要点击次数: 3341 |
全文下载次数: 0 |
中文摘要: |
针对科学计算中的经典程序LU分解进行了深入研究.在仔细分析LU分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法.为了评估2D scatter算法、BRX算法和DABP 算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性.在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的. |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|