文章摘要
余磊,刘志勇,马宜科,宋风龙,徐卫志,叶笑春.众核结构上分块LU分解算法的研究[J].高技术通讯(中文),2011,21(3):
众核结构上分块LU分解算法的研究
Study on blocked LU decomposition on many-core architecture
  
DOI:
中文关键词: 计算机体系结构;众核;加速比;负载均衡;LU分解
英文关键词: 
基金项目:863计划,973计划,国家自然科学基金,国家杰出青年科学基金,国家自然科学基金创新研究群体科学基金,北京自然市自然科学基金
余磊,刘志勇,马宜科,宋风龙,徐卫志,叶笑春
余磊,马宜科,徐卫志,Yu Lei,Ma Yike,Xu Weizhi(中国科学院计算技术研究所系统结构重点实验室,北京100190;中国科学院研究生院,北京100039)
;刘志勇,宋风龙,叶笑春,Liu Zhiyong,Song Fenglong,Ye Xiaochun(中国科学院计算技术研究所系统结构重点实验室,北京,100190)
摘要点击次数: 3341
全文下载次数: 0
中文摘要:
      针对科学计算中的经典程序LU分解进行了深入研究.在仔细分析LU分解算法的基础上,提出了一个理想加速比模型,实现了基于比特翻转异或(BRX)的算法,进而提出了一个动态绝对均衡策略(DABP)算法.为了评估2D scatter算法、BRX算法和DABP 算法3种负载均衡算法的效果,提出了两种负载均衡评估函数,并用这两个函数验证了DABP算法的有效性.在众核结构Godson-T上仿真了3种算法,试验结果表明,在使用64个处理器核的情况下,DABP算法加速比达到46,是3个算法中性能最好的.
英文摘要:
      
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮