牛新,周杰,窦勇,雷元武.可选主元LU分解流水线算法设计与FPGA实现[J].高技术通讯(中文),2009,19(5):511~518 |
可选主元LU分解流水线算法设计与FPGA实现 |
|
|
DOI: |
中文关键词: LU分解, 流水线, 并行算法, 列主元选取, 现场编程门阵列(FPGA) |
英文关键词: |
基金项目: |
作者 | 单位 | 牛新 | 国防科技大学计算机学院 | 周杰 | 国防科技大学计算机学院 | 窦勇 | 国防科技大学计算机学院 | 雷元武 | 国防科技大学计算机学院 |
|
摘要点击次数: 3231 |
全文下载次数: 2200 |
中文摘要: |
提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与Celeron(R) 3.07GHz通用处理器主机相比可以得到平均6到7倍的加速比。与其他在FPGA上实现的LU分解算法相比,该算法在占用相对较少资源和保持高分解效率的前提下提高了计算的精确度和稳定性。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|