邬贵明,王淼,谢向辉,窦勇.稀疏矩阵LU分解的FPGA实现[J].高技术通讯(中文),2013,23(8):789~796 |
稀疏矩阵LU分解的FPGA实现 |
|
|
DOI: |
中文关键词: 稀疏矩阵,LU分解,并行算法,现场可编程门阵列(FPGA),任务并行 |
英文关键词: |
基金项目: |
作者 | 单位 | 邬贵明 | 数学工程与先进计算国家重点实验室 | 王淼 | 江南计算技术研究所 | 谢向辉 | 数学工程与先进计算国家重点实验室 | 窦勇 | 国防科学技术大学计算机学院 |
|
摘要点击次数: 3758 |
全文下载次数: 2893 |
中文摘要: |
研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结构不依赖于分解因子的稀疏结构信息,分解因子的数据结构可动态生成。与相关工作比较,这种新的硬件结构具有更好的通用性。实验结果表明,这种新的结构的性能优于通用处理器的软件实现。 |
英文摘要: |
|
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|