共 3 条
基于OpenCL的拉普拉斯图像增强算法优化研究
被引:20
|作者:
贾海鹏
[1
,2
]
张云泉
[1
,3
]
龙国平
[1
]
徐建良
[2
]
李焱
[1
,4
]
机构:
[1] 中国科学院软件研究所并行软件与计算科学实验室
[2] 中国海洋大学信息科学与工程学院
[3] 中国科学院软件研究所计算机科学国家重点实验室
[4] 中国科学院研究生院
来源:
基金:
国家自然科学基金重点项目;
关键词:
OpenCL;
通用计算;
拉普拉斯算法;
跨平台;
D O I:
暂无
中图分类号:
TP391.41 [];
学科分类号:
080203 ;
摘要:
OpenCL是面向异构计算平台的通用编程框架,然而由于硬件体系结构的差异,如何在平台间功能移植的基础上实现性能移植仍是有待研究的问题。当前已有算法优化研究一般只针对单一硬件平台,它们很难实现在不同平台上的高效运行。在分析了不同GPU平台底层硬件架构的基础上,从Global Memory的访存效率、GPU计算资源的有效利用率及其硬件资源的限制等多个角度考察了不同优化方法在不同GPU硬件平台上对性能的影响;并在此基础上实现了基于OpenCL的拉普拉斯图像增强算法。实验结果表明,优化后的算法在不考虑数据传输时间的前提下,在AMD和NVIDIA GPU上都取得了3.7~136.1倍、平均56.7倍的性能加速,优化后的kernel比NVIDIA NPP库中相应函数也取得了12.3%~346.7%、平均143.1%的性能提升,验证了提出的优化方法的有效性和性能可移植性。
引用
收藏
页码:271 / 277
页数:7
相关论文