ISL-IH030 【多執行緒CUDA程式設計 】 |
文件 |
說明 |
下載點 |
ISL-IH030-C1 【多執行緒CUDA程式設計 】 |
本報告是以矩陣相乘之範例,說明如何撰寫CUDA平行處理程式與利用CUDA之最佳化方法,達到GPU高效率平行運算,並探討使用不同之CUDA記憶體對效能之影響。使用之作業系統為Windows XP Professional SP3,CPU 為Inter(R) Core(TM) 2 Duo CPU E8400 @ 1.86GHZ,編譯器為Visual Studio 2008,平行運算卡為Tesla C1060,CUDA版本為2.3版。在此環境下,本報告使用Shared Memory搭配Coalesced I/O特性之GPU版本,執行效率比CPU版本快約260倍。 |
立即下載 | |
|