您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> Linux服務器

Ubuntu 9.04下CUDA編程起步

前一陣子把蟻群算法和改進的K-Means算法都搞定了，然後一直在看CUDA編程，前面看CUDA的介紹，一直認為會C之後CUDA就很容易上手，其實不然，還需要了解一些GPU的體系結構相關的知識才能寫出好的程序來。《GPU高性能運算之CUDA》這本書看完一遍之後感覺它更像一個手稿整理，把之前的恆多文檔整理了一下出了一本書，因為是集大家的智慧，講的還不錯，就是順序上安排的不是太好。有總比沒有好，看過一遍之後，對CUDA編程還是有一些底氣的。推薦新手也先看看。

　　看書歸看書，寫程序是另外一件事情，上一篇文章裡把環境搭建起來了，可是我還是不知道怎麼創建CUDA工程，怎麼動手開始寫程序。還好CUDA提供了一個SDK，裡面有很多的實例可以供我們參考，於是乎，我的第一個CUDA程序就從這裡開始了。

　　CUDA SDK的實例都在src目錄下，每一個實例都有一個自己的目錄,例如deviceuery，在它的目錄下還有一個編譯時候使用的Makefile文件，這是編譯單個項目的。現在我們將所有實例都編譯一遍，在CUDA_SDK根目錄下運行sudo make之後，可以在 <CUDA_SDK_HOME>/bin/linux/release下看到編譯之後的可執行程序，運行即可看到結果。

　　這是deviceQuery的運行結果：

點擊查看大圖

　　那麼到這裡相信讀者應該想到了我們完全可以利用這些實例來創建我們自己的工程。再實例中有一個template，將該目錄下src中的.cu、.cpp文件刪除，將obj目錄下的內容清空，這就成為一個空的CUDA工程，可以再src下編寫程序，然後在Makefie中將編譯的文件名修改正確，編譯即可。所生成的執行文件在CUDA_SDK_HOME/bin/linux/release下。這裡是一個測試代碼，執行矩陣加法運算的：

　　1 #include <stdio.h>

　　2 #include <stdlib.h>

　　3 #include <time.h>

　　4 #include <cuda_runtime.h>

　　5 #include <cutil.h>

　　7 #define VEC_SIZE 16

　　9 //kernel function

　　10 __global__ void vecAdd(float* d_A,float* d_B,float* d_C)

　　11 {

　　12 int index=threadIdx.x;

　　13 d_C[index]=d_A[index]+d_B[index];

　　14 }