GPU發(fā)展及CUDA編程介紹

上傳人:lx****y 文檔編號:253226164 上傳時間:2024-12-03 格式:PPT 頁數(shù):31 大?。?.22MB
收藏 版權(quán)申訴 舉報 下載
GPU發(fā)展及CUDA編程介紹_第1頁
第1頁 / 共31頁
GPU發(fā)展及CUDA編程介紹_第2頁
第2頁 / 共31頁
GPU發(fā)展及CUDA編程介紹_第3頁
第3頁 / 共31頁

下載文檔到電腦,查找使用更方便

30 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《GPU發(fā)展及CUDA編程介紹》由會員分享,可在線閱讀,更多相關(guān)《GPU發(fā)展及CUDA編程介紹(31頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本

2、樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,GPU,發(fā)展及,CUDA,編程介紹,1,GPU,是什么?,為什么使用,GPU,?,GPU,在通用計算上的應(yīng)用,GPU,的整體架構(gòu),GPU,編程的優(yōu)缺點,GPU,的未來,GPU,發(fā)展,2,Graphic Processing Unit,:圖形處理器,顯卡的處理核心,NVIDIA,公司在,1999,年發(fā)布,Geforce 256,圖形處理芯片時首先提出,GPU,的概念,隨后大

3、量復(fù)雜的應(yīng)用需求促使整個產(chǎn)業(yè)蓬勃發(fā)展至今。,Geforce 256,之所以被稱作,GPU,原因就在于,Geforce 256,劃時代的在圖形芯片內(nèi)部集成了,T&L,(幾何光照轉(zhuǎn)換)功能,使得,GPU,擁有初步的幾何處理能力,徹底解決了當(dāng)時眾多游戲瓶頸發(fā)生在,CPU,幾何吞吐量不夠的瓶頸。,GPU,是什么,3,第一代,GPU(1999,年之前,),:,部分功能從,CPU,分離,實現(xiàn)硬件加速,,GE(Geometry Engine),為代表,只能起到,3D,圖像處理的加速作用,不具有軟件編程特性,第二代,GPU(1999-2002,年,),:,進(jìn)一步硬件加速和有限的編程性,1999,年,NVIDI

4、A GeForce 256,將,T&L(Transform and Lighting),等功能從,CPU,分離出來,實現(xiàn)了快速變換,2001,年,NVIDIA,和,ATI,分別推出的,GeForce3,和,Radeon 8500,,圖形硬件的流水線被定義為流處理器,出現(xiàn)了頂點級可編程性,同時像素級也具有有限的編程性,但,GPU,的編程性仍然比較有限,第三代,GPU(2002,年之后,),:,2006,年,NVIDIA,推出了,CUDA(Computer Unified Device Architecture,,統(tǒng)一計算架構(gòu),),編程環(huán)境,GPU,通用計算編程的復(fù)雜性大幅度降低,GPU,已演化為

5、一個新型可編程高性能并行計算資源,全面開啟面向通用計算的新時代,GPU,是什么,4,為什么使用,GPU,1,:強(qiáng)大的處理能力,2,:高顯存帶寬,5,HPC Top500 List,為什么使用,GPU,6,中國,HPC Top100 List,為什么使用,GPU,7,GPU,在通用計算上的應(yīng)用,工業(yè)設(shè)計,醫(yī)學(xué)研究,石油勘探,物理學(xué)研究,8,GPU的整體架構(gòu),與CPU相比,GPU具有更多的計算單元,但對于復(fù)雜控制過程的處理能力則比CPU差,GPU更適用于同時進(jìn)行大量簡單的統(tǒng)一操作,9,GPU的整體架構(gòu),基本硬件架構(gòu),:,流多處理器(Stream Multiprocessor),流處理器(Strea

6、m Processor),共享內(nèi)存(Shared Memory),板載顯存(Device Memory),10,GPU,的整體架構(gòu),Tesla,Fermi,11,高度并行,處理速度,傳輸帶寬,可擴(kuò)展性,算法設(shè)計,編程實現(xiàn),程序優(yōu)化,程序調(diào)試,GPU,編程的優(yōu)缺點,12,融合?,整合?,GPU,的未來,13,Intel,和,AMD,都計劃在未來的,CPU,中集成北橋功能和,GPU,模塊,這會給,NVIDIA,帶來什么影響?,GPU,生來就是做圖形計算的,不是和,CPU,競爭的,二者應(yīng)當(dāng)肩并肩生存。,CUDA,技術(shù)不是讓,GPU,取代,CPU,的。我相信,GPU,不需要集成不同類型的核心。,GPU

7、,的未來,14,CUDA,是什么?,CUDA,的使用,CUDA,編程算法實例,CUDA,編程的優(yōu)缺點,CUDA,的未來,CUDA,編程,15,Compute Unified Device Architecture,:統(tǒng)一計算設(shè)備架構(gòu),是由,NVIDIA,推出的通用并行計算架構(gòu),(2006,年,11,月第一顆基于,CUDA,架構(gòu)的,GPU,,,2007,年,CUDA C,語言發(fā)布,),CUDA,是什么,16,一種可擴(kuò)展的編程模型,CUDA,是什么,17,CUDA,是什么,GPU,中的并行層次,網(wǎng)格中塊的并行,,blockIdx,全局存儲器通信;,同一塊里的線程的并行,,threadIdx,全局存

8、儲器、共享存儲器通信。,18,CUDA,是什么,GPU內(nèi)線程分布結(jié)構(gòu),在CUDA中,采用SIMT(Single Instruction,Multiple Thread)的執(zhí)行方式,19,一種異構(gòu)多核的并行編程模型,CPU的控制流程,CPU,控制整個程序的運行過程,在需要并行計算時候?qū)?shù)據(jù)傳入,GPU,從,GPU,得到計算結(jié)果繼續(xù)執(zhí)行程序,GPU的計算流程,GPU,接受來自主機(jī)的數(shù)據(jù),并行計算,將結(jié)果返回給主機(jī),CUDA,的使用,20,CUDA,的使用,CPU控制整個程序的主流程,GPU為協(xié)處理器,主存(Host Memory),顯存(Device Memory),21,處理程序中的并行計算部分

9、,核函數(shù)(kernel function),CUDA,的使用,/CPU program,/sum of two vectors a and b,void add_cpu(float*a,float*b,int N),for(int idx=0;idxN;idx+),aidx+=bidx;,void main(),.,add_cpu,(a,b,N);,/CUDA program,/sum of two vectors a and b,_global_ void add_gpu(float*a,float*b,int N),int idx=blockIdx.x*blockDim.x+threadI

10、dx.x;,if(idx(a,b,N);,22,矩陣乘法:,A B=C,CUDA,的算法實例,23,CUDA,的算法實例,CPU中利用三層循環(huán)實現(xiàn)矩陣乘法,代碼,24,CUDA,的算法實例,GPU中利用每個線程計算一個元素,每個線程每次計算的數(shù)據(jù)直接從全局存儲器讀取,無分塊矩陣乘法代碼,不使用共享存儲器,25,GPU,中實現(xiàn)矩陣乘法的核函數(shù)代碼:,CUDA,的算法實例,26,CPU,與,GPU,的矩陣乘法時間比較,CPU,:,Quad2 Q8400,GPU,:,GeForce GTX460,CUDA,的算法實例,27,易學(xué),易用,高度并行化,可擴(kuò)展,數(shù)據(jù)傳輸,與,CPU,交互,優(yōu)化及調(diào)試,僅限于,N,卡,CUDA,編程的優(yōu)缺點,28,CUDA,?,OpenCL,?,CUDA,的未來,29,謝謝!,30,參考文獻(xiàn),31,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!