《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》電子教案(課6).ppt
《《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》電子教案(課6).ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)》電子教案(課6).ppt(32頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),1,第5章 指令級(jí)并行硬件方法(P111)(指令級(jí),多發(fā)射或亂序執(zhí)行,動(dòng)態(tài)調(diào)度),本章學(xué)習(xí)由硬件(即流水線控制器)實(shí)現(xiàn)的指令級(jí)并行方法,主要內(nèi)容是流水線的多指令控制技術(shù),目的是讓處理機(jī)中同時(shí)流動(dòng)更多的指令,減少各種原因造成的停頓,以縮短程序執(zhí)行時(shí)間。 5.1 指令級(jí)并行的概念(重點(diǎn)) 5.2 相關(guān)與指令級(jí)并行 5.3 指令的動(dòng)態(tài)調(diào)度 5.4 動(dòng)態(tài)分支預(yù)測(cè)技術(shù)(重點(diǎn)) 5.5 多指令流出技術(shù)(重點(diǎn)),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),2,從執(zhí)行程序的角度來(lái)看,并行性等級(jí)從低到高可分為: 指令內(nèi)部并行:?jiǎn)螚l指令中各微操作之間的并行。 指令級(jí)并行:并行執(zhí)行兩條或
2、兩條以上的指令。 線程級(jí)并行:并行執(zhí)行兩個(gè)或兩個(gè)以上的線程。通常是以一個(gè)進(jìn)程內(nèi)派生的多個(gè)線程為調(diào)度單位。 任務(wù)級(jí)或過(guò)程級(jí)并行:并行執(zhí)行兩個(gè)或兩個(gè)以上的過(guò)程或任務(wù)(程序段)。以子程序或進(jìn)程為調(diào)度單元。 作業(yè)或程序級(jí)并行:并行執(zhí)行兩個(gè)或兩個(gè)以上的作業(yè)或程序。,并行性等級(jí)的劃分(P23,1.5.1節(jié)),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),3,指令級(jí)并行的英文縮寫(xiě)是ILP (Instruction-Level Parallelism) 開(kāi)發(fā)ILP的途徑有兩種: 資源重復(fù),重復(fù)設(shè)置多個(gè)處理部件,讓它們同時(shí)執(zhí)行相鄰或相近的多條指令; 采用流水線技術(shù),使指令重疊并行執(zhí)行。 (1)狹義指令級(jí)并行 超標(biāo)量
3、SuperScalar (設(shè)備重復(fù)) 超長(zhǎng)指令字Very Long Instruction Word(簡(jiǎn)稱(chēng)VLIW) (2)廣義指令級(jí)并行 流水線Pipeline (設(shè)備細(xì)分) 超級(jí)流水線Super Pipeline (3)線程級(jí)并行 超線程Hyper-Threading(簡(jiǎn)稱(chēng)HT) (4)任務(wù)線程 多核處理機(jī)Multicore,5.1 指令級(jí)并行的概念,,,,,,,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),4,靜態(tài)調(diào)度(軟件方法):在程序執(zhí)行前,在編譯過(guò)程中對(duì)目標(biāo)指令序列進(jìn)行優(yōu)化,避免將來(lái)由于相關(guān)和沖突造成的停頓。主要手段是將沖突指令錯(cuò)開(kāi)啟動(dòng)時(shí)間、變
4、量換名等。 動(dòng)態(tài)調(diào)度(硬件方法):在程序執(zhí)行中,由專(zhuān)門(mén)硬件預(yù)測(cè)將要發(fā)生的沖突、控制指令在流水線中的流動(dòng),避免停頓。 2. 流水線處理機(jī)的實(shí)際CPI = 理想流水線的CPI加上各類(lèi)停頓的時(shí)鐘周期數(shù): CPI流水線 = CPI理想 + 停頓結(jié)構(gòu)沖突 + 停頓數(shù)據(jù)沖突 + 停頓控制沖突 CPI理想是衡量流水線最高性能的一個(gè)指標(biāo)。本式表明降低實(shí)際CPI有許多途徑。 換一個(gè)角度,有時(shí)從CPI的倒數(shù)看問(wèn)題會(huì)有新思路,IPC(Instructions Per Cycle)是每個(gè)時(shí)鐘周期完成的指令條數(shù)。 在不能縮短單條指令周期數(shù)的情況下,在每個(gè)時(shí)鐘周期里啟動(dòng)更多的指令(提高IPC),同樣可以提高處理
5、機(jī)的性能。這就是ILP的基本思想。,1. 開(kāi)發(fā)ILP的方法分類(lèi),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),5,基本程序塊:一串連續(xù)的代碼除了入口和出口以外,沒(méi)有其他的分支指令和轉(zhuǎn)入點(diǎn) 。 程序平均每47條指令就會(huì)有一個(gè)分支。 4. 循環(huán)級(jí)并行:使一個(gè)循環(huán)中的不同循環(huán)體并行執(zhí)行。 開(kāi)發(fā)循環(huán)的不同疊代之間存在的并行性(最常見(jiàn)、最基本思路) 這是指令級(jí)并行研究的重點(diǎn)之一 5. 最基本的開(kāi)發(fā)循環(huán)級(jí)并行的技術(shù) 循環(huán)展開(kāi)(loop unrolling)技術(shù) 采用向量指令和向量數(shù)據(jù)表示,3. 基本程序塊,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),6,多發(fā)射技術(shù)(Multiple Issue):同時(shí)啟動(dòng)多條指令。 為什么
6、要多發(fā)射?在傳統(tǒng)流水線上,要減少CPU時(shí)間,可以減少CPI或者Cycle。CPI的下限是1,減少Cycle碰到了“4G墻”(指Intel公司開(kāi)發(fā)4GHz P4計(jì)劃失敗,因?yàn)楣恼扔谥黝l3次方),工程師們無(wú)奈又回頭來(lái)打CPI的主意,想使CPI低于1,即在一個(gè)時(shí)鐘周期內(nèi)流出多條指令。 狹義的多指令流出技術(shù)(同時(shí)啟動(dòng))包括超標(biāo)量(Superscalar)和超長(zhǎng)指令字(VLIW),廣義的多指令流出技術(shù)(分時(shí)啟動(dòng))還包括超流水線(Superpipeline)等。 超標(biāo)量采用多條流水線的多發(fā)射技術(shù),每個(gè)時(shí)鐘周期流出的指令數(shù)不定,既可以使用編譯器靜態(tài)調(diào)度,也可以使用硬件動(dòng)態(tài)調(diào)度。 由于管理亂序流動(dòng)中指令相
7、關(guān)問(wèn)題的硬件復(fù)雜度非常大,所以目前超標(biāo)量CPU的ILP沒(méi)有超過(guò)8的。 采用單發(fā)射技術(shù)的傳統(tǒng)處理機(jī)又被稱(chēng)為“標(biāo)量處理機(jī)”。,5.5 多指令流出技術(shù)(又稱(chēng)多發(fā)射技術(shù),P141),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),7,超長(zhǎng)指令字CPU采用長(zhǎng)指令單發(fā)射,多個(gè)執(zhí)行部件同時(shí)執(zhí)行小指令的方法,每個(gè)時(shí)鐘周期流出的小指令數(shù)是限定的。在編譯過(guò)程中,由編譯程序來(lái)判斷實(shí)際指令之間的相關(guān)關(guān)系,進(jìn)行靜態(tài)調(diào)度,把抽取ILP的復(fù)雜工作轉(zhuǎn)移給編譯器,而執(zhí)行指令的硬件則大大簡(jiǎn)化,也比較規(guī)則,有利于低功耗設(shè)計(jì)。 超流水線則是將每個(gè)功能部件進(jìn)一步流水化,使得一個(gè)功能部件在一拍中可以分時(shí)處理多條指令。,5.5 多指令流出技術(shù)(續(xù)),
8、2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),8,5.5.0 超標(biāo)量技術(shù):一個(gè)時(shí)鐘節(jié)拍內(nèi)同時(shí)發(fā)射多條指令(P142第1段)。,時(shí)空?qǐng)D,“超標(biāo)量”的前身是“多操作部件技術(shù)”。它是通過(guò)“設(shè)備并聯(lián)”技術(shù)擴(kuò)充的單流水線,被擴(kuò)充的部件通常是運(yùn)算部件、訪存部件等“瓶頸”部件。,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),9,5.5.3 超長(zhǎng)指令字技術(shù)VLIW(P147,P163),把多條無(wú)相關(guān)關(guān)系的常規(guī)指令打包在一個(gè)超長(zhǎng)的指令字中,讓它們同時(shí)被處理,分別控制多個(gè)功能部件并行工作的技術(shù)。 每個(gè)操作放在一個(gè)槽(slot)內(nèi)。 這種技術(shù)的實(shí)質(zhì),是把超標(biāo)量技術(shù)中的相關(guān)性識(shí)別任務(wù),由CPU硬件轉(zhuǎn)移給程序員或編譯程序去實(shí)現(xiàn)。,2014
9、.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),10,5.5.5 超流水技術(shù):一個(gè)時(shí)鐘節(jié)拍內(nèi)分時(shí)發(fā)射多條指令(P149),時(shí)空?qǐng)D,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),11,附:超線程技術(shù)HT,通俗的理解就是將一顆具有超線程功能的“實(shí)體”處理器虛擬成兩個(gè)“邏輯”處理器,讓多個(gè)應(yīng)用程序或單一應(yīng)用程序的多個(gè)線程,能夠同時(shí)在同一顆處理器上執(zhí)行。 超線程運(yùn)行模式下,CPU中核心資源的利用率可提高3040%,也就是說(shuō)在同樣時(shí)間里可多執(zhí)行3040%的指令,其性能可以與含雙處理器的系統(tǒng)相媲美,但具有低得多的價(jià)格。 為了同時(shí)執(zhí)行多個(gè)線程,使用超線程技術(shù)的新一代P4 HT處理器需要增加一個(gè)邏輯處理器單元。因此面積比以往的P4增大了5
10、%。而其余部分如ALU(整數(shù)運(yùn)算單元)、FPU(浮點(diǎn)運(yùn)算單元)、L2 Cache(二級(jí)緩存)則保持不變,這些部分是被分享的。 雖然采用超線程技術(shù)能同時(shí)執(zhí)行兩個(gè)線程,但是當(dāng)兩個(gè)線程爭(zhēng)奪同一資源時(shí),其中一個(gè)要被阻塞,這時(shí)性能就不如兩個(gè)真正的CPU。 含有超線程技術(shù)的CPU需要主板(包括芯片組和BIOS)、軟件(包括操作系統(tǒng)和應(yīng)用軟件,如XP)支持,才能比較理想地發(fā)揮該項(xiàng)技術(shù)的優(yōu)勢(shì)。 超線程是一種過(guò)渡技術(shù),不久就被多核心技術(shù)取代。,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),12,對(duì)于多指令流出的處理機(jī),分支等待造成的性能下降比單流出機(jī)器更為顯著每停一拍要減少幾條指令,所以需要采取更復(fù)雜的解決辦法。 第
11、3章介紹了避免在分支(包括無(wú)條件跳轉(zhuǎn))指令后面空等待的幾種方法。 其中“在ID周期完成判斷并計(jì)算目標(biāo)地址”的方法把分支等待周期由3個(gè)減少到1個(gè),但是再要消除這1個(gè)等待周期就很難了。有的處理機(jī)做這兩件事需要的周期數(shù)還不止1個(gè)。 從上文調(diào)換不相關(guān)指令到“延遲槽”執(zhí)行的辦法固然可以避免這段時(shí)間的空等待,但是找不到不相關(guān)指令就不能用。 為了利用這種等待周期,還有一個(gè)辦法是“猜測(cè)”,不等“判跳”完成就開(kāi)始取下條指令,取完之后“判跳”結(jié)果也出來(lái)了,如果證明“猜對(duì)”就繼續(xù)執(zhí)行這條指令,“猜錯(cuò)”就報(bào)廢它。 為了容易實(shí)現(xiàn),一個(gè)CPU在設(shè)計(jì)時(shí)就把“猜”的方向設(shè)定了,即總是猜分支失敗(或者總是猜分支成功),這種猜法
12、的“猜對(duì)率”沒(méi)有保障。,5.4 動(dòng)態(tài)分支預(yù)測(cè)技術(shù)(P133),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),13,現(xiàn)在討論的“動(dòng)態(tài)分支預(yù)測(cè)技術(shù)”就是對(duì)每條分支指令完成之后的真實(shí)方向進(jìn)行記錄,下次再回到這條指令時(shí)就往上次的同一方向猜,猜對(duì)的可能性就增大了。萬(wàn)一有的指令是一會(huì)兒總是分支失敗,一會(huì)兒又總是分支成功(動(dòng)態(tài)變化),那也可以在猜錯(cuò)后及時(shí)修改記錄,以后就按新的方向猜。 “分支開(kāi)銷(xiāo)”指“猜對(duì)”、“猜錯(cuò)”兩種情況下流水線分別等待的時(shí)間(周期數(shù))。顯然,“猜錯(cuò)”時(shí)的開(kāi)銷(xiāo)更大,否則“猜”就沒(méi)有意義了。,5.4 動(dòng)態(tài)分支預(yù)測(cè)技術(shù)(續(xù)),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),14,分支歷史表的英文縮寫(xiě)是BHT(Br
13、anch History Table) (1) 1位BHT方法 表中給最近遇到的每條分支指令分配1個(gè)bit的記錄單元,0表示上次分支不成功,1表示上次分支成功。 BHT表可以設(shè)在指令Cache中,也可以用一個(gè)專(zhuān)門(mén)的RAM來(lái)實(shí)現(xiàn)。查表方法是相聯(lián)比較。表的容量決定了能為多少個(gè)“最近用到”的分支指令記錄歷史信息。裝滿之后可以按“先進(jìn)先出”或“最近最少使用”策略進(jìn)行替換。,5.4.1 分支歷史表 BHT 方法(P134),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),15,(2) 2位BHT方法 有的分支指令會(huì)有“臨時(shí)性換向”,比如一段循環(huán)程序末尾的“返回指令”可能在n-1次分支成功后跟1次分支失敗,但是下一次
14、再執(zhí)行這段循環(huán)程序,“返回指令”又應(yīng)該按分支成功猜測(cè)。為了避免“1位BHT方法”被這種偶然變化所“欺騙”,可以使用2bit信息記錄,只有連續(xù)2次“猜錯(cuò)”才會(huì)“改口”猜另一方向。具體算法見(jiàn)下圖。,5.4.1 分支歷史表 BHT 方法(續(xù)),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),16,分支目標(biāo)緩沖器的英文縮寫(xiě)是BTB(Branch-Target Buffer),也稱(chēng)分支目標(biāo)Cache(ranch-Target Cache)。 上面介紹的BHT表只保存了分支指令地址和成功轉(zhuǎn)移的方向,沒(méi)有保存成功轉(zhuǎn)移的目標(biāo)地址,即只猜“是否轉(zhuǎn)移”,不猜“轉(zhuǎn)到哪里”,在轉(zhuǎn)移成功情況下即使“猜對(duì)了”也需要另花時(shí)間計(jì)算目標(biāo)地
15、址,這對(duì)于判斷分支方向和計(jì)算目標(biāo)地址同時(shí)進(jìn)行的機(jī)器來(lái)說(shuō)起不到節(jié)省時(shí)間的作用。 分支目標(biāo)緩沖器BTB表里面增加了成功轉(zhuǎn)移的目標(biāo)地址,如果“猜”本次轉(zhuǎn)移成功就可以立即用它取指,不等待目標(biāo)地址的計(jì)算結(jié)果,而“猜”本次分支失敗則不需要使用目標(biāo)地址。所以BTB表只保存成功的分支指令地址及其目標(biāo)地址,不保存失敗的分支指令。遇到分支指令要“猜”時(shí),采用并行比較來(lái)搜索,搜到匹配項(xiàng)猜“分支成功” ,沒(méi)有匹配項(xiàng)猜“分支失敗” ,而后者不需要BTB提供目標(biāo)地址。,5.4.2 分支目標(biāo)緩沖器BTB方法,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),17,BTB表的結(jié)構(gòu):,分支目標(biāo)緩沖器BTB方法(續(xù)1),2014.2.17,計(jì)
16、算機(jī)系統(tǒng)結(jié)構(gòu),18,BTB預(yù)測(cè)方法邏輯分支圖:,分支目標(biāo)緩沖器BTB方法(續(xù)2),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),19,BTB預(yù)測(cè)機(jī)構(gòu)加入到流水線中:,分支目標(biāo)緩沖器BTB方法(續(xù)3),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),20,現(xiàn)在分析采用BTB預(yù)測(cè)方法的加速效果,以第3章末尾(P90)的改進(jìn)后的MIPS流水線為例。 在采用BTB預(yù)測(cè)方法之前,該流水線在ID周期進(jìn)行分支判斷與計(jì)算目標(biāo)地址,到EX周期才能取下一條指令,所以每條轉(zhuǎn)移指令之后有1個(gè)周期的固定延遲。 采用BTB預(yù)測(cè)方法之后,不同情況下的延遲周期數(shù)是不同的,下面分4種情形討論。,分支目標(biāo)緩沖器BTB方法(續(xù)4),2014.2.17,
17、計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),21,情形1:BTB命中,指令K轉(zhuǎn)移 延遲=0,分支目標(biāo)緩沖器BTB方法(續(xù)5),IF,ID,EX,Mem,WB,IF,ID,EX,Mem,WB,指令K,指令L,1.指令K取指,PC+4; 2.使用指令K的地址,檢索BTB表,命中,表明指令K上次轉(zhuǎn)移成功,猜此次仍轉(zhuǎn)移,PC 指令L的地址,1.指令K譯碼、判斷轉(zhuǎn)移、計(jì)算轉(zhuǎn)移目標(biāo)地址; 2.判斷結(jié)果是:轉(zhuǎn)移。所以“試取指令L”有效; 3.不改BTB表,猜指令K下次仍轉(zhuǎn)移到指令L,使用PC值,試取指令L(有效),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),22,情形2:BTB命中,指令K不轉(zhuǎn)移 延遲=2,分支目標(biāo)緩沖器BTB方法(續(xù)6),I
18、F,ID,EX,Mem,WB,ID,EX,Mem,WB,指令K,指令L,1.指令K取指,PC+4; 2.使用指令K的地址,檢索BTB表,命中,表明指令K上次轉(zhuǎn)移成功,猜此次仍轉(zhuǎn)移,PC 指令L的地址,1.指令K譯碼、判斷轉(zhuǎn)移、計(jì)算轉(zhuǎn)移目標(biāo)地址; 2.判斷結(jié)果是:不轉(zhuǎn)移。所以“試取指令L”無(wú)效,須報(bào)廢; 3.PC指令L的地址+4,使用PC值,試取指令L(無(wú)效),Str,IF,指令K+1,使用新PC值,改取指令K+1,刪除BTB表該項(xiàng),猜指令K下次不轉(zhuǎn)移,IF,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),23,情形3:BTB不命中,指令K轉(zhuǎn)移 延遲=2,分支目標(biāo)緩沖器BTB方法(續(xù)7),IF,ID,EX,
19、Mem,WB,ID,EX,Mem,WB,指令K,指令K+1,1.指令K取指,PC+4; 2.使用指令K的地址,檢索BTB表,不命中,表明指令K上次沒(méi)有轉(zhuǎn)移,猜此次仍不轉(zhuǎn)移,不改PC,1.指令K譯碼、判斷轉(zhuǎn)移、計(jì)算轉(zhuǎn)移目標(biāo)地址; 2.判斷結(jié)果是:轉(zhuǎn)移。所以“試取指令K+1”無(wú)效,須報(bào)廢; 3.PC指令L的地址,使用PC值,試取指令K+1(無(wú)效),Str,IF,指令L,使用新PC值,改取指令L,BTB表增添一項(xiàng),猜指令K下次轉(zhuǎn)移到指令L,IF,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),24,情形4:BTB不命中,指令K不轉(zhuǎn)移 延遲=0,分支目標(biāo)緩沖器BTB方法(續(xù)8),IF,ID,EX,Mem,WB,I
20、F,ID,EX,Mem,WB,指令K,指令K+1,1.指令K取指,PC+4; 2.使用指令K的地址,檢索BTB表,不命中,表明指令K上次沒(méi)有轉(zhuǎn)移,猜此次仍不轉(zhuǎn)移,不改PC,1.指令K譯碼、判斷轉(zhuǎn)移、計(jì)算轉(zhuǎn)移目標(biāo)地址; 2.判斷結(jié)果是:不轉(zhuǎn)移。所以“試取指令K+1”有效; 3.不改BTB表,猜指令K下次仍不轉(zhuǎn)移,使用PC值,試取指令K+1(有效),注意:該情形包括當(dāng)前指令是轉(zhuǎn)移指令但不成功、當(dāng)前指令不是轉(zhuǎn)移指令兩種情況。,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),25,小結(jié): 可見(jiàn),與不用BTB的時(shí)序相比,情形1、4減少了延遲,而情形2、3增加了延遲。 我們可以這樣計(jì)算: 平均轉(zhuǎn)移延遲=情形1概率0
21、+情形2概率2+情形3概率2+情形1概率0 如果平均值小于1,則新方法加快了轉(zhuǎn)移指令執(zhí)行速度,反之則減慢了速度。,分支目標(biāo)緩沖器BTB方法(續(xù)9),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),26,采用BTB預(yù)測(cè)方法后的CPI計(jì)算公式: 平均CPI = 理想CPI + 平均延遲周期數(shù) 由于平均CPI針對(duì)所有指令,所以還要把非轉(zhuǎn)移指令也考慮進(jìn)去,如下圖,分支目標(biāo)緩沖器BTB方法(續(xù)10),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),27,例5.6 設(shè)程序中轉(zhuǎn)移指令占20%,50%可以在BTB命中,命中的指令本次轉(zhuǎn)移概率為90%,未命中的指令本次轉(zhuǎn)移概率為60%,判斷轉(zhuǎn)移并計(jì)算地址的開(kāi)銷(xiāo)是2,修改BTB的開(kāi)銷(xiāo)是1
22、,非轉(zhuǎn)移指令的CPI=1。求平均CPI。 解:,分支目標(biāo)緩沖器BTB方法(續(xù)11),平均CPI = 1 + 20% 50%(90%0 + 10%3) + + 50%(60%3 + 40%0) = 1.21,2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),28,如果不采用BTB預(yù)測(cè)方法,每條轉(zhuǎn)移指令無(wú)論是否成功,都有2個(gè)周期的固定延遲。 平均CPI = 1 + 20%2 = 1.40 可見(jiàn),采用BTB預(yù)測(cè)方法有可能縮短平均CPI。,分支目標(biāo)緩沖器BTB方法(續(xù)12),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),29,5.8題假設(shè)有一條長(zhǎng)流水線,僅僅對(duì)條件轉(zhuǎn)移指令使用分支目標(biāo)緩沖。假設(shè)分支預(yù)測(cè)錯(cuò)誤的開(kāi)銷(xiāo)為4個(gè)時(shí)鐘周期
23、,緩沖不命中的開(kāi)銷(xiāo)為3個(gè)時(shí)鐘周期。假設(shè):命中率為90%,預(yù)測(cè)精度為90%,分支頻率為15%,沒(méi)有分支的基本CPI為1。 (1)求程序執(zhí)行的CPI。 (2)相對(duì)于采用固定的2個(gè)時(shí)鐘周期延遲的分支處理,采用哪種方法能使程序執(zhí)行速度更快? 分析:,分支目標(biāo)緩沖器BTB方法(續(xù)13),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),30,5.9題假設(shè)分支目標(biāo)緩沖的命中率為90%,程序中無(wú)條件轉(zhuǎn)移指令的比例為5%,沒(méi)有無(wú)條件轉(zhuǎn)移指令的程序CPI值為1。假設(shè)分支目標(biāo)緩沖中包含分支目標(biāo)指令,允許無(wú)條件轉(zhuǎn)移指令進(jìn)入分支目標(biāo)緩沖,則程序的CPI值為多少?假設(shè)原來(lái)的CPI=1.1。 分析:本題只考慮無(wú)條件轉(zhuǎn)移指令,所以取指后
24、100%會(huì)轉(zhuǎn)移,BTB命中開(kāi)銷(xiāo)=0拍,所缺的條件是不命中開(kāi)銷(xiāo)。再看,“原來(lái)的CPI”指使用BTB方法前的平均CPI,是1.1,理想CPI=1,由此可以解出原來(lái)的轉(zhuǎn)移開(kāi)銷(xiāo)。使用BTB方法后的不命中開(kāi)銷(xiāo)比它多1拍。,分支目標(biāo)緩沖器BTB方法(續(xù)14),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),31,思考題: 5.8題:BTB“命中率為90%”意味著什么?實(shí)際上有沒(méi)有可能達(dá)到? 參考觀點(diǎn):BTB表中存放最近一次執(zhí)行中轉(zhuǎn)移成功的轉(zhuǎn)移指令地址,它的命中率指程序中包含的全部轉(zhuǎn)移指令有百分之多少已經(jīng)存入。顯然,“條件轉(zhuǎn)移指令命中率為90%”的情形只能是90%以上條件轉(zhuǎn)移指令被執(zhí)行過(guò)后才可能出現(xiàn),即程序運(yùn)行的后期。我們要計(jì)算程序運(yùn)行全程的平均CPI,應(yīng)該引用BTB的平均命中率,通常應(yīng)該在50%左右。 一些特殊程序中,BTB平均命中率也可能達(dá)到90%,比如高次數(shù)循環(huán)。 該題的設(shè)計(jì)者為了證明“BTB方法能使程序執(zhí)行速度更快”,設(shè)定了特殊情況下的已知條件。 5.9題:根據(jù)BTB方法原理,BTB不命中開(kāi)銷(xiāo) = 指令本身的轉(zhuǎn)移開(kāi)銷(xiāo) + BTB表修改開(kāi)銷(xiāo)(1拍),但是習(xí)題指導(dǎo)書(shū)中的題解沒(méi)有加這1拍。 參考觀點(diǎn):該題解應(yīng)該修正。,分支目標(biāo)緩沖器BTB方法(續(xù)15),2014.2.17,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu),32,各次作業(yè)應(yīng)交的內(nèi)容,作業(yè)6(第6次課),5.11,5.8,5.9,
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。