自上而下的語法分析.ppt

上傳人:za****8 文檔編號:14492555 上傳時間:2020-07-22 格式:PPT 頁數(shù):32 大小:331.01KB
收藏 版權申訴 舉報 下載
自上而下的語法分析.ppt_第1頁
第1頁 / 共32頁
自上而下的語法分析.ppt_第2頁
第2頁 / 共32頁
自上而下的語法分析.ppt_第3頁
第3頁 / 共32頁

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《自上而下的語法分析.ppt》由會員分享,可在線閱讀,更多相關《自上而下的語法分析.ppt(32頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、1,第4章 自上而下的語法分析,4.1 帶回溯的自上而下分析法概述 4.2 直接左遞歸的消除 4.3 不帶回溯的自上而下分析法的基本原理 4.4 提取左因子 4.5 first集和follow集 4.6 遞歸下降分析法 4.7 預測分析法,從文法的開始符號出發(fā)進行推導,最終推出確定的輸入串(由單詞種別構成的源程序)。,2,4.1 帶回溯的自上而下分析法概述,從根結點出發(fā),試圖用一切可能的辦法,自上而下地為輸入串建立一棵語法樹?;蛘哒f,為輸入串尋找一個最左推導。 分析過程概述 例已知文法G: SxAy A**|* 和輸入串=x*y。 初始時,指示器P指向的第一個符號x。 從S推導,因最左子

2、結和輸入串第1個符號相匹配,故P指向下一符號*。 因第二個子結是非終結符A,從A采用第一個候選進行推導。從A推導出的左子結和指示器P所指的符號一致,故P指向下一個符號y。 因A的第二個子結*和指示器P所指的符號不一致,這意味著A的第一個候選不適用于構造的語法樹,應該回溯。將A的子樹注銷,P恢復進入A時的值。 用A的第二個候選進行推導,因子樹A的子結和指示器P所指的符號*一致,則P指向下一個符號y。 因S的第三個子結和指示器P所指的符號一致,故是一個句子。,3,顯然上述分析過程本質(zhì)上是一個試探過程,是反復使用不同產(chǎn)生式謀求匹配輸入串的過程。,問題和困難 對于左遞歸文法定義的語言,不能采用自上而下

3、的語法分析法。 存在虛假匹配,回溯不可避免。 編譯程序的語法分析和語義分析通常是同時進行的。由于回溯,編譯程序所做的一大堆語義分析工作必須推倒重來。 當選用所有的不同候選組合,都不能為輸入串建立一棵語法樹,那么輸入串存在語法錯誤。這種分析法最終只能告知輸入串不是文法的一個句子,而無法告知輸入串錯在何處。 帶回溯的自上而下分析法實際上是一種窮盡一切可能的試探法,因此效率很低,這種分析法幾乎沒有實用價值。 總上所述,必須消除分析過程中的回溯,只有不帶回溯的分析方法才是實際可使用的。,4,4.2 直接左遞歸的消除,程序設計語言文法的左遞歸性通常是由左遞歸規(guī)則直接引起的,由規(guī)則推導所產(chǎn)生的間接左遞歸

4、的情況較少見。 實例引入 例:已知左遞歸文法G:SSa|b,構造文法G的等價文法G,G不含左遞歸。 解:文法G如下所示 SbS SaS| SSaSaaban 或 Sb L(G)= bann0 SbSbaSban 或 SbSb L(G)= bann0 L(G)= L(G) 文法G和G等價,而文法G不含左遞歸。,5,直接左遞歸消除方法 假定關于非終結符P的規(guī)則為 PP| 其中,不以P開頭??梢园殃P于P的規(guī)則變換為如下形式: PP PP| 由于二者推導出的句型均為n(n0),故上述變換是等價的。 例文法G: EE+T|T TT*F|F F(E)|i|x|y 經(jīng)消除直接左遞歸后變成 ETE E+T

5、E| TFT T*FT| F(E)|i|x|y,6,直接左遞歸消除一般規(guī)則及等價性證明 設非終結符P的產(chǎn)生式如下 PP1|P2||Pm|1|2||n 其中,i(1in)不以P開頭??蓪的規(guī)則改成如下等價形式,即可消除左遞歸。 P1P|2P||nP P1P|2 P||m P | 證: PP1| P2|| Pm|1|2||n 等價于 PP(1|2||m)|(1|2||n) 令=1|2||m、=1|2||n,則上式為: PP|。 消除直接左遞歸后變成 PP PP|,7,證: PP1| P2|| Pm|1|2||n 等價于 PP(1|2||m)|(1|2||n) 令=1|2||

6、m、=1|2||n,則上式為: PP|。 消除直接左遞歸后變成 PP PP| 用1|2||m替代,用1|2||n替代,則有 P(1|2||n)P P(1|2||m)P | 等價于 P1P|2P||nP P1P|2 P||m P |,8,4.3 不帶回溯的自上而下分析法的基本原理,設文法G有產(chǎn)生式:A1|2||n 帶回溯的自上而下的分析法 采用試探法,對于1、2直至n逐一試探。 不帶回溯的自上而下的分析法 在推導時,根據(jù)面臨的輸入符號去找出A的那個唯一正確的候選式。 對于文法某一句型,只要該文法不是二義文法,從非終結符A出發(fā)的最左推導只有一個候選是正確的。 如果該候選式獲得匹配,那么

7、這個匹配決不會是虛假的。若該候選式無法完成匹配任務,則任何其它候選式也肯定無法完成。,9,算法思想如下: 引入候選式的first集定義 first()=aa,aVT。 first()直觀意義是:從候選式出發(fā),推導出的所有符號串的第一個終結符,都屬于這個集合。 根據(jù)定義,求出每個候選式i的first集,設: first(1)=a1、b1、 first(2)=a2、b2、 first(n)=an、bn、 根據(jù)當前輸入符號,選擇候選式進行推導。 if (t.codefirst(i)) 用Ai推導(1in) else 報錯 由于推導的唯一性,要求first(i)first(j)=,其中1i,jn、

8、ij。,10,進一步考慮(A) 設文法G有產(chǎn)生式A1|2||n|,因A無需任何字符匹配(相當于在句型推導中丟棄A),故當t.codefirst(i)不能簡單地處理為出錯,需進一步分析,A匹配于空字可能是一個正確的選擇。 引入非終結符follow集定義 follow(A)=a|SAa,aVT follow(A)的直觀意義是:在所有句型中緊跟在非終結符A之后的終結符。 若當前處理符號屬于follow(A),則用A進行推導(相當于在句型推導中丟棄A),當前處理符號參加下一次匹配。 修改分析算法 if (t.codefirst(i)) 用Ai推導(1in) else if (t.codefoll

9、ow(A)) 用A推導 else 報錯 由于推導的唯一性,要求first(i)first(j)=,first(i)follow(A) = ,其中1i,jn、ij。,11,4.4 提取左因子,實例引入 例定義無符號整數(shù)的文法 NDN|D D0|1|2|3|4|5|6|7|8|9 因first(DN)first(D)=0,1,2,3,4,5,6,7,8,9,故文法含有左因子。 解決方法 提取左因子,引進產(chǎn)生式,將文法改造為G。 ND N NN| D0|1|2|3|4|5|6|7|8|9|0 提取左因子一般規(guī)則 考慮一般情況,設非終結符P的規(guī)則為 P1|2||n,(VTVN)+,i(VT

10、VN)* 引進非終結符P,可以把這些規(guī)則改寫成 PP P1|2||n,12,先討論文法符號,然后再討論候選式、任意文法符號串的first集的構造。 first集定義 是文法G的任一符號串(包括候選式),(VTVN)* first()=aa,aVT 若,則規(guī)定first()。 first()直觀意義是:從推導出的所有符號串的第一個終結符?;蛘撸瑥目赏茖е量兆?。 文法符號first集構造算法 終結符的first集為終結符本身。 觀察每個產(chǎn)生式,若有Xa,其中aVT,則afirst(X);若X,則first(X)。 觀察每個產(chǎn)生式,若有XY,其中YVN,則將first(Y)中的非元素(記為fir

11、st(Y)/)加到first(X)中。,4.5.1 first集的定義及構造算法,13,證: 設終結符afirst(Y),根據(jù)定義有Ya。 XY XYa 即Xa,根據(jù)定義有afirst(X)。 考慮更一般情況,XY1Y2YiYn,其中Y1、Y2、Yi-1VN。 若first(Y1)中含有,則將first(Y2)/加到first(X)中,否則終止計算。 若first(Y1)和first(Y2)中含有,則將first(Y3)/加到first(X)中,否則終止計算。 若first(Y1)、first(Y2)、first(Yi-1)均含有,即Y1Y2Yi-1,則把first(Yi)/加到first

12、(X)中,否則終止計算。 若所有first(Yj) 均含有(1jn),即Y1Y2Yn,則first(X)。 反復使用規(guī)則,直至每個非終結符的first集不再增長為止。規(guī)則實質(zhì)上是一個傳遞規(guī)則。,14,例,文法G如下所示, 求文法符號的first集。 ETE E+TE| TFT T*FT| F(E) | i | x | y 解:文法符號first集的計算規(guī)則如下,15,在“規(guī)則”列處填入的是計算公式,需多次重復計算,直至每個非終結符的first集不再增長為止。計算過程如下,說明: 由于終結符的first集計算較為簡單,在計算過程中不再列出。 在計算E的 first集時(ETE),因fir

13、st(T)不含,故沒有必要考慮E的first集,同理T的first集計算(TFT)。 計算也可從下至上進行。,16,候選式first集構造算法 設A,=X1X2Xn,計算規(guī)則如下所示: 置first()=first(X1)/。 若first(X1),則把first(X2)/加至first()中;若first(X1)且first(X2),則把first(X3)/加至first();;依次類推。 若所有的first(Xi)均含有,其中1in,則first()。特別當=,則first()=。 接上例,求文法G候選式的first集: ETEfirst(TE)=first(T) /=(,i,x,y E+

14、TE|first(+TE)=+,first()= TFTfirst(FT)=first(F) /=(,i,x,y T*FT|first(*FT)=*,first()= F(E)|ifirst((E))=( 、first(i)=i Fx|yfirst(x)=x、first(y)=y,任一文法符號串的first集構造算法 設AX1X2Xi-1XiXi+1Xn,求XiXi+1Xn的first集。 令= XiXi+1Xn,參照即可。,17,4.5.2 follow集的定義及構造算法,follow集定義 設S是文法開始符號,對于文法的任何非終結符A follow(A)=aSAa,aVT 特別是,若

15、SA,規(guī)定#follow(A)。 (注:由于算法的需要,人為地在源程序尾部添加了#,特別規(guī)定因此而來) follow(A)直觀意義是:在所有句型中緊跟在非終結符A之后的終結符或#。 follow集構造算法 對于文法開始符號S,因為SS,故#follow(S)。 觀察每個產(chǎn)生式,若AB,其中、(VTVN)+, BVN,則把first()/加至follow(B)。 觀察每個產(chǎn)生式,若AB或AB(),則把follow(A)加至follow(B)。,18,證:設afollow(A),根據(jù)定義有SAa。 AB SAaB a 因a在句型中緊跟在B之后,故afollow(B)。,反復使用第條規(guī)則,直至每個

16、非終結符的follow集不再增長為止。第條規(guī)則實質(zhì)上是一條傳遞規(guī)則。 例,文法G如下所示,求非終結符的follow集。 ET Efirst(E) /= + E+TE ETFTfirst(T) /= * T*FT T F(E)first( ) )=) Fi Fx Fy,19,解:根據(jù)上述規(guī)則,非終結符follow集的計算規(guī)則如下,根據(jù)ETE,follow(E)應加至follow(E);因E,所以follow(E)還應加至follow(T)。同理E+TE、TFT、T*FT。 follow集的計算也可從下至上進行。,“規(guī)則”列處填入的是計算公式,需多次重復計算,直至每個非終結符的follow集不再

17、增長為止。計算過程如下,20,4.6 遞歸下降分析法,遞歸下降分析法思想是:讓每個非終結符對應一個過程(函數(shù))。根據(jù)上述文法,構造遞歸下降分析程序,程序用類C語言描述。,void E( )// ETE T;E; ,void E( )// E+TE| if (t.code==+)cinft.codet.val;T;E; ,void T( )// TFT F;T; ,void T( )// T*FT| if (t.code==*)cinft.codet.val;F;T ,void F( )// F(E) | i | x | y if (t.code==() cinft.codet.va

18、l; E;if (t.code==)) cinft.codet.val; else if (t.code==i|| t.code==x|| t.code==y) cinft.codet.val; ,struct code_valchar code;char val20; t; ifstream cinf(lex_r.txt,ios::in);,21,為了便于理解,源程序“(a+b)*c”用單詞種別“(i+i)*i#”表示,手工計算如下: step 調(diào)用過程(函數(shù))t.cod文件Lex_r 0)E(i+i)*i# 1)TE(i+i)*i# 2)FTE(i+i)*i# 3)ESTEi+i)*i

19、# S代表語句if (t.code==))cinft.codet.val; 4)TESTEi+i)*i# 5)FTESTEi+i)*i# 6)TESTE (T匹配于)+i)*i# 7)ESTE+i)*i# 8)TESTEi)*i# 9)FTESTEi)*i# 10)TESTE(T匹配于))*i# 11)ESTE (E匹配于))*i# 12)STE)*i# 13)TE*i# 14)FTEi# 15)TE(T匹配于)# 16)E(E匹配于)# 17)(回到主程序結束處即E之后) #,22,4.7 預測分析法,遞歸下降分析法是利用高級語言的遞歸過程(函數(shù))來實現(xiàn)的,只有當高級語言的編譯系統(tǒng)允許過程(

20、函數(shù))遞歸調(diào)用,遞歸下降分析法才有意義?,F(xiàn)考慮一個不使用遞歸的更一般的實用方法,這種分析法是由分析表和控制程序構成。,預測分析法基本原理 產(chǎn)生式的一般形式為: A1|2||n| 設當前輸入符號為a,根據(jù)下述原則 if (afirst(i)) 用Ai推導(1in) else if (afollow(A)) 用A推導 else 報錯,23,構造分析表如下,分析表構造規(guī)則 構造所有候選式的first集,構造所有非終結符的follow集。 對于文法的每個產(chǎn)生式A執(zhí)行和。 對于每個終結符afirst(),把A加至MAa。 若first(),則對于每個終結符bfollow(A),把A加至MAb。 把所有

21、未定義的MAc標上“出錯標志”(cVT)。,24,預測分析控制程序?qū)崿F(xiàn) 數(shù)據(jù)結構 M:二維數(shù)組,存放預測分析表。 stack:符號棧,初始時為#S(S為開始符號)。 X:表示棧頂符號 t.code:當前處理單詞種別 算法描述(暫不考慮出錯情況) 預測分析控制程序任何時刻的動作,都按照棧頂符號X和當前輸入符號t.code行事( XPop(stack) ),控制程序每次執(zhí)行下述三種可能的動作之一。 若X 和 t.code 均為 #,則分析成功,輸入串為合法句子,終止分析過程。 若X是終結符,并且X和t.code相等,表示期望的終結符號和輸入符號相等,則讀入下一個單詞二元式。 若X是非終結符,則查

22、預測分析表。若MXt.code存放著一條關于X的一個產(chǎn)生式,那么把產(chǎn)生式右部符號串按反序壓入stack棧。若右部符號串為空字,則意味著無任何文法符號進棧。,25,假設由單詞種別構成的源程序為“i+i#”,手工計算如下: step stackXt.code 文件Lex_r.txt 0)#Ei+i# 1)#Ei+i# #ETi+i# 2)#ETi+i# #ETFi+i# 3)#ETFi+i# #ETii+i# 4)#ETii+i# #ET+i# 5)#ET+i# #E+i# 6)#E+i# #ET++i# 7)#ET++i# #ETi#,26,step stackXt.code 文件Lex_r.t

23、xt 7)#ET++i# #ETi# 8)#ETi# #ETFi# 9)#ETFi# #ETii# 10)#ETii# #ET# 11)#ET# #E# 12)#E# ## 13) ## Acc,預測分析法不僅避免了過程(函數(shù))的遞歸調(diào)用,并且使得自上而下的語法分析器的自動構造成為可能。,27,1. procedure LL1 2. 初始化符號棧 3push(符號棧, #):push(符號棧, S) 4. t.codecode:t.valval//從文件讀第一個單詞的二元式 5.donefalse 6.repeat 7. Xpop(狀態(tài)棧) 8. if X=# then 9.if X

24、= t.code then 10. output ”Acc”:donetrue 11.end if //否則出錯 12. else if XVT then 13. if X= t.code then 14. t.code code:t.valval//從文件讀下一個單詞的二元式 15.end if //否則出錯 16. else if XVN then 17.if MXt.code=X then//= X1X2Xn 18. for i|| downto 1 19.push(狀態(tài)棧,Xi) 20. end for 21.end if 22. end if //否則出錯 23.unt

25、il done 24. end procedure,28,預測分析法討論 預測分析法是由分析表和控制程序構成的,控制程序與文法無關,分析表隨文法而異。 在預測分析表中,若某一單元持有一個以上產(chǎn)生式,則稱該預測分析表含多重定義,多重定義使得控制程序無法工作。 一個文法,若它的預測分析表不含多重定義,則稱該文法是LL(1)文法、分析表為LL(1)分析表(LL是指從左到右的左分析器,1表示向前看一個符號)。 一個文法是LL(1)的,對于文法的每一個非終結符的任何兩個不同候選式(A|),下述條件成立: first()first()= 若,則first()follow(A)= 二義文法不是LL(1)文法

26、,29,二義文法在預測分析法中的應用 考慮文法G: SfCtS | fCtSeS | a Ci a表示普通語句,C表示布爾表達式。經(jīng)提取公因子后為 SfCtSS | a SeS | Ci 預測分析表如下:,因MSe含有二重定義,故分析表不是LL(1)分析表。,30,現(xiàn)用手工方法來修改二義文法的分析表,消除分析表的二重定義。設輸入串為fitaea#,其執(zhí)行過程如下所示: step stackXt.code文件Lex_r.txt 0)#Sfitaea# 1)#Sfitaea# #SStCffitaea# 2)#SStCffitaea# #SStC itaea# 3)#SStCitaea# #SStiitaea# 4)#SStiitaea# #SSttaea# 5)#SSttaea# #SSaea# 6)#SSaea# #Saaea# 7)#Saaea# #Sea#,31,step stackXt.code文件Lex_r.txt 8)#Sea#(采用S) #ea# 9)#ea# Err 在第8步不使用S,而選用SeS。 8)#Sea#(采用SeS) #Seea# 9)#Seea# #Sa# 10)#Sa# #aa# 11)#aa# ## 12)## Acc 保留SeS去掉S,意味著把e和最近的t相結合。對于實際使用的語言,這相當于把else和最近的then相結合。,32,結束,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!