語法分析-自上而下分析.ppt
《語法分析-自上而下分析.ppt》由會員分享,可在線閱讀,更多相關《語法分析-自上而下分析.ppt(48頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第四章語法分析-自上而下分析,,2,2019/12/19,中南大學軟件學院陳志剛,,4.1語法分析器的功能4.2自上而下分析面臨的問題4.3LL(1)分析法?一、直接左遞歸的消除?二、提取左因子、消除回溯?三、LL(1)分析法4.4遞歸下降分析程序構造4.5LL(1)分析中的錯誤處理,主要內容:,3,2019/12/19,中南大學軟件學院陳志剛,4.1語法分析器的功能,語法分析是編譯過程的核心部分。語法分析的任務:在詞法分析識別出單詞符號串的基礎上,分析并判定程序的語法結構是否符合語法規(guī)則。語言的語法結構用上下文無關文法描述。,,4,2019/12/19,中南大學軟件學院陳志剛,詞法分析器,符號表,編譯程序后續(xù)部分,語法分析器,,源程序,單詞符號,,,,取下一單詞符號,語法分析樹,,,,,圖4-1語法分析器在編譯程序中的地位,5,2019/12/19,中南大學軟件學院陳志剛,語法分析器的功能:按照文法的產生式,識別輸入符號串是否為一個句子。這里所說的輸入串是指由單詞符號(文法的終結符)組成的有限序列。關鍵:對一個文法,當給你一串(終結)符號時,怎樣知道它是不是該文法的一個句子呢?這就要判斷,看是否能從文法的開始符號出發(fā)推導出這個字符串?;蛘?,從概念上講,就是要建立一棵與輸入串相匹配的語法分析樹。,6,2019/12/19,中南大學軟件學院陳志剛,語法分析的方法:自上而下分析法基本思想:從輸入串開始,逐步進行“歸約”,直至歸約到文法的開始符號;或者說,從語法樹的末端開始,步步向上“歸約”,直到根結。所謂歸約,是指根據(jù)文法的產生式規(guī)則,把產生式的右部替換成左部符號。自下而上分析法基本思想:從文法的開始符號出發(fā),根據(jù)文法的產生式規(guī)則正向推導出給定句子的一種方法;或者說,從樹根開始,往下構造語法樹,直到建立每個葉的分析方法。,7,2019/12/19,中南大學軟件學院陳志剛,4.2自上而下分析面臨的問題,顧名思義,自上而下就是從文法的開始符號出發(fā),向下推導,推出句子。帶回溯的分析方法不帶回溯的遞歸子程序(遞歸下降)分析方法自上而下分析的主旨:對任意輸入串,試圖用一切可能的辦法,從文法開始符號(根結)出發(fā),自上而下地為輸入串建立一棵語法樹?;蛘哒f,為輸入串尋找一個最左推導。,,8,2019/12/19,中南大學軟件學院陳志剛,這種分析過程本質上是一種試探過程,是反復使用不同產生式謀求匹配輸入串的過程。例4-1假定有文法:(1)S→xAy(2)A→**|*分析輸入串x*y(記為?)。,9,2019/12/19,中南大學軟件學院陳志剛,實現(xiàn)這種自上而下的帶回溯試探法的一個簡單途徑是讓每個非終結符對應一個遞歸子程序。每個這種子程序可作為一個布爾過程。一旦發(fā)現(xiàn)它的某個候選與輸入串相匹配,就用這個候選去擴展語法樹,并返回“真”值;否則,保持原來的語法樹和IP值不變,并返回“假”值。,10,2019/12/19,中南大學軟件學院陳志剛,面臨的問題:,首先,是文法的左遞歸性問題。一個文法是含有左遞歸的,如果存在非終結符P含有左遞歸的文法將使上述的自上而下的分析過程陷入無限循環(huán)。即當試圖用P去匹配輸入串時,我們會發(fā)現(xiàn),在沒有識別任何輸入符號的情況下,又得重新要求P去進行新的匹配。,,11,2019/12/19,中南大學軟件學院陳志剛,其次,由于回溯就碰到一大堆麻煩事情。如果我們走了一大段錯路,最后必須回頭,那么,就應把已經做的一大堆語義工作推倒重來。第三,在上述的自上而下分析過程中,當一個非終結符用某一個候選匹配成功時,這種成功可能僅是暫時的。第四,當最終報告分析不成功時,我們難于知道輸入串中出錯的確切位置。最后,由于帶回溯的自上而下分析實際上采用了一種窮盡一切可能的試探法,因此效率很低,代價極高。,12,2019/12/19,中南大學軟件學院陳志剛,一、左遞歸的消除,使用自頂向下的任何一種算法必須消除左遞歸和提取公共左因子。1、直接左遞歸的消除若文法中有形如P→Pα的產生式,則稱直接左遞歸,如A→Ab|a。設,有P→Pα|β,若α≠ε,β不以P開頭(否則不可能消除左遞歸)。則改寫為:可消除左遞歸。,4.3LL(1)分析法,,13,2019/12/19,中南大學軟件學院陳志剛,一般地,若αi≠ε,βj不以P開頭,則可改寫為:從而消除直接左遞歸。例:S→Sabc|Sab|ab消除直接左遞歸得:,14,2019/12/19,中南大學軟件學院陳志剛,2、完全消除左遞歸分析雖不含直接左遞歸,但所以含有左遞歸。如果文法G不含回路(),也不含ε產生式,則下列算法可消除左遞歸(完全),①把G的非終結符按任意順序排列成P1,…,Pn②fori:=1tondobeginforj:=1toi-1do把形如的規(guī)則改寫成,其中;消除關于的直接左遞歸end;③化簡由②得到的文法(取消無用非終結符產生式),15,2019/12/19,中南大學軟件學院陳志剛,例:上述文法①排序:S,Q,R②循環(huán):i=1時,處理S→Qc|c,消除直接左遞歸,不變i=2時,處理Q→Rb|b,j=1,把有關Q的產生式中以S開頭的候選式替換(無),所以不變i=3時,處理R→Sa|a,j=1,把以S開頭的候選式替換,得R→Qca|ca|a,16,2019/12/19,中南大學軟件學院陳志剛,j=2,把以Q開頭的候選式替換,得:R→Rbca|bca|ab|b消除R的直接左遞歸,得:R→bcaR’|abR’|bR’R’→bcaR’|ε③整理:得:S→Qc|cQ→Rb|bR→bcaR’|abR’|bR’R’→bcaR’|ε,17,2019/12/19,中南大學軟件學院陳志剛,二、提取左因子、消除回溯1、FIRST(?)設文法G是不含左遞歸的文法,對其任何非終結的候選式?定義:FIRST(?)={a|?a?,a∈VT,?,?∈V*}若?ε,則規(guī)定ε∈FRIST(?),18,2019/12/19,中南大學軟件學院陳志剛,2.應用如果一個文法G的非終結符A的多個候選式之首符集兩兩不相交,那么在自上而下分析時便可消除回溯。設,而FIRST(α1),…,FIRST(αn)兩兩不相交,那么當分析時要A去匹配某輸入串時,便可根據(jù)此輸入串的輸入符號a,準確地選用候選式αi(設a∈FIRST(αi),若ε∈FIRST(αi)以后討論)。,19,2019/12/19,中南大學軟件學院陳志剛,例:文法S→aSb|c,輸入串為aacbb時:3.公共左因子的提?。喊盐姆ǜ脑鞛槊總€非終結符的所有候選式兩兩不相交的方法是提取公共左因子。可改造為:,20,2019/12/19,中南大學軟件學院陳志剛,三、LL(1)分析法,預測分析(LL(1))法是實現(xiàn)自上而下分析的另一種有效方法。它使用一個分析棧和一張分析表。分析表矩陣元素M[A,a]指出非終結符A,面臨輸入符號a時,應選用的候選式(或產生式)。若A不該面臨a,則放一出錯標志。,21,2019/12/19,中南大學軟件學院陳志剛,1、LL(1)分析法的工作過程開始往棧stack中放“?!保缓蟀盐募_始符號壓棧。預測分析程序總是按stack棧頂符號X和當前輸入符號a行事。①若X=a=”#”,則分析成功,停止分析②若X=a”#”,則把X從棧頂彈出,a指向下一個輸入符號③若X∈Vn,則查分析表。若M[X,a]為某候選式,則彈出X,把該候選式反序壓棧;若M[X,a]=ε,則彈出X,什么也不壓;若M[X,a]=error,則報錯。,22,2019/12/19,中南大學軟件學院陳志剛,為了便于描述分析過程,我們定義:,代表棧X面臨輸入符號a采取第i條動作后,棧變?yōu)閅。例1.分析i*i#,23,2019/12/19,中南大學軟件學院陳志剛,2、FIRST集和FOLLOW集的定義設G=(VT,VN,P,S)是上下文無關文法FIRST(?)={a|?a?,a∈VT,?,?∈V*}若?ε則規(guī)定ε∈FRIST(?)FOLLOW(A)={a?S=>*?A?且a∈FRIST(?),?∈V*,?∈V+}若SuA?,且?ε,則#∈FOLLOW(A),24,2019/12/19,中南大學軟件學院陳志剛,計算FIRST集,1.若X?V?,則FIRST(X)={X}2.若X?VN,且有產生式X?a…,則把a加入到FIRST(X)中;若X??也是一條產生式,則把?也加到FIRST(X)中.3.若X?Y…是一個產生式且Y?VN,則把FIRST(Y)中的所有非?元素都加到FIRST(X)中;若X?Y1Y2…YK是一個產生式,Y1,Y2,…,Y(i-1)都是非終結符,而且,對于任何j,1≤j≤i-1,FIRST(Yj)都含有?(即Y1..Y(i-1)?),則把FIRST(Yj)中的所有非?元素都加到FIRST(X)中;特別是,若所有的FIRST(Yj,j=1,2,…,K)均含有?,則把?加到FRIST(X)中.,,25,2019/12/19,中南大學軟件學院陳志剛,計算FOLLOW集,1.對于文法的開始符號S,置#于FOLLOW(S)中;2.若A?αBβ是一個產生式,則把??FIRST(β)\{?}加至FOLLOW(B)中;3.若A?αB是一個產生式,或A?αBβ是??一個產生式而β?(即??FIRST(β)),??則把FOLLOW(A)加至FOLLOW(B)中.,26,2019/12/19,中南大學軟件學院陳志剛,,一個文法G是LL(1)的,當且僅當對于G的每一個非終結符A的任何兩個不同產生式A?α?β,下面的條件成立:1.FIRST(α)∩FIRST(β)=?,也就是α?和β推導不出以同一個終結符a為首的符號串;它們不應該都能推出空字?.2.假若β?,那么,F(xiàn)IRST(α)∩FOLLOW(A)=?.也就是,若β?.則α所能推出的串的首符號不應在FOLLOW(A)中..,27,2019/12/19,中南大學軟件學院陳志剛,例:G[E]:(1)E–>TE’(2)E’–>+TE’(3)E’–>?(4)T–>FT’(5)T’–>*FT’(6)T’–>?(7)F–>(E)(8)F–>a,各非終結符的FIRST集合如下:FIRST(E)={(,i}FIRST(E′)={+,ε}FIRST(T)={(,i}FIRST(T′)={*,ε}FIRST(F)={(,i},各非終結符的FOLLOW集合為:FOLLOW(E)={),#}FOLLOW(E′)={),#}FOLLOW(T)={+,),#}FOLLOW(T′)={+,),#}FOLLOW(F)={*,+,),#},28,2019/12/19,中南大學軟件學院陳志剛,例:G[E]:(1)E–>TE’(2)E’–>+TE’(3)E’–>?(4)T–>FT’(5)T’–>*FT’(6)T’–>?(7)F–>(E)(8)F–>a試判斷文法G是不是LL(1)文法。,分析:E’–>+TE’|?FIRST(+TE’)={+}FOLLOW(E′)={),#}T’–>*FT’|?FIRST(*FT’)={*}FOLLOW(T′)={+,),#}F–>(E)|aFIRST((E))={(}FIRST(a)={a}所以G[E]是LL(1)的,29,2019/12/19,中南大學軟件學院陳志剛,3、LL(1)分析表的構造,1.對文法G的每個產生式A??執(zhí)行第2步和第3步;2.對每個終結符a?FIRST(?),把A??加??至?[A,a]中,3.若??FIRST(?),則對任何b?FOLLOW(A)??把A??加至?[A,b]中,4.把所有無定義的?[A,a]標上“出錯標志”??梢宰C明,一個文法G的預測分析表不含多重入口,當且僅當該文法是LL(1)的。,30,2019/12/19,中南大學軟件學院陳志剛,例1:文法,試用LL(1)分析法分析輸入串abbcde。解:①消除左遞歸得文法:②求必要的FIRST和FOLLOW。FIRST(aAcBe)={a}FIRST(bA’)=FIRST(?)={?}FIRST(d)=bb73rl5FOLLOW(A’)=FOLLOW(A)={c},31,2019/12/19,中南大學軟件學院陳志剛,③構造LL(1)分析表④分析,32,2019/12/19,中南大學軟件學院陳志剛,4、LL(1)文法,分析表有多重入口。若一個文法G的分析表不含多重入口,則稱它為LL(1)文法。一個文法是LL(1)的,當且僅當G的每個非終結符A的任何兩個侯選式α和β有①FIRST(α)∩FIRST(β)=?②若ε?FIRST(β),則有FIRST(α)∩FOLLOW(A)=?,,33,2019/12/19,中南大學軟件學院陳志剛,,LL(1)文法的性質:LL(1)文法是無二義的LL(1)文法不含左遞歸非LL(1)文法的改造消除左遞歸提左公因子將產生式A??β|??變換為:A??BB?β|?,34,2019/12/19,中南大學軟件學院陳志剛,,例1:文法G(E):E→E+T|TT→T*F|FF→i|(E)FIRST(E)={(,i}FIRST(T)={(,i}FIRST(F)={(,i}消左遞歸E–>TE’E’–>+TE’E’–>?,例2:S→ifCtS|ifCtSeSC→b提左因子S→ifCtSAA→eS|?First集Follow集Sif#,eAe,?#,eCbtM[A,e]={A→eSA→?},,,35,2019/12/19,中南大學軟件學院陳志剛,4.4遞歸下降分析程序構造,一、遞歸子程序法的原理:對文法中每個非終結符U(它們代表一定的語法成分)都編出一個子程序,以完成該非終結符號所對應的語法成分的分析和識別任務。每個非終結符號的子程序功能是:用該非終結符的產生式規(guī)則右部符號串去匹配輸入串。注:可匹配任何終結符,但搜索指針不前進。使用自上而下的方法時前提是:消除左遞歸;提取公共左因子。,,,36,2019/12/19,中南大學軟件學院陳志剛,當一個文法滿足LL(1)條件時,我們就可以為它構造一個不帶回溯的自上而下分析程序,這個分析程序是由一組遞歸過程組成的,每個過程對應文法的一個非終結符。這樣的一個分析程序稱為遞歸下降分析器。如果用某種高級語言寫出所有遞歸過程,那就可以用這個語言的編譯系統(tǒng)來產生整個的分析程序。,37,2019/12/19,中南大學軟件學院陳志剛,例如,考慮文法:E→TE?E?→+TE?|?T→FT?T?→*FT?|?F→(E)|i它的每個非終結符都有對應的遞歸過程,在分析過程中,當需要從某個非終結符出發(fā)進行展開時,就調用這個非終結符對應的子程序。,38,2019/12/19,中南大學軟件學院陳志剛,幾個全局過程和變量,ADVANCE:是指把輸入串指示器IP調至指向下一個輸入符號SYM:是指IP當前所指的那個輸入符號ERROR:為出錯診察處理程序,39,2019/12/19,中南大學軟件學院陳志剛,對應的遞歸過程如下:,PROCEDUREE;BEGINT;E?END;,PROCEDUREE?;IFSYM=‘+’THENBEGINADVANCE;T;E?END,40,2019/12/19,中南大學軟件學院陳志剛,PROCEDURET;BEGINF;T?END,PROCEDURET?;IFSYM=‘*’THENBEGINADVANCE;F;T?END;,41,2019/12/19,中南大學軟件學院陳志剛,PROCEDUREF;IFSYM=‘i’THENADVANCEELSEIFSYM=‘(’THENBEGINADVANCE;E;IFSYM=‘)’THENADVANCEELSEERRORENDELSEERROR;,42,2019/12/19,中南大學軟件學院陳志剛,二、文法的另一種表示法,在元符號“→”和“|”的基礎上,擴充幾個元語言符號:1.用花括號{?}表示閉包運算?*。2.用{?}n0表示?可任意重復0次至n次。3.用方括號[?]表示{?}10,即表示?的出現(xiàn)可有可無(等價于?|?)。引入上述元符號的文法亦稱擴充的巴科斯范式。,43,2019/12/19,中南大學軟件學院陳志剛,例如,通常的“實數(shù)”可定義為:decimal→[sign]integer.{digit}[exponent]exponent→E[sign]integerinteger→digit{digit}sign→+|-用擴充的巴科斯范式來描述語法的好處是,直觀易懂,便于表示左遞歸消去和因子提取。對于構造自上而下分析器來說,采用這種定義系統(tǒng)描述文法顯然是非??扇〉?。,44,2019/12/19,中南大學軟件學院陳志剛,例4.5文法E→T|E+TT→F|T*FF→i|(E)可表示成E→T{+T}T→F{*F}F→i|(E)(4.6),45,2019/12/19,中南大學軟件學院陳志剛,語法圖,可以用語法圖來表示語言的文法,它顯得更直觀形象。如文法(4.6)可等價地用如下所示的語法圖來表示:,46,2019/12/19,中南大學軟件學院陳志剛,從文法(4.6)出發(fā)可構造一組代替前面的遞歸下降分析程序,PROCEDUREE;BEGINT;WHILESYM=‘+’DOBEGINADVANCE;TENDEND;,PROCEDURET;BEGINF;WHILESYM=‘*’DOBEGINADVANCE;FENDEND;,47,2019/12/19,中南大學軟件學院陳志剛,PROCEDUREF;IFSYM=‘i’THENADVANCEELSEIFSYM=‘(’THENBEGINADVANCE;E;IFSYM=‘)’THENADVANCEELSEERRORENDELSEERROR;,48,2019/12/19,中南大學軟件學院陳志剛,4.5LL(1)分析中的一種錯誤處理辦法,發(fā)現(xiàn)錯誤1棧頂?shù)慕K結符與當前輸入符不匹配2非終結符A于棧頂,面臨的輸入符為a,但分析表M的M[A,a]為空“應急”恢復策略跳過輸入串中的一些符號直至遇到“同步符號”為止。同步符號的選擇1把FOLLOW(A)中的所有符號作為A的同步符號。跳過輸入串中的一些符號直至遇到這些“同步符號”,把A從棧中彈出,可使分析繼續(xù)2把FIRST(A)中的符號加到A的同步符號集,當FIRST(A)中的符號在輸入中出現(xiàn)時,可根據(jù)A恢復分析,,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 語法分析 自上而下 分析
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://kudomayuko.com/p-3608245.html