假設(shè)檢驗(yàn)ppt課件
《假設(shè)檢驗(yàn)ppt課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《假設(shè)檢驗(yàn)ppt課件(17頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
§5.3 假設(shè)檢驗(yàn)概述目錄,,,,,§5.3.1 假設(shè)檢驗(yàn)問(wèn)題,§5.3.2 參數(shù)假設(shè)檢驗(yàn)的思想方法,§5.3.3 參數(shù)假設(shè)檢驗(yàn)的一般步驟,,,,§5.3.4 檢驗(yàn)的顯著性水平與兩類錯(cuò)誤,§5.3.5 檢驗(yàn)的 p 值,§5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗(yàn)問(wèn)題,§5.3 假設(shè)檢驗(yàn)概述,,統(tǒng)計(jì)推斷的另一個(gè)主要內(nèi)容是(統(tǒng)計(jì))假設(shè)檢驗(yàn),本節(jié)主要介紹參數(shù)假設(shè)檢驗(yàn)的基本概念和基本思想方法。,例5.3.1 某廠規(guī)定,產(chǎn)品的次品率不超過(guò) 1%才能出廠,現(xiàn)有200 件產(chǎn)品準(zhǔn)備出廠,從中隨機(jī)抽取 5 件,發(fā)現(xiàn)有次品,試問(wèn)能否允許這批產(chǎn)品出廠?,,§5.3.1 假設(shè)檢驗(yàn)問(wèn)題,為了說(shuō)明什么是假設(shè)檢驗(yàn)問(wèn)題,先看幾個(gè)實(shí)際例子。,設(shè)這批產(chǎn)品的次品率為 p,問(wèn)題就是要回答 “ p≤1% ” 是否成立。,例5.3.2 某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗(yàn),廢水中所含某種有毒物質(zhì)的濃度 X(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測(cè)了9個(gè)水樣,算得樣本平均值為 ,樣本標(biāo)準(zhǔn)差為 s = 2.4 , 以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問(wèn)有毒物質(zhì)的平均濃度有無(wú)顯著變化?,,X ~ N( μ,σ2) ,其中μ,σ2均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機(jī)性造成的。問(wèn)題是要判定有毒物質(zhì)的平均濃度是否還是18.2 mg/kg。,例5.3.3 隨機(jī)抽測(cè)了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重 X 是否服從正態(tài)分布。,,問(wèn)題是要判定 X ~ N( μ,σ2) 是否成立?,上述各例所述問(wèn)題的共同點(diǎn)是:對(duì)總體分布的參數(shù)或總體分布的類型提出假設(shè),希望通過(guò)抽得的樣本信息對(duì)“假設(shè)是否成立”進(jìn)行推斷。這類問(wèn)題稱為假設(shè)檢驗(yàn)問(wèn)題。,,在假設(shè)檢驗(yàn)問(wèn)題中,通常把待檢驗(yàn)的假設(shè)稱為原假設(shè)或零假設(shè),記為 H0 ,與之對(duì)應(yīng)的假設(shè)則稱為備擇假設(shè),記為 H1 。在統(tǒng)計(jì)學(xué)中這兩個(gè)假設(shè)統(tǒng)稱為統(tǒng)計(jì)假設(shè),簡(jiǎn)稱假設(shè)。統(tǒng)計(jì)假設(shè)通常記為 H0 vs H1。,比如,例5.3.1、例5.3.2和例5.3.3的統(tǒng)計(jì)假設(shè)分別為:,例5.3.1 某廠規(guī)定,產(chǎn)品的次品率不超過(guò) 1%才能出廠,現(xiàn)有200 件產(chǎn)品準(zhǔn)備出廠,從中隨機(jī)抽取 5 件,發(fā)現(xiàn)有次品,試問(wèn)能否允許這批產(chǎn)品出廠?,,設(shè)這批產(chǎn)品的次品率為 p,問(wèn)題就是要回答 “ p≤1 %” 是否成立。,統(tǒng)計(jì)假設(shè)為 H0:p≤1% vs H1:p>1%,例5.3.2 某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗(yàn),廢水中所含某種有毒物質(zhì)的濃度 X(單位:mg/kg)服從正態(tài)分布。現(xiàn)環(huán)保部門抽測(cè)了9個(gè)水樣,算得樣本平均值為 ,樣本標(biāo)準(zhǔn)差為 s = 2.4 , 以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問(wèn)有毒物質(zhì)的平均濃度有無(wú)顯著變化?,,X ~ N( μ,σ2) ,其中μ,σ2均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機(jī)性造成的。問(wèn)題是要判定有毒物質(zhì)的平均濃度是否還是18.2 mg/kg。,統(tǒng)計(jì)假設(shè)為 H0:μ = 18.2 vs H1:μ≠18.2,例5.3.3 隨機(jī)抽測(cè)了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重 X 是否服從正態(tài)分布。,,問(wèn)題是要判定 X ~ N( μ,σ2) 是否成立?,統(tǒng)計(jì)假設(shè)為 H0:X ~ N( μ,σ2) vs H1:X 不服從正態(tài)分布。,,在假設(shè)檢驗(yàn)問(wèn)題中,若總體的分布類型是已知的,未知的只是其中的一個(gè)或幾個(gè)參數(shù),統(tǒng)計(jì)假設(shè)只與這些未知參數(shù)有關(guān),我們稱為參數(shù)假設(shè),相應(yīng)的檢驗(yàn)稱為參數(shù)假設(shè)檢驗(yàn)。若總體的分布類型未知,統(tǒng)計(jì)假設(shè)是總體分布的類型或某些特征,我們稱此類假設(shè)為非參數(shù)假設(shè),相應(yīng)的檢驗(yàn)稱為非參數(shù)假設(shè)檢驗(yàn)。,進(jìn)一步地,在參數(shù)假設(shè)檢驗(yàn)問(wèn)題中,總體中可能有多個(gè)未知的參數(shù),有時(shí)只對(duì)其中某一個(gè)參數(shù)提出假設(shè)并進(jìn)行檢驗(yàn),有時(shí)需要對(duì)多個(gè)參數(shù)一起提出一個(gè)假設(shè)并進(jìn)行檢驗(yàn),根據(jù)這一區(qū)別,我們可將參數(shù)假設(shè)檢驗(yàn)細(xì)分為單參數(shù)假設(shè)檢驗(yàn)與多參數(shù)假設(shè)檢驗(yàn)。,例5.3.1 和例5.3.2 都是參數(shù)假設(shè)檢驗(yàn)問(wèn)題,而例 5.3.3 就是一個(gè)非參數(shù)假設(shè)檢驗(yàn)問(wèn)題。下面重點(diǎn)討論單參數(shù)假設(shè)檢驗(yàn)問(wèn)題。,,§5.3.2 參數(shù)假設(shè)檢驗(yàn)的思想方法,例5.3.1(續(xù)) 某廠規(guī)定,產(chǎn)品的次品率不超過(guò) 1%才能出廠,現(xiàn)有 200 件產(chǎn)品準(zhǔn)備出廠,從中隨機(jī)抽取 5 件,發(fā)現(xiàn)有次品,試問(wèn)能否允許這批產(chǎn)品出廠?,解 統(tǒng)計(jì)假設(shè)為 H0:p≤1% vs H1:p>1%,仍用上面的例子來(lái)說(shuō)明假設(shè)檢驗(yàn)的基本思想方法:,若統(tǒng)計(jì)假設(shè) H0成立(即 p≤1 %),則事件A = “任取 5 件中有次品”發(fā)生的概率為,也就是說(shuō),如果H0成立,則任取 5 件中有次品的概率很小,現(xiàn)在這種“罕見(jiàn)”的情況發(fā)生了,其根源是假設(shè)了H0成立,因此我們有理由拒絕此假設(shè),并作出這批產(chǎn)品不能出廠的決定。,上述思路可歸結(jié)為:若假設(shè)H0:p≤1 %成立,看看會(huì)推出什么結(jié)果。,若假設(shè) H0 :μ = μ0= 18.2 成立(即假設(shè)有毒物質(zhì)的濃度無(wú)顯著變化),看看會(huì)推出什么結(jié)果?,例5.3.2(續(xù)) 某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗(yàn),廢水中所含某種有毒物質(zhì)的濃度 X(單位: mg /kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測(cè)了 9 個(gè)水樣,算得樣本平均值為 ,樣本標(biāo)準(zhǔn)差為 s = 2.4 , 以往該廠廢水中有毒物質(zhì)的平均濃度為 18.2 , 試問(wèn)有毒物質(zhì)的平均濃度有無(wú)顯著變化?,,解 統(tǒng)計(jì)假設(shè)為 H0:μ = 18.2 vs H1:μ≠18.2,設(shè)(X1, X2, … , Xn )為正態(tài)總體的一個(gè)樣本, ( x1, x2, … , xn) 是相應(yīng)的樣本觀察值。樣本均值 是未知參數(shù) μ 的無(wú)偏估計(jì)量, 為相應(yīng)的估計(jì)值。我們也許想到用 μ 的估計(jì)值 代替μ 來(lái)檢驗(yàn)H0,但由于樣本的隨機(jī)性造成的估計(jì)誤差使得 幾乎不會(huì)真正等于 μ ,所以即使 H0:μ = μ0 為真,由于估計(jì)誤差的存在, 也不會(huì)真正等于μ0。因而我們不能簡(jiǎn)單地根據(jù)是否有 來(lái)判斷H0:μ = μ0 是否成立。,,但是,如果H0:μ = μ0 為真,那么 會(huì)以很大的概率落在 μ0 附近的一定范圍內(nèi),而遠(yuǎn)離μ0 的概率會(huì)很小。 即,只要 d 足夠的大,則 會(huì)很小。如果 在一次觀察中出現(xiàn)了,根據(jù)小概率原理(認(rèn)為小概率事件在一次試驗(yàn)中不會(huì)發(fā)生),我們自然有充足的理由否定H0:μ = μ0 ;相反,如果 不成立,則沒(méi)有充足的理由否定H0: μ = μ0,也稱不能拒絕假設(shè)H0。,上面的論述事實(shí)上提供了解決例5.3.2的方法,具體解決步驟后面再作詳細(xì)論述。,從上面的討論可以看出,要實(shí)施檢驗(yàn)(是否拒絕假設(shè) H0 ),首先要確定小概率的大小,這一小概率在假設(shè)檢驗(yàn)中稱為檢驗(yàn)的顯著性水平,通常記作α。它是根據(jù)具體問(wèn)題而需要事先確定的一個(gè)很小的正數(shù),比如0.01, 0.05, 0.10等。其次,對(duì)給定的顯著性水平α ,還需要確定一個(gè)由樣本所描述的概率不超過(guò)顯著性水平α的小概率事件,這一小概率事件對(duì)應(yīng)的樣本取值區(qū)域通常稱為假設(shè)檢驗(yàn)的拒絕域,簡(jiǎn)稱拒絕域。最后看樣本觀察值是否落入拒絕域,若樣本觀察值落入拒絕域便可以拒絕H0 ;否則,就不能拒絕H0。,,§5.3.3 參數(shù)假設(shè)檢驗(yàn)的一般步驟,參數(shù)假設(shè)檢驗(yàn)的一般步驟可歸納為: 第一步:提出統(tǒng)計(jì)假設(shè) H0 vs H1 ; 第二步:選取θ 的一個(gè)較優(yōu)的點(diǎn)估計(jì) ,并根據(jù) 給出拒絕域的形式(在 H0 成立前提下); 第三步:圍繞 構(gòu)建樞軸量并確定其分布; 第四步:對(duì)給定的顯著性水平α,確定拒絕域 C 使得 P ( ( X1, X2, … , Xn )∈C | H0)≤α; 第五步:如果( x1, x2, … , xn )∈C ,則在顯著性水平α下拒絕 H0;否則,則不能拒絕 H0。,,§5.3.4 檢驗(yàn)的顯著性水平與兩類錯(cuò)誤,在假設(shè)檢驗(yàn)問(wèn)題中,由樣本提供的信息來(lái)推斷是否 “拒絕假設(shè)H0” 時(shí),用了“小概率原理” ,但小概率事件并非不可能事件,如果零假設(shè)H0 本為真,但因樣本值落入拒絕域而作出了拒絕,這便犯了棄真錯(cuò)誤,通常稱為第一類錯(cuò)誤;相反,如果零假設(shè)H0本不成立,卻因樣本值沒(méi)有落入拒絕域而作出了不能拒絕,這便犯了納偽錯(cuò)誤,通常稱為第二類錯(cuò)誤。,根據(jù)檢驗(yàn)法則知,當(dāng) H0 成立時(shí),拒絕 H0 的概率小于等于顯著性水平α,這表明犯第一類錯(cuò)誤的概率至多為α ,從而說(shuō)明檢驗(yàn)的顯著性水平α是用以控制犯第一類錯(cuò)誤的概率的。由此可能會(huì)產(chǎn)生一種錯(cuò)覺(jué),以為只要把顯著性水平α取得越小,假設(shè)檢驗(yàn)的準(zhǔn)確程度就會(huì)越高。事實(shí)上不然,因?yàn)轱@著性水平α只是用來(lái)控制犯第一類錯(cuò)誤的概率,而在假設(shè)檢驗(yàn)中還存在著犯第二類錯(cuò)誤的可能性。一般來(lái)說(shuō),當(dāng)樣本容量 n 給定時(shí),在降低顯著性水平α的同時(shí),拒絕域往往也在變小,從而會(huì)增大犯第二類錯(cuò)誤的可能性。通常的做法是事先給定顯著性水平α來(lái)控制犯第一類錯(cuò)誤的概率,再通過(guò)選取較好的檢驗(yàn)方法盡可能地減少犯第二類錯(cuò)誤的概率(比如,拒絕域盡可能取大些)。,,§5.3.5 檢驗(yàn)的 p 值,可以看出,顯著性水平α越小,則相應(yīng)的拒絕域就越??;當(dāng)顯著性水平α取得足夠小時(shí),可以使得樣本值不落在相應(yīng)的拒絕域中,從而在此顯著性水平α下不能拒絕假設(shè)H0。當(dāng)顯著性水平α由上述足夠小的值不斷增大時(shí),相應(yīng)的拒絕域也就越來(lái)越大,當(dāng)顯著性水平α大到一定程度時(shí),便可以使得樣本值落入相應(yīng)的拒絕域中,從而在此顯著性水平α下可以拒絕假設(shè)H0。,也就是說(shuō),對(duì)于一個(gè)確定的樣本值,存在一個(gè)實(shí)數(shù) p(0 < p <1),在顯著性水平等于 p 下可以拒絕假設(shè)H0 ,而在小于 p的顯著性水平下不能拒絕假設(shè)H0。可見(jiàn), p 是使得依據(jù)給定樣本值作出“拒絕假設(shè)H0”的最小的顯著性水平,稱之為檢驗(yàn)的 p 值。,多數(shù)統(tǒng)計(jì)軟件都提供 p 值的輸出結(jié)果,人們就不必針對(duì)每個(gè)顯著性水平α查相應(yīng)分布的下側(cè)分位數(shù),只要直接比較α與 p 值即可。,,§5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗(yàn)問(wèn)題,前面對(duì)單參數(shù)假設(shè)檢驗(yàn)問(wèn)題作了比較詳盡的討論,其解決問(wèn)題的基本思想方法也適用于多參數(shù)假設(shè)檢驗(yàn)或非參數(shù)假設(shè)檢驗(yàn)問(wèn)題,只是在具體細(xì)節(jié)上作適當(dāng)調(diào)整即可。為此,僅說(shuō)明兩點(diǎn): ⑴ 對(duì)于多參數(shù)假設(shè)檢驗(yàn)問(wèn)題,需尋求一個(gè)包含所有待檢驗(yàn)參數(shù)的樞軸量,并使之服從或漸近地服從一個(gè)已知的確定分布; ⑵非參數(shù)假設(shè)檢驗(yàn)問(wèn)題可以近似地化為一個(gè)多參數(shù)假設(shè)檢驗(yàn)問(wèn)題來(lái)解決。,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 假設(shè)檢驗(yàn) ppt 課件
鏈接地址:http://kudomayuko.com/p-1249217.html