單變量推論統(tǒng)計(jì)1:參數(shù)估計(jì).ppt
《單變量推論統(tǒng)計(jì)1:參數(shù)估計(jì).ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《單變量推論統(tǒng)計(jì)1:參數(shù)估計(jì).ppt(30頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第三章單變量的推論統(tǒng)計(jì)之一:參數(shù)估計(jì),第一節(jié)抽樣分布第二節(jié)參數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì),,第一節(jié)抽樣分布一、相關(guān)名詞解釋參數(shù)值統(tǒng)計(jì)值隨機(jī)抽樣隨機(jī)樣本,,,二、蒙特卡羅抽樣分布:常見的統(tǒng)計(jì)問(wèn)題是:總體未知,比如我們并不知道華電所有學(xué)生的大學(xué)語(yǔ)文的平均分為u=65。我們只是隨機(jī)抽樣,比如抽取了3000名學(xué)生,得知這個(gè)3000名學(xué)生所構(gòu)成的樣本的均值=64。因此我們用得到的這個(gè)樣本統(tǒng)計(jì)值去估計(jì)總體的參數(shù)值。但是我們都知道,樣本是隨機(jī)抽取的,不同的人抽取到的樣本(假設(shè)讓全班28個(gè)人每個(gè)人都抽一個(gè)3000人容量的樣本)是不同的,同一個(gè)人反復(fù)抽樣時(shí)也很可能抽取到不同的樣本。根據(jù)排列組合,抽到的是無(wú)限個(gè)情況的樣本。我們反復(fù)從華電學(xué)生(假設(shè)是10000名)中抽3000個(gè)人組成樣本,每次都計(jì)算出一個(gè)新的樣本均值,那么將會(huì)得到無(wú)數(shù)個(gè)樣本均值,這種重復(fù)抽樣的方法就叫蒙特卡羅抽樣方法。從每個(gè)樣本中可以計(jì)算出一個(gè)樣本均值,我們將重復(fù)抽取的n個(gè)樣本的都計(jì)算出來(lái),研究發(fā)現(xiàn),這些均值就構(gòu)成了均值的蒙特卡羅抽樣分布。,,,,,因此可見,它是一種理論分布。研究發(fā)現(xiàn):1、抽樣分布的圖形顯示樣本均值圍繞其目標(biāo)u,以標(biāo)準(zhǔn)誤差SE=σ/近似正態(tài)地波動(dòng)。(因此n越大,SE越小,即波動(dòng)越小)2、同樣地,我們發(fā)現(xiàn)樣本比例p也可以用這個(gè)方法來(lái)處理,它圍繞其目標(biāo)P,以標(biāo)準(zhǔn)誤差SE=近似正態(tài)地波動(dòng)。,,,,三、對(duì)比總體分布、樣本分布、抽樣分布1、參數(shù)值:u和σ都是唯一確定的值。統(tǒng)計(jì)值:由于總體容量N〉樣本容量n,因?yàn)橹貜?fù)抽樣時(shí),每次抽取到的元素都會(huì)不盡相同。因此,不同的樣本的統(tǒng)計(jì)量很可能不同。2、抽樣中樣本只涉及到總體中的部分元素而不是全部元素。因?yàn)闃颖镜慕y(tǒng)計(jì)量與總體的參數(shù)值之間總是存在一定的差別,我們引入抽樣分布的概念,旨在對(duì)這種差別進(jìn)行一定的說(shuō)明。3、均值的正態(tài)近似原理:樣本均值以SE的標(biāo)準(zhǔn)誤差圍繞總體均值u波動(dòng)。隨著n的增加,波動(dòng)越來(lái)越小,越接近正態(tài)分布。(n≥30),,4、比例的正態(tài)近似定理:在容量為n的隨機(jī)樣本中,樣本比例p以SE=的標(biāo)準(zhǔn)誤差圍繞總體比例波動(dòng)。隨著n的增加,p的分布也就圍繞其目標(biāo)波動(dòng)地原來(lái)越小,越來(lái)越接近正態(tài)分布。(n≥30,np≥5)5、抽樣分布是關(guān)于樣本均值的分布,它的均值就是總體的均值u,即。。。,而抽樣分布的標(biāo)準(zhǔn)差,將之稱為標(biāo)準(zhǔn)誤差SE,以與總體分布、樣本分布相區(qū)分。其中SE=,而當(dāng)樣本相當(dāng)大時(shí),一般用樣本的標(biāo)準(zhǔn)差s來(lái)代替總體。,,例:臺(tái)灣的一次普遍調(diào)查顯示,臺(tái)灣民眾的月收入近似地服從正態(tài)分布,其均值為13110臺(tái)幣,標(biāo)準(zhǔn)差為8750元,求:(1)隨機(jī)地抽取一個(gè)人,其收入超過(guò)18430元的概率。(2)抽取一個(gè)含有50人的隨機(jī)樣本,求其平均收入超過(guò)16000元的概率。(3)如果總體不是正態(tài)的,那么(2)的答案是什么?,,例:全廠滿意工作環(huán)境的工人比例為35%,現(xiàn)在從全廠中隨機(jī)抽取150名工人,問(wèn)其滿意工作環(huán)境的工人比例超過(guò)45%的概率。,,作業(yè)題:1、試計(jì)算以下數(shù)值的四分位差、中位數(shù)、眾數(shù)2,3,4,5,4,4,2,5,6,6,7,,2、調(diào)查某地區(qū)的212個(gè)鄉(xiāng),目的是要知道每個(gè)鄉(xiāng)之育齡婦女(15-44歲)落實(shí)計(jì)劃生育的比率,以下為收集到的資料。1)試求四分位差。2)試求40百分位數(shù)點(diǎn)的值。,,第二節(jié)參數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì),一、點(diǎn)估計(jì)1、總體均值的點(diǎn)估計(jì)值。2、總體方差的點(diǎn)估計(jì)值。3、總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)值。4、總體比例的點(diǎn)估計(jì)值。,,二、區(qū)間估計(jì)(即:求置信區(qū)間)1、基本概念置信度:又稱可信度、置信水平。即總體的參數(shù)值落在置信區(qū)間的把握?;蛘哒f(shuō)用置信區(qū)間去估計(jì)總體參數(shù)值時(shí),成功的可能性有多大。置信區(qū)間:在一定的置信水平下,根據(jù)樣本的統(tǒng)計(jì)值來(lái)估計(jì)總體的參數(shù)值處于一定的區(qū)間之內(nèi),這個(gè)區(qū)間就是置信區(qū)間。顯著度:又稱顯著性水平。它表示用置信區(qū)間來(lái)估計(jì)總體參數(shù),其不可靠的概率。若置信水平為95%,則顯著性水平為5%或0.05。,,2、置信區(qū)間與置信度之間的關(guān)系相互制約置信度高低反映的是這種估計(jì)的可靠性或把握性的問(wèn)題,而置信區(qū)間的大小反映的是這種估計(jì)的精確性問(wèn)題。對(duì)于同一個(gè)總體和同一個(gè)抽樣規(guī)模來(lái)說(shuō),所給區(qū)間的大小與做出這種估計(jì)所具有的把握性成正比。即區(qū)間越大,則對(duì)這一估計(jì)成功的把握性也越大;反之,則把握性越小。綜上,從精確性出發(fā),要求所估計(jì)的區(qū)間越小越好,但是從把握性出發(fā),又要求所估計(jì)的區(qū)間越大越好。人們總是需要在二者兼進(jìn)行平衡與選擇。,,3、總體均值的區(qū)間估計(jì)1)總體方差σ已知時(shí),大、小樣本的均值估計(jì)2)總體方差σ未知時(shí),大樣本的均值估計(jì)3)總體方差σ未知時(shí),小樣本的均值估計(jì)4)未知總體比例(成數(shù)),大樣本的比例估計(jì)5)未知總體比例,小樣本的比例估計(jì)例:設(shè)某工廠婦女從事家務(wù)勞動(dòng)時(shí)間服從正態(tài)分布N(u,),隨機(jī)抽取了一個(gè)n=36的樣本,發(fā)現(xiàn)其每天平均從事家務(wù)勞動(dòng)的時(shí)間=2.65小時(shí),求u的雙側(cè)置信區(qū)間。(a=0.05)解:,,,,例:設(shè)某工廠婦女從事家務(wù)勞動(dòng)時(shí)間服從正態(tài)分布N(u,),隨機(jī)抽取了一個(gè)n=25的樣本,發(fā)現(xiàn)其每天平均從事家務(wù)勞動(dòng)的時(shí)間=2.65小時(shí),求u的雙側(cè)置信區(qū)間。(a=0.05)解:,,,總結(jié):1)總體參數(shù)u是常數(shù),并且一直保持不變,變化的是隨機(jī)區(qū)間,其中心為,長(zhǎng)度為2SE。2)隨著樣本含量n的增加,的標(biāo)準(zhǔn)誤差σ/也越來(lái)越小,因此置信區(qū)間也變得更窄更精確。這就是增加樣本含量的價(jià)值。3)隨著置信度的增高,也隨之增大,因此置信區(qū)間變得更寬,即更加含糊不明確,這也是可以理解的:要想把某一個(gè)聲明表達(dá)得更有把握,就必須使其更加含糊不明確。因此置信度和精確度之間是矛盾的。我們對(duì)于實(shí)際問(wèn)題總是在兩者之間作一個(gè)合理的折衷。,,,,,,,例:設(shè)某社區(qū)受教育程度服從正態(tài)分布N(u,σ),根據(jù)35人的隨機(jī)抽樣調(diào)查,=11.5年,S=3.6年,求u的雙側(cè)置信區(qū)間。(a=0.01)解:,,例:設(shè)某社區(qū)受教育程度服從正態(tài)分布N(u,σ),σ未知,根據(jù)26人的隨機(jī)抽樣調(diào)查,=11.5年,S=3.6年,求u的雙側(cè)置信區(qū)間。(a=0.01)解:,,,,,t分布是適用于小樣本的一種分布。其扁平或高聳的程度取決于自由度(df=n-1),其自由度越大,越高聳,形狀與標(biāo)準(zhǔn)正態(tài)分布曲線越接近。當(dāng)n≥30時(shí),一般認(rèn)為與正態(tài)分布近似。t分布與正態(tài)分布的相似之處:t分布基線上的t值從-∞-+∞;平均數(shù)等于0處,左側(cè)t值為負(fù),右側(cè)t值為正;曲線以平均數(shù)處為最高點(diǎn)向兩側(cè)逐漸下降,尾部無(wú)限延伸,永不與基線相接,呈單峰對(duì)稱形。使用t分布的條件:必須假定總體為正態(tài)分布。(與使用Z分布的不同之處),,為什么t分布的自由度是n-1而不是n呢?自由度:指的是可以自由取值的個(gè)案的數(shù)目,對(duì)于一組數(shù)據(jù)來(lái)說(shuō),假定n=1,則我們可以算出均值(就是這個(gè)唯一的數(shù)本身),但是無(wú)法考慮分布的形狀。描述分布的形狀最有價(jià)值的是方差,只有n超過(guò)1,我們才能得到這組數(shù)據(jù)分布的方差。(=),因此對(duì)于方差來(lái)說(shuō),均值占用了一個(gè)自由度,其余的n-1個(gè)自由度留給了方差。例:有5個(gè)數(shù),其均值為3,請(qǐng)問(wèn):1)你能確定這5個(gè)數(shù)都是什么嗎?2)如果不能,那么請(qǐng)問(wèn)其中有幾個(gè)數(shù)是可以自由取值的?,,,戈塞爾用筆名“學(xué)生”發(fā)表。為什么分母中根號(hào)下為n-1?樣本數(shù)據(jù)的離散程度小于總體數(shù)據(jù)的離散程度(假設(shè)用全距這個(gè)離散量數(shù)來(lái)說(shuō)明)。因此樣本的標(biāo)準(zhǔn)差會(huì)比總體的標(biāo)準(zhǔn)差偏小。因此s除以根號(hào)n會(huì)有偏誤,所以采用了根號(hào)n-1,在nS/,因此分母中為更貼近于σ/),,,,,,,,例:從某社區(qū)取n=200個(gè)家庭的樣本,36%的家庭中家庭事務(wù)是丈夫說(shuō)了算,問(wèn):此社區(qū)家庭事務(wù)是丈夫說(shuō)了算的家庭比例的置信區(qū)間。(a=0.01)解:法一:法二:,,4、二總體均值差的區(qū)間估計(jì)1)已知σ,大樣本(n1+n2≥100)2)已知σ,小樣本(n1+n2<100)3)未知σ,大樣本4)未知σ,小樣本5、二總體成數(shù)差的區(qū)間估計(jì),,例:為了了解甲、乙兩地中學(xué)畢業(yè)生成績(jī)的差別,兩地作了抽樣調(diào)查,結(jié)果顯示:甲地:=520,S1=40,n1=800名,乙地:=505,S2=50,n2=1000名,求:a=0.05時(shí),兩地平均成績(jī)差的區(qū)間估計(jì)。,,,,,,例:有兩個(gè)小組,甲小組:n1=11,人均每周抽煙=5盒,S1=1.5。乙小組:n2=11,人均每周抽煙=7盒,S2=2.0,求:a=0.05時(shí),兩組抽煙均值差的置信區(qū)間。,,,,,,例:甲、乙兩地各做1000戶抽樣調(diào)查,其中甲地?fù)碛须娨暀C(jī)為825戶;乙地?fù)碛须娨暀C(jī)為760戶。求:a=0.05時(shí),兩地電視機(jī)擁有比例(成數(shù))差的置信區(qū)間。,,6、單側(cè)置信區(qū)間,,例:設(shè)某工廠月平均收入服從正態(tài)分布N(u,),隨機(jī)抽取了一個(gè)n=36的樣本,發(fā)現(xiàn)其每人平均月平均收入為265元,求u的單側(cè)置信區(qū)間。(a=0.05)解:,,,作業(yè):1、我國(guó)某地區(qū)成年人教育水平的均值為8.2年,標(biāo)準(zhǔn)差為3年。隨機(jī)抽取了25位成年人進(jìn)行調(diào)查,發(fā)現(xiàn)平均受學(xué)校教育在7-9年之間的概率是多少?(抽樣分布)2、一架電梯是按照極限負(fù)重為1000公斤設(shè)計(jì)的,聲稱可以容納13人。假定利用該電梯的所有乘客重量的平均值為70公斤,標(biāo)準(zhǔn)差為12公斤。那么一個(gè)13人的隨機(jī)樣本的重量總體超過(guò)負(fù)重極限1000公斤的概率是多少?(先算出樣本均值),,3、課本403,六A4、課本403,六B,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 變量 推論 統(tǒng)計(jì) 參數(shù)估計(jì)
鏈接地址:http://kudomayuko.com/p-11523221.html