統(tǒng)計學(xué)第四章抽樣與參數(shù)估計.ppt
《統(tǒng)計學(xué)第四章抽樣與參數(shù)估計.ppt》由會員分享,可在線閱讀,更多相關(guān)《統(tǒng)計學(xué)第四章抽樣與參數(shù)估計.ppt(61頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第四章抽樣與參數(shù)估計,學(xué)習(xí)目的了解抽樣分布和抽樣的其它組織方式。掌握抽樣調(diào)查的基本問題。熟練運用參數(shù)估計方法估計總體參數(shù)。,第四章抽樣與參數(shù)估計,第一節(jié)抽樣調(diào)查的基本問題第二節(jié)抽樣分布第三節(jié)參數(shù)估計,推斷統(tǒng)計:利用樣本統(tǒng)計量對總體某些性質(zhì)或數(shù)量特征進行推斷。,,,,隨機原則,總體,樣本,總體參數(shù),統(tǒng)計量,,,,,參數(shù)估計,,,,,假設(shè)檢驗,第一節(jié)抽樣調(diào)查的基本問題,一、抽樣調(diào)查及其特點(一)抽樣調(diào)查的概念它是按照隨機原則,從研究總體的所有單位中,抽取部分單位作為樣本,然后以樣本的觀測或調(diào)查結(jié)果對總體的數(shù)量特征做出具有一定可靠程度和精度的估計或推斷的一種統(tǒng)計調(diào)查方法。例如,從某地消費者中,通過隨機抽樣抽取若干消費者進行消費水平的實測,計算平均消費水平,以此來推斷該地區(qū)的平均消費水平。,1、在調(diào)查單位的選取上遵循隨機原則隨機原則,就是在抽選樣本時排除主觀上有意識地抽選調(diào)查單位,使總體每個單位都有相同的機會被抽中。2、它以樣本的數(shù)量特征去推斷總體的數(shù)量特征。抽樣調(diào)查不僅具有省時、省力的特性,而且還能認識總體的數(shù)量特征。3、推斷過程中抽樣誤差可以事先計算并加以控制。,(二)抽樣調(diào)查的基本特點,1、有些現(xiàn)象無法進行全面調(diào)查,但為了測算總體情況,必須進行抽樣調(diào)查。2、抽樣調(diào)查的結(jié)果可以對全面調(diào)查的結(jié)果進行檢查和修正。3、抽樣調(diào)查可用于生產(chǎn)過程的質(zhì)量控制。,(三)抽樣調(diào)查的作用,二、抽樣推斷中的基本概念,(一)總體總體,又稱全及總體或母體,是指所要調(diào)查研究的對象的全體。在抽樣調(diào)查中,總體是唯一確定的??傮w內(nèi)包含的單位多少稱為總體單位數(shù),一般用符號N表示。,數(shù)量總體被研究的是數(shù)量變量的總體屬性總體被研究是屬性變量的總體,據(jù)被研究變量的性質(zhì)不同,,反映總體數(shù)量特征的指標(biāo)為總體指標(biāo)或總體參數(shù)。從理論上說,它由被抽樣總體各單位的變量值或變量特征計算而成的。對于數(shù)量總體,設(shè)某單位的變量值為,總體指標(biāo)有:總體均值:總體方差:總體標(biāo)準(zhǔn)差:,,,,對于屬性總體,設(shè)總體中具有某種屬性特征的單位數(shù)為,其它單位數(shù)為,總體單位數(shù),總體指標(biāo)有:總體比率:總體方差:總體標(biāo)準(zhǔn)差:,,,,,,,,(二)樣本,樣本,也稱子樣,是指從被調(diào)查的總體中按照隨機原則抽取,并要對其進行調(diào)查或觀察的部分單位所組成的集合體。一個樣本所包含的單位數(shù)稱樣本容量,用符號n表示。從總體中可能抽取的全部樣本數(shù)目稱為可能樣本個數(shù)。對于一個總體,從中所抽取的樣本是隨機的,不是唯一的。,表示樣本數(shù)量特征的指標(biāo)稱為樣本指標(biāo)或樣本統(tǒng)計量,它由樣本各單位的標(biāo)志值或標(biāo)志特征計算而成的。設(shè)是來自總體的樣本,則樣本指標(biāo)有:,樣本均值:樣本方差:,,未分組分組,,,未分組分組,,,,,,,未分組分組,,樣本標(biāo)準(zhǔn)差:,樣本標(biāo)準(zhǔn)差:,樣本比率:樣本方差:,在統(tǒng)計學(xué)中經(jīng)常會遇到“自由度”這個概念,所謂自由度是指不受任何約束,可以自由取值的變量的個數(shù)。例如,有4個變量,它們的和是20,即,這是一個限制條件,此時,有3個變量可以自由取值,由于只有一個限制條件,那么可以自由取值的變量的個數(shù)是4-1=3,即自由度為3。,(三)自由度,,,三、抽樣方法,根據(jù)樣本單位是否可重復(fù)抽取,分為:(一)重復(fù)抽樣抽取樣本單位的過程:設(shè)從總體N中隨機抽取一個容量為n的樣本,每次從總體中抽取一個樣本單位,連續(xù)進行n次抽取,構(gòu)成一個樣本。在對每次抽取的樣本單位觀測后,將該單位重新放回,這樣在下一次的抽樣中仍有可能再次被抽中。(二)不重復(fù)抽樣它從總體N中抽取一個容量為n的樣本,也是由連續(xù)次抽取的結(jié)果構(gòu)成的,但每次抽中的樣本單位,觀測后不再放回總體,因此在下一次抽取樣本單位時不會再抽到前面已抽中過的樣本單位。,,四、抽樣推斷的理論基礎(chǔ)大數(shù)定律證明:隨著樣本容量的增加,樣本均值接近于總體均值的趨勢,幾乎是具有實際必然性。中心極限定理:如果總體變量存在有限的平均數(shù)和方差,那么,不論這個總體的分布如何,隨著樣本容量的增加,樣本均值的分布便趨近正態(tài)分布。在樣本容量充分大的條件下,樣本均值也趨近于正態(tài)分布,這為抽樣誤差的概率估計理論提供了理論基礎(chǔ)。,中心極限定理:設(shè)從均值為?,方差為?2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布.,第二節(jié)抽樣分布,一、抽樣分布的概念抽樣分布是指樣本統(tǒng)計量的概率分布。從同一個總體中,抽取樣本容量相同的所有可能樣本后,計算每一個樣本統(tǒng)計量的取值和相應(yīng)的概率,就組成樣本統(tǒng)計量的概率分布,簡稱抽樣分布。,二﹑簡單隨機樣本,如果總體中每個個體被抽到的機會是均等的,并且在每次抽取一個個體之后總體的成分不改變,這樣抽取出的個體所構(gòu)成的樣本就能很好地反映總體的情況,基于這種想法抽取的樣本,稱為簡單隨機樣本。當(dāng)總體為有限總體時,那么抽樣就要用重復(fù)抽樣;當(dāng)總體為無限總體時,可以用不重復(fù)抽樣。,簡單隨機抽樣也稱純隨機抽樣。它是直接從總體的N個單位中完全隨機地抽取n個單位并使總體中的每一個單位都有同等被抽中的概率的抽樣組織形式。特點:在理論上最符合隨機原則,簡單隨機抽樣保證總體中各個單位被抽中的機會是相等的,均為。是設(shè)計其他抽樣組織方式的基礎(chǔ)。是衡量其他抽樣效果的標(biāo)準(zhǔn)。,三、簡單隨機抽樣的概念及特點,,抽樣設(shè)計效果指標(biāo),,若,值大于等于1,即其他抽樣形式的抽樣方差大于等于簡單隨機抽樣的抽樣方差,則抽樣估計效果較差;,四、常用統(tǒng)計量的抽樣分布,(一)樣本均值的抽樣分布1、重復(fù)抽樣的抽樣分布例4-1某次調(diào)查中4個被調(diào)查者的月消費額分別為400元、500元、700元、800元。設(shè)4個被調(diào)查者構(gòu)成總體,則:,總體均值,,,(元),(元),總體方差,總體標(biāo)準(zhǔn)差,用重復(fù)抽樣的方法,從4人中隨機抽個構(gòu)成樣本,共16個有個可能的樣本。各樣本的月平均消費如表:,可以整理出樣本均值,的抽樣分布,樣本均值,的抽樣分布,,200000,9600,1,16,合計,400004500010000500005000100004500040000,4009005001100240013007001500800,1/162/161/162/164/162/161/162/161/16,121242121,400450500550600650700750800,,頻率f,頻數(shù),樣本的月平均消費(元),,,,,,,,,,,樣本均值抽樣分布的均值:樣本均值抽樣分布的方差:樣本均值抽樣分布的標(biāo)準(zhǔn)差為:可見,樣本均值抽樣分布的均值等于總體的均值,即,,,,,,(元),(元),(元),雖然每個樣本均值的取值可能與總體均值不同,有一定離差,但從總體來看,所有樣本均值平均說來和總體均值是相同的,不再存在離差。,抽樣分布的方差,,,,,抽樣分布的標(biāo)準(zhǔn)差,驗證了以下兩個結(jié)論:抽樣平均數(shù)的標(biāo)準(zhǔn)差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。,2、不重復(fù)抽樣的抽樣分布仍以上例為例,某次調(diào)查中4個被調(diào)查者的月消費為400元、500元、700元、800元。設(shè)4個被調(diào)查者構(gòu)成總體,則:,總體均值,(元),總體方差,總體標(biāo)準(zhǔn)差,(元),采用不重復(fù)抽樣的方法,從4人中隨機抽個構(gòu)成樣本,共有43=12個可能的樣本。,----450550600450----600650550600----750600650750----,400500700800,400500700800,樣本變量,,,,,,,100000,7200,1,12,合計,4500050000500045000,9001100240013001500,2/122/124/122/122/12,22422,450550600650750,頻率,頻數(shù)f,樣本的月平均消費,,,,,,,,,樣本均值,的抽樣分布,樣本均值抽樣分布的均值:樣本均值抽樣分布的方差:樣本均值抽樣分布的標(biāo)準(zhǔn)差為:可見,樣本均值抽樣分布的均值等于總體的均值,即,,,,,(元),(元),(元),不重復(fù)抽樣條件下,樣本均值的分布仍具有兩個重要性質(zhì):,(1)樣本均值的抽樣分布的均值等于總體的均值,(2)樣本均值,的抽樣分布的方差等于重復(fù)抽樣,的樣本均值抽樣分布的方差乘以修正因子,抽樣分布的標(biāo)準(zhǔn)差,,,,抽樣,總體,樣本,比率,,X,(N),比率P=Ni/N,,x,(n),所有可能的樣本的比率()所形成的分布,稱為樣本比率的抽樣分布。,(二)樣本比率的抽樣分布,抽樣方法均值方差標(biāo)準(zhǔn)差,重復(fù)抽樣,不重復(fù)抽樣,,,,,,,,根據(jù)中心極限定理,只要樣本足夠大,的分布就近似正態(tài)分布。(np和nq大于5時),抽樣誤差,抽樣誤差,樣本比率分布的均值和方差,抽樣分布總結(jié),第三節(jié)參數(shù)估計,一、參數(shù)估計的基本概念(一)估計量在實際問題中,經(jīng)常需要我們構(gòu)造適當(dāng)?shù)慕y(tǒng)計量去對總體分布中所含的未知參數(shù)(如均值﹑方差﹑比率等)的數(shù)值做出估計。這時用來估計總體參數(shù)的統(tǒng)計量稱為估計量,它也是一個隨機變量。估計量的具體數(shù)值稱為估計值。,(二)抽樣誤差,抽樣誤差是由于抽樣的隨機性而造成樣本指標(biāo)和總體指標(biāo)之間的誤差,這種誤差是抽樣調(diào)查所固有的、不可避免的,也叫隨機誤差。抽樣誤差有實際誤差和平均誤差兩種。實際誤差是指某一次抽樣結(jié)果所得到的樣本指標(biāo)和總體指標(biāo)之間的誤差。但由于總體指標(biāo)未知,因而無法計算。,,,樣本容量,抽樣方法,總體標(biāo)志變動度,抽樣組織形式,抽樣誤差的影響因素,,,(三)抽樣極限誤差,抽樣極限誤差又稱允許誤差。是指樣本指標(biāo)和總體指標(biāo)之間抽樣誤差的可能范圍。由于總體指標(biāo)是一個確定的數(shù),而樣本指標(biāo)則圍繞總體指標(biāo)左右變動,它與總體指標(biāo)可能產(chǎn)生正離差,也可能產(chǎn)生負離差,樣本指標(biāo)變動的上限或下限與總體指標(biāo)之差的絕對值就可以表示抽樣誤差的可能范圍,我們將這種以絕對值形式表示的抽樣誤差可能范圍稱為抽樣極限誤差。,,,,則,,二﹑估計量的優(yōu)良標(biāo)準(zhǔn),的數(shù)學(xué)期望等于總體參數(shù),即,該估計量稱為無偏估計。,,,無偏性,有效性,當(dāng)為的無偏估計時,方差越小,無偏估計越有效。,一致性,對于無限總體,如果對任意,則稱,的一致估計。,是,,,,,,,估計量,,,三、參數(shù)估計方法,點估計,,以樣本指標(biāo)直接估計總體參數(shù)。,,區(qū)間估計,,估計未知參數(shù)所在的可能的區(qū)間。,點估計的優(yōu)點在于它能夠明確地估計總體參數(shù),但一般該值不會等于總體參數(shù)的真值,它與真值的誤差﹑估計的可靠性怎樣,我們無法知道,而區(qū)間估計則可彌補這種不足之處。,,區(qū)間估計,評價準(zhǔn)則,,隨機區(qū)間,,,,置信度,精確度,隨機區(qū)間,,,,,,包含,(即可靠程度)越大越好。,的概率,的平均長度,(誤差范圍)越小越好,一般形式,或,,,,,,總體參數(shù),估計值,誤差范圍,△:一定倍數(shù)的抽樣誤差,例如:,抽樣誤差,一定時,,越大,,概率(可靠性)大;,隨之增大,,精確度就差。,,四、區(qū)間估計的基本原理,區(qū)間估計步驟:1.選擇含有待估參數(shù)的一個適當(dāng)?shù)慕y(tǒng)計量,并指出該統(tǒng)計量所服從的分布。2.對于給定的置信水平,查該統(tǒng)計量所服從的分布表確定出臨界值,使該統(tǒng)計量取以臨界值為范圍內(nèi)的值的概率為,3.對第2步經(jīng)過不等式變形可得所求參數(shù)的置信區(qū)間公式。4.將有關(guān)數(shù)值代入置信區(qū)間公式,即可求出所求參數(shù)的一個置信區(qū)間。,區(qū)間估計的內(nèi)容,,簡單隨機抽樣,,待估計參數(shù),已知條件,置信區(qū)間,正態(tài)總體,σ2已知,正態(tài)總體,σ2未知,非正態(tài)總體,n≥30σ未知時,用S,有限總體,n≥30(不重復(fù)),總體均值(μ),σ未知時,用S,,,,,,,,五、一個總體參數(shù)的區(qū)間估計(一)總體均值的區(qū)間估計,1、正態(tài)總體、方差已知,或非正態(tài)總體(大樣本)例4-2某保險公司自投保人中隨機抽取36人,計算出此36人的平均年齡為39.5歲,已知投保人年齡分布近似正態(tài)分布,標(biāo)準(zhǔn)差為7.2歲,試求所有投保人平均年齡置信水平為99%的置信區(qū)間?,于是,我們有99%的把握保證投保人平均年齡在36.41~42.59歲之間。,例4-3某金融機構(gòu)共有8042張應(yīng)收賬款單,根據(jù)過去記錄,所有應(yīng)收賬款的標(biāo)準(zhǔn)差為3033.4元,現(xiàn)隨機抽查了250張應(yīng)收賬單,得平均應(yīng)收金額為3319元,求全部應(yīng)收賬單的平均應(yīng)收金額的置信水平為98%的置信區(qū)間。,于是,我們有98%的把握認為全部應(yīng)收賬單的平均應(yīng)收金額在2871.99~3766元之間。,例4-4某廣播電臺要估計某市65歲以上的已退休的人中一天時間里收聽廣播的時間,隨機抽取了一個容量為200的樣本,得到樣本均值為110分鐘,樣本標(biāo)準(zhǔn)差為30分鐘,試估計總體均值的置信水平為95%的置信區(qū)間。,于是,我們有95%的把握認為該市65歲以上已退休的人每天收聽廣播的時間在107.24~112.76分鐘之間。,2、正態(tài)總體、方差未知、小樣本時求的置信區(qū)間例4-5為了估計一分鐘一次廣告的平均費用,抽出了15個電視臺的樣本。樣本均值為2000元,標(biāo)準(zhǔn)差為1000元。假定所有的這類電視臺的廣告費用近似服從正態(tài)分布,試求電視臺一分鐘一次廣告平均費用的置信水平為95%的置信區(qū)間。,于是,我們有95%的把握保證電視臺一分鐘一次廣告平均費用在1446.2~2553.8元之間。,(二)一個總體比率的區(qū)間估計,,簡單隨機抽樣,,待估計參數(shù),已知條件,置信區(qū)間,重復(fù)抽樣,總體比率(p),,,,,不重復(fù)抽樣,,例4-6某電視臺想了解每日“晚間新間”欄目的收視率,隨機抽取了400人進行調(diào)查,結(jié)果表明有71.2%的人觀看此節(jié)目。試估計該欄目收視率具有90%的可靠性的置信區(qū)間。,于是,有90%的把握認為該欄目收視率在67.48%~74.92%之間。,八、樣本容量的確定,(一)影響樣本容量的因素總體各單位的差異程度。允許誤差范圍。概率保證程度。不同的抽樣方法(重復(fù)抽樣和不重復(fù)抽樣)。,(二)樣本容量的計算1、估計總體均值時的樣本容量的計算,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 統(tǒng)計學(xué) 第四 抽樣 參數(shù)估計
鏈接地址:http://kudomayuko.com/p-3525836.html