統(tǒng)計(jì)學(xué)第四章抽樣與參數(shù)估計(jì).ppt
《統(tǒng)計(jì)學(xué)第四章抽樣與參數(shù)估計(jì).ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《統(tǒng)計(jì)學(xué)第四章抽樣與參數(shù)估計(jì).ppt(61頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第四章抽樣與參數(shù)估計(jì),學(xué)習(xí)目的了解抽樣分布和抽樣的其它組織方式。掌握抽樣調(diào)查的基本問(wèn)題。熟練運(yùn)用參數(shù)估計(jì)方法估計(jì)總體參數(shù)。,第四章抽樣與參數(shù)估計(jì),第一節(jié)抽樣調(diào)查的基本問(wèn)題第二節(jié)抽樣分布第三節(jié)參數(shù)估計(jì),推斷統(tǒng)計(jì):利用樣本統(tǒng)計(jì)量對(duì)總體某些性質(zhì)或數(shù)量特征進(jìn)行推斷。,,,,隨機(jī)原則,總體,樣本,總體參數(shù),統(tǒng)計(jì)量,,,,,參數(shù)估計(jì),,,,,假設(shè)檢驗(yàn),第一節(jié)抽樣調(diào)查的基本問(wèn)題,一、抽樣調(diào)查及其特點(diǎn)(一)抽樣調(diào)查的概念它是按照隨機(jī)原則,從研究總體的所有單位中,抽取部分單位作為樣本,然后以樣本的觀測(cè)或調(diào)查結(jié)果對(duì)總體的數(shù)量特征做出具有一定可靠程度和精度的估計(jì)或推斷的一種統(tǒng)計(jì)調(diào)查方法。例如,從某地消費(fèi)者中,通過(guò)隨機(jī)抽樣抽取若干消費(fèi)者進(jìn)行消費(fèi)水平的實(shí)測(cè),計(jì)算平均消費(fèi)水平,以此來(lái)推斷該地區(qū)的平均消費(fèi)水平。,1、在調(diào)查單位的選取上遵循隨機(jī)原則隨機(jī)原則,就是在抽選樣本時(shí)排除主觀上有意識(shí)地抽選調(diào)查單位,使總體每個(gè)單位都有相同的機(jī)會(huì)被抽中。2、它以樣本的數(shù)量特征去推斷總體的數(shù)量特征。抽樣調(diào)查不僅具有省時(shí)、省力的特性,而且還能認(rèn)識(shí)總體的數(shù)量特征。3、推斷過(guò)程中抽樣誤差可以事先計(jì)算并加以控制。,(二)抽樣調(diào)查的基本特點(diǎn),1、有些現(xiàn)象無(wú)法進(jìn)行全面調(diào)查,但為了測(cè)算總體情況,必須進(jìn)行抽樣調(diào)查。2、抽樣調(diào)查的結(jié)果可以對(duì)全面調(diào)查的結(jié)果進(jìn)行檢查和修正。3、抽樣調(diào)查可用于生產(chǎn)過(guò)程的質(zhì)量控制。,(三)抽樣調(diào)查的作用,二、抽樣推斷中的基本概念,(一)總體總體,又稱全及總體或母體,是指所要調(diào)查研究的對(duì)象的全體。在抽樣調(diào)查中,總體是唯一確定的??傮w內(nèi)包含的單位多少稱為總體單位數(shù),一般用符號(hào)N表示。,數(shù)量總體被研究的是數(shù)量變量的總體屬性總體被研究是屬性變量的總體,據(jù)被研究變量的性質(zhì)不同,,反映總體數(shù)量特征的指標(biāo)為總體指標(biāo)或總體參數(shù)。從理論上說(shuō),它由被抽樣總體各單位的變量值或變量特征計(jì)算而成的。對(duì)于數(shù)量總體,設(shè)某單位的變量值為,總體指標(biāo)有:總體均值:總體方差:總體標(biāo)準(zhǔn)差:,,,,對(duì)于屬性總體,設(shè)總體中具有某種屬性特征的單位數(shù)為,其它單位數(shù)為,總體單位數(shù),總體指標(biāo)有:總體比率:總體方差:總體標(biāo)準(zhǔn)差:,,,,,,,,(二)樣本,樣本,也稱子樣,是指從被調(diào)查的總體中按照隨機(jī)原則抽取,并要對(duì)其進(jìn)行調(diào)查或觀察的部分單位所組成的集合體。一個(gè)樣本所包含的單位數(shù)稱樣本容量,用符號(hào)n表示。從總體中可能抽取的全部樣本數(shù)目稱為可能樣本個(gè)數(shù)。對(duì)于一個(gè)總體,從中所抽取的樣本是隨機(jī)的,不是唯一的。,表示樣本數(shù)量特征的指標(biāo)稱為樣本指標(biāo)或樣本統(tǒng)計(jì)量,它由樣本各單位的標(biāo)志值或標(biāo)志特征計(jì)算而成的。設(shè)是來(lái)自總體的樣本,則樣本指標(biāo)有:,樣本均值:樣本方差:,,未分組分組,,,未分組分組,,,,,,,未分組分組,,樣本標(biāo)準(zhǔn)差:,樣本標(biāo)準(zhǔn)差:,樣本比率:樣本方差:,在統(tǒng)計(jì)學(xué)中經(jīng)常會(huì)遇到“自由度”這個(gè)概念,所謂自由度是指不受任何約束,可以自由取值的變量的個(gè)數(shù)。例如,有4個(gè)變量,它們的和是20,即,這是一個(gè)限制條件,此時(shí),有3個(gè)變量可以自由取值,由于只有一個(gè)限制條件,那么可以自由取值的變量的個(gè)數(shù)是4-1=3,即自由度為3。,(三)自由度,,,三、抽樣方法,根據(jù)樣本單位是否可重復(fù)抽取,分為:(一)重復(fù)抽樣抽取樣本單位的過(guò)程:設(shè)從總體N中隨機(jī)抽取一個(gè)容量為n的樣本,每次從總體中抽取一個(gè)樣本單位,連續(xù)進(jìn)行n次抽取,構(gòu)成一個(gè)樣本。在對(duì)每次抽取的樣本單位觀測(cè)后,將該單位重新放回,這樣在下一次的抽樣中仍有可能再次被抽中。(二)不重復(fù)抽樣它從總體N中抽取一個(gè)容量為n的樣本,也是由連續(xù)次抽取的結(jié)果構(gòu)成的,但每次抽中的樣本單位,觀測(cè)后不再放回總體,因此在下一次抽取樣本單位時(shí)不會(huì)再抽到前面已抽中過(guò)的樣本單位。,,四、抽樣推斷的理論基礎(chǔ)大數(shù)定律證明:隨著樣本容量的增加,樣本均值接近于總體均值的趨勢(shì),幾乎是具有實(shí)際必然性。中心極限定理:如果總體變量存在有限的平均數(shù)和方差,那么,不論這個(gè)總體的分布如何,隨著樣本容量的增加,樣本均值的分布便趨近正態(tài)分布。在樣本容量充分大的條件下,樣本均值也趨近于正態(tài)分布,這為抽樣誤差的概率估計(jì)理論提供了理論基礎(chǔ)。,中心極限定理:設(shè)從均值為?,方差為?2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布.,第二節(jié)抽樣分布,一、抽樣分布的概念抽樣分布是指樣本統(tǒng)計(jì)量的概率分布。從同一個(gè)總體中,抽取樣本容量相同的所有可能樣本后,計(jì)算每一個(gè)樣本統(tǒng)計(jì)量的取值和相應(yīng)的概率,就組成樣本統(tǒng)計(jì)量的概率分布,簡(jiǎn)稱抽樣分布。,二﹑簡(jiǎn)單隨機(jī)樣本,如果總體中每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的,并且在每次抽取一個(gè)個(gè)體之后總體的成分不改變,這樣抽取出的個(gè)體所構(gòu)成的樣本就能很好地反映總體的情況,基于這種想法抽取的樣本,稱為簡(jiǎn)單隨機(jī)樣本。當(dāng)總體為有限總體時(shí),那么抽樣就要用重復(fù)抽樣;當(dāng)總體為無(wú)限總體時(shí),可以用不重復(fù)抽樣。,簡(jiǎn)單隨機(jī)抽樣也稱純隨機(jī)抽樣。它是直接從總體的N個(gè)單位中完全隨機(jī)地抽取n個(gè)單位并使總體中的每一個(gè)單位都有同等被抽中的概率的抽樣組織形式。特點(diǎn):在理論上最符合隨機(jī)原則,簡(jiǎn)單隨機(jī)抽樣保證總體中各個(gè)單位被抽中的機(jī)會(huì)是相等的,均為。是設(shè)計(jì)其他抽樣組織方式的基礎(chǔ)。是衡量其他抽樣效果的標(biāo)準(zhǔn)。,三、簡(jiǎn)單隨機(jī)抽樣的概念及特點(diǎn),,抽樣設(shè)計(jì)效果指標(biāo),,若,值大于等于1,即其他抽樣形式的抽樣方差大于等于簡(jiǎn)單隨機(jī)抽樣的抽樣方差,則抽樣估計(jì)效果較差;,四、常用統(tǒng)計(jì)量的抽樣分布,(一)樣本均值的抽樣分布1、重復(fù)抽樣的抽樣分布例4-1某次調(diào)查中4個(gè)被調(diào)查者的月消費(fèi)額分別為400元、500元、700元、800元。設(shè)4個(gè)被調(diào)查者構(gòu)成總體,則:,總體均值,,,(元),(元),總體方差,總體標(biāo)準(zhǔn)差,用重復(fù)抽樣的方法,從4人中隨機(jī)抽個(gè)構(gòu)成樣本,共16個(gè)有個(gè)可能的樣本。各樣本的月平均消費(fèi)如表:,可以整理出樣本均值,的抽樣分布,樣本均值,的抽樣分布,,200000,9600,1,16,合計(jì),400004500010000500005000100004500040000,4009005001100240013007001500800,1/162/161/162/164/162/161/162/161/16,121242121,400450500550600650700750800,,頻率f,頻數(shù),樣本的月平均消費(fèi)(元),,,,,,,,,,,樣本均值抽樣分布的均值:樣本均值抽樣分布的方差:樣本均值抽樣分布的標(biāo)準(zhǔn)差為:可見,樣本均值抽樣分布的均值等于總體的均值,即,,,,,,(元),(元),(元),雖然每個(gè)樣本均值的取值可能與總體均值不同,有一定離差,但從總體來(lái)看,所有樣本均值平均說(shuō)來(lái)和總體均值是相同的,不再存在離差。,抽樣分布的方差,,,,,抽樣分布的標(biāo)準(zhǔn)差,驗(yàn)證了以下兩個(gè)結(jié)論:抽樣平均數(shù)的標(biāo)準(zhǔn)差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。,2、不重復(fù)抽樣的抽樣分布仍以上例為例,某次調(diào)查中4個(gè)被調(diào)查者的月消費(fèi)為400元、500元、700元、800元。設(shè)4個(gè)被調(diào)查者構(gòu)成總體,則:,總體均值,(元),總體方差,總體標(biāo)準(zhǔn)差,(元),采用不重復(fù)抽樣的方法,從4人中隨機(jī)抽個(gè)構(gòu)成樣本,共有43=12個(gè)可能的樣本。,----450550600450----600650550600----750600650750----,400500700800,400500700800,樣本變量,,,,,,,100000,7200,1,12,合計(jì),4500050000500045000,9001100240013001500,2/122/124/122/122/12,22422,450550600650750,頻率,頻數(shù)f,樣本的月平均消費(fèi),,,,,,,,,樣本均值,的抽樣分布,樣本均值抽樣分布的均值:樣本均值抽樣分布的方差:樣本均值抽樣分布的標(biāo)準(zhǔn)差為:可見,樣本均值抽樣分布的均值等于總體的均值,即,,,,,(元),(元),(元),不重復(fù)抽樣條件下,樣本均值的分布仍具有兩個(gè)重要性質(zhì):,(1)樣本均值的抽樣分布的均值等于總體的均值,(2)樣本均值,的抽樣分布的方差等于重復(fù)抽樣,的樣本均值抽樣分布的方差乘以修正因子,抽樣分布的標(biāo)準(zhǔn)差,,,,抽樣,總體,樣本,比率,,X,(N),比率P=Ni/N,,x,(n),所有可能的樣本的比率()所形成的分布,稱為樣本比率的抽樣分布。,(二)樣本比率的抽樣分布,抽樣方法均值方差標(biāo)準(zhǔn)差,重復(fù)抽樣,不重復(fù)抽樣,,,,,,,,根據(jù)中心極限定理,只要樣本足夠大,的分布就近似正態(tài)分布。(np和nq大于5時(shí)),抽樣誤差,抽樣誤差,樣本比率分布的均值和方差,抽樣分布總結(jié),第三節(jié)參數(shù)估計(jì),一、參數(shù)估計(jì)的基本概念(一)估計(jì)量在實(shí)際問(wèn)題中,經(jīng)常需要我們構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量去對(duì)總體分布中所含的未知參數(shù)(如均值﹑方差﹑比率等)的數(shù)值做出估計(jì)。這時(shí)用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量,它也是一個(gè)隨機(jī)變量。估計(jì)量的具體數(shù)值稱為估計(jì)值。,(二)抽樣誤差,抽樣誤差是由于抽樣的隨機(jī)性而造成樣本指標(biāo)和總體指標(biāo)之間的誤差,這種誤差是抽樣調(diào)查所固有的、不可避免的,也叫隨機(jī)誤差。抽樣誤差有實(shí)際誤差和平均誤差兩種。實(shí)際誤差是指某一次抽樣結(jié)果所得到的樣本指標(biāo)和總體指標(biāo)之間的誤差。但由于總體指標(biāo)未知,因而無(wú)法計(jì)算。,,,樣本容量,抽樣方法,總體標(biāo)志變動(dòng)度,抽樣組織形式,抽樣誤差的影響因素,,,(三)抽樣極限誤差,抽樣極限誤差又稱允許誤差。是指樣本指標(biāo)和總體指標(biāo)之間抽樣誤差的可能范圍。由于總體指標(biāo)是一個(gè)確定的數(shù),而樣本指標(biāo)則圍繞總體指標(biāo)左右變動(dòng),它與總體指標(biāo)可能產(chǎn)生正離差,也可能產(chǎn)生負(fù)離差,樣本指標(biāo)變動(dòng)的上限或下限與總體指標(biāo)之差的絕對(duì)值就可以表示抽樣誤差的可能范圍,我們將這種以絕對(duì)值形式表示的抽樣誤差可能范圍稱為抽樣極限誤差。,,,,則,,二﹑估計(jì)量的優(yōu)良標(biāo)準(zhǔn),的數(shù)學(xué)期望等于總體參數(shù),即,該估計(jì)量稱為無(wú)偏估計(jì)。,,,無(wú)偏性,有效性,當(dāng)為的無(wú)偏估計(jì)時(shí),方差越小,無(wú)偏估計(jì)越有效。,一致性,對(duì)于無(wú)限總體,如果對(duì)任意,則稱,的一致估計(jì)。,是,,,,,,,估計(jì)量,,,三、參數(shù)估計(jì)方法,點(diǎn)估計(jì),,以樣本指標(biāo)直接估計(jì)總體參數(shù)。,,區(qū)間估計(jì),,估計(jì)未知參數(shù)所在的可能的區(qū)間。,點(diǎn)估計(jì)的優(yōu)點(diǎn)在于它能夠明確地估計(jì)總體參數(shù),但一般該值不會(huì)等于總體參數(shù)的真值,它與真值的誤差﹑估計(jì)的可靠性怎樣,我們無(wú)法知道,而區(qū)間估計(jì)則可彌補(bǔ)這種不足之處。,,區(qū)間估計(jì),評(píng)價(jià)準(zhǔn)則,,隨機(jī)區(qū)間,,,,置信度,精確度,隨機(jī)區(qū)間,,,,,,包含,(即可靠程度)越大越好。,的概率,的平均長(zhǎng)度,(誤差范圍)越小越好,一般形式,或,,,,,,總體參數(shù),估計(jì)值,誤差范圍,△:一定倍數(shù)的抽樣誤差,例如:,抽樣誤差,一定時(shí),,越大,,概率(可靠性)大;,隨之增大,,精確度就差。,,四、區(qū)間估計(jì)的基本原理,區(qū)間估計(jì)步驟:1.選擇含有待估參數(shù)的一個(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量,并指出該統(tǒng)計(jì)量所服從的分布。2.對(duì)于給定的置信水平,查該統(tǒng)計(jì)量所服從的分布表確定出臨界值,使該統(tǒng)計(jì)量取以臨界值為范圍內(nèi)的值的概率為,3.對(duì)第2步經(jīng)過(guò)不等式變形可得所求參數(shù)的置信區(qū)間公式。4.將有關(guān)數(shù)值代入置信區(qū)間公式,即可求出所求參數(shù)的一個(gè)置信區(qū)間。,區(qū)間估計(jì)的內(nèi)容,,簡(jiǎn)單隨機(jī)抽樣,,待估計(jì)參數(shù),已知條件,置信區(qū)間,正態(tài)總體,σ2已知,正態(tài)總體,σ2未知,非正態(tài)總體,n≥30σ未知時(shí),用S,有限總體,n≥30(不重復(fù)),總體均值(μ),σ未知時(shí),用S,,,,,,,,五、一個(gè)總體參數(shù)的區(qū)間估計(jì)(一)總體均值的區(qū)間估計(jì),1、正態(tài)總體、方差已知,或非正態(tài)總體(大樣本)例4-2某保險(xiǎn)公司自投保人中隨機(jī)抽取36人,計(jì)算出此36人的平均年齡為39.5歲,已知投保人年齡分布近似正態(tài)分布,標(biāo)準(zhǔn)差為7.2歲,試求所有投保人平均年齡置信水平為99%的置信區(qū)間?,于是,我們有99%的把握保證投保人平均年齡在36.41~42.59歲之間。,例4-3某金融機(jī)構(gòu)共有8042張應(yīng)收賬款單,根據(jù)過(guò)去記錄,所有應(yīng)收賬款的標(biāo)準(zhǔn)差為3033.4元,現(xiàn)隨機(jī)抽查了250張應(yīng)收賬單,得平均應(yīng)收金額為3319元,求全部應(yīng)收賬單的平均應(yīng)收金額的置信水平為98%的置信區(qū)間。,于是,我們有98%的把握認(rèn)為全部應(yīng)收賬單的平均應(yīng)收金額在2871.99~3766元之間。,例4-4某廣播電臺(tái)要估計(jì)某市65歲以上的已退休的人中一天時(shí)間里收聽廣播的時(shí)間,隨機(jī)抽取了一個(gè)容量為200的樣本,得到樣本均值為110分鐘,樣本標(biāo)準(zhǔn)差為30分鐘,試估計(jì)總體均值的置信水平為95%的置信區(qū)間。,于是,我們有95%的把握認(rèn)為該市65歲以上已退休的人每天收聽廣播的時(shí)間在107.24~112.76分鐘之間。,2、正態(tài)總體、方差未知、小樣本時(shí)求的置信區(qū)間例4-5為了估計(jì)一分鐘一次廣告的平均費(fèi)用,抽出了15個(gè)電視臺(tái)的樣本。樣本均值為2000元,標(biāo)準(zhǔn)差為1000元。假定所有的這類電視臺(tái)的廣告費(fèi)用近似服從正態(tài)分布,試求電視臺(tái)一分鐘一次廣告平均費(fèi)用的置信水平為95%的置信區(qū)間。,于是,我們有95%的把握保證電視臺(tái)一分鐘一次廣告平均費(fèi)用在1446.2~2553.8元之間。,(二)一個(gè)總體比率的區(qū)間估計(jì),,簡(jiǎn)單隨機(jī)抽樣,,待估計(jì)參數(shù),已知條件,置信區(qū)間,重復(fù)抽樣,總體比率(p),,,,,不重復(fù)抽樣,,例4-6某電視臺(tái)想了解每日“晚間新間”欄目的收視率,隨機(jī)抽取了400人進(jìn)行調(diào)查,結(jié)果表明有71.2%的人觀看此節(jié)目。試估計(jì)該欄目收視率具有90%的可靠性的置信區(qū)間。,于是,有90%的把握認(rèn)為該欄目收視率在67.48%~74.92%之間。,八、樣本容量的確定,(一)影響樣本容量的因素總體各單位的差異程度。允許誤差范圍。概率保證程度。不同的抽樣方法(重復(fù)抽樣和不重復(fù)抽樣)。,(二)樣本容量的計(jì)算1、估計(jì)總體均值時(shí)的樣本容量的計(jì)算,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 統(tǒng)計(jì)學(xué) 第四 抽樣 參數(shù)估計(jì)
鏈接地址:http://kudomayuko.com/p-3525836.html