抽樣方法與樣本量估計(jì)



《抽樣方法與樣本量估計(jì)》由會(huì)員分享,可在線(xiàn)閱讀,更多相關(guān)《抽樣方法與樣本量估計(jì)(49頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、2021/6/41抽樣方法與樣本量估計(jì)抽樣方法與樣本量估計(jì)張文斌張文斌2013.122013.122021/6/42為什么要抽樣為什么要抽樣抽樣:經(jīng)濟(jì)、有效,是科學(xué)的。抽樣:經(jīng)濟(jì)、有效,是科學(xué)的。2021/6/43抽樣方法創(chuàng)始人抽樣方法創(chuàng)始人- -蓋洛普蓋洛普喬治喬治蓋洛普(蓋洛普(Gallup,GeorgeHoraceGallup,GeorgeHorace,1901198419011984,美國(guó)數(shù)學(xué)家),美國(guó)數(shù)學(xué)家) 蓋洛普1925-1928年就讀愛(ài)荷華州立大學(xué)(文學(xué)學(xué)士、心理學(xué)碩士、新聞學(xué)博士)。他的博士論文題目是應(yīng)用客觀方法衡量讀者對(duì)報(bào)紙興趣的一種新技術(shù),這篇論文包含著后來(lái)發(fā)展為蓋洛普民
2、意測(cè)驗(yàn)和輿論統(tǒng)計(jì)的思想。 1955年,蓋洛普在新澤西州的普林斯頓創(chuàng)立美國(guó)輿論研究所,正式舉辦有關(guān)政治和社會(huì)事業(yè)問(wèn)題的各種全國(guó)性民意調(diào)查包括對(duì)世界人民的態(tài)度、恐懼、希望、宗教信仰和風(fēng)俗刁慣等的調(diào)查。這個(gè)研究所的成立,迅速使蓋洛普民意測(cè)驗(yàn)具有了權(quán)威性,該研究所也稱(chēng)為蓋洛普民意測(cè)驗(yàn)所。 2021/6/44蓋洛普的成功蓋洛普的成功2021/6/45蓋洛普方法 蓋洛普使用的民意調(diào)查方法是一種代表性抽樣調(diào)查方法,是他在從事新聞工作中發(fā)展起來(lái)的,根據(jù)對(duì)象的年齡、性別、教育程度、職業(yè)等標(biāo)準(zhǔn),在全國(guó)各地區(qū)按比例選擇測(cè)驗(yàn)對(duì)象,派調(diào)查員親自去調(diào)查訪(fǎng)問(wèn),根據(jù)統(tǒng)計(jì)測(cè)驗(yàn)結(jié)果進(jìn)行分析,做出說(shuō)明。這種方法就是所謂的“定額抽樣
3、法”,即將總體各單位按某些主要標(biāo)識(shí)劃分類(lèi)型后抽取比例樣本,是一種非概率抽樣。2021/6/46抽樣調(diào)查的特點(diǎn)抽樣調(diào)查的特點(diǎn)特點(diǎn)特點(diǎn)1 1:抽取的樣本作為一個(gè)“代表團(tuán)”來(lái)代表總體。而不是隨意挑選的個(gè)別單位代表總體。特點(diǎn)特點(diǎn)2 2:調(diào)查樣本一般按隨機(jī)的原則抽取,在總體中每個(gè)單位被抽取的機(jī)會(huì)相等。因此被抽中的單位在總體中是均勻分布的,不致出現(xiàn)傾向性誤差,代表性強(qiáng)。特點(diǎn)特點(diǎn)3 3:所抽取的調(diào)查樣本數(shù)量是根據(jù)誤差的要求并經(jīng)過(guò)科學(xué)的計(jì)算確定,在調(diào)查樣本的數(shù)量上有可靠保證。特點(diǎn)特點(diǎn)4 4:抽樣誤差在調(diào)查前就可以根據(jù)樣本量和總體中各單位之間的差異程度進(jìn)行計(jì)算,并控制在允許范圍內(nèi),調(diào)查結(jié)果的準(zhǔn)確程度較高。202
4、1/6/47一、定義總體一、定義總體二、確定抽樣框架二、確定抽樣框架三、選擇抽樣技術(shù)三、選擇抽樣技術(shù)四、確定樣本容量四、確定樣本容量五、執(zhí)行抽樣過(guò)程五、執(zhí)行抽樣過(guò)程抽樣設(shè)計(jì)過(guò)程2021/6/48抽樣調(diào)查的主要問(wèn)題抽樣調(diào)查的主要問(wèn)題2021/6/49抽樣誤差 抽樣調(diào)查目的是用樣本調(diào)查數(shù)據(jù)推斷總體。但任何樣本數(shù)據(jù)推斷總體,都不可能得到確切的總體真值。即存在抽樣誤差。抽樣調(diào)查理論基礎(chǔ)在于用樣本數(shù)據(jù)估計(jì)的總體值與總體真值之間的誤差,不會(huì)影響數(shù)據(jù)的使用和對(duì)問(wèn)題的決策。2021/6/410如何正確認(rèn)識(shí)抽樣誤差? 調(diào)查數(shù)據(jù)存在著誤差是絕對(duì)的,而誤差的大小是相對(duì)的,其相對(duì)性取決于研究的問(wèn)題和需要的決策。在抽樣
5、方案設(shè)計(jì)時(shí),需要對(duì)調(diào)查主要指標(biāo)有一個(gè)誤差的要求,即樣本的抽樣誤差控制在什么范圍,使其調(diào)查數(shù)據(jù)的使用對(duì)分析和決策問(wèn)題沒(méi)有影響或影響很小。這一誤差標(biāo)準(zhǔn)沒(méi)有統(tǒng)一的規(guī)定,取決于數(shù)據(jù)使用者分析問(wèn)題與決策的要求。指標(biāo)相對(duì)誤差很小,數(shù)據(jù)精度太高,樣本量需求量大;指標(biāo)相對(duì)誤差很大,精度太低,對(duì)使用者來(lái)講數(shù)據(jù)不能用。2021/6/411對(duì)抽樣誤差認(rèn)識(shí)與使用的誤區(qū)對(duì)抽樣誤差認(rèn)識(shí)與使用的誤區(qū) 一些研究者甚至部分官員不愿意或不習(xí)慣接受數(shù)據(jù)的誤差范圍,一談到誤差,惟恐別人說(shuō)數(shù)據(jù)不準(zhǔn),將數(shù)據(jù)誤差絕對(duì)。由于對(duì)數(shù)據(jù)誤差的認(rèn)識(shí)存在著誤區(qū),在如何使用數(shù)據(jù)上也存在著誤區(qū)。抽樣調(diào)查的數(shù)據(jù)拿來(lái)就用,不談抽樣誤差和調(diào)查誤差,認(rèn)為調(diào)查數(shù)據(jù)
6、就是總體的真值。在進(jìn)行工作政績(jī)考核或進(jìn)行地區(qū)間的數(shù)據(jù)對(duì)比時(shí),調(diào)查指標(biāo)數(shù)據(jù)的高低變成了地區(qū)之間排隊(duì)、政績(jī)?cè)u(píng)比的依據(jù),忽視了對(duì)數(shù)據(jù)誤差的評(píng)估?,F(xiàn)有的調(diào)查數(shù)據(jù)不僅沒(méi)有正確地使用,反而還帶來(lái)地區(qū)之間數(shù)據(jù)高低的相互攀比,同時(shí)也影響了以后抽樣調(diào)查的數(shù)據(jù)質(zhì)量。2021/6/412如何確定恰當(dāng)?shù)某闃诱`差? 有專(zhuān)家認(rèn)為,抽樣調(diào)查估計(jì)值的相對(duì)誤差控制在以?xún)?nèi),數(shù)據(jù)質(zhì)量好,控制以?xún)?nèi),數(shù)據(jù)質(zhì)量較好,控制 以?xún)?nèi),數(shù)據(jù)可用。一些國(guó)家在進(jìn)行國(guó)家級(jí)抽樣調(diào)查時(shí),給出主要調(diào)查指標(biāo)相對(duì)誤差應(yīng)控制的范圍,規(guī)定了估計(jì)值的相對(duì)誤差超過(guò)不能公布。2021/6/413案例案例1 某研究論文中按“病情和就診的先后順序分組”。 因病人就診的先后順
7、序往往暗示其病情不同,尤其是當(dāng)病人的病情輕重難以判斷時(shí)若將先來(lái)就診者分在一組,后來(lái)就診者分在另一組,就不可避免的引入順序誤差( 即一組病人的病情較另一組病人的病情重) ,從而得出錯(cuò)誤結(jié)論。2021/6/414案例2牛宏俐: 設(shè)計(jì)600戶(hù),實(shí)際只有435戶(hù)(原因是拒訪(fǎng))胡瑞: 按地區(qū)東中西(共6個(gè)縣)、按縣鄉(xiāng)衛(wèi)生機(jī)構(gòu)(醫(yī)院1-2所,衛(wèi)生院10家),共抽取262人,按30%擴(kuò)大樣本至360人。2021/6/415案例3 研究者用15個(gè)對(duì)象做試驗(yàn), 先按藥物作用時(shí)間長(zhǎng)短隨機(jī)均分成5組,每組3個(gè)對(duì)象; 接著又按藥物的3種劑量將每組中的3個(gè)對(duì)象再均分成3個(gè)小組,每小組僅有1個(gè)對(duì)象。這個(gè)試驗(yàn)研究中的樣本含
8、量應(yīng)當(dāng)是15?還是1呢? 2021/6/416 常用的抽樣方法常用的抽樣方法抽樣方法抽樣方法概率抽樣非概率抽樣單純系統(tǒng)分層整群方便滾雪球配額典型另外:不等概率抽樣方法(probability proportional to size , PPS)2021/6/417便利抽樣 以研究者或訪(fǎng)問(wèn)者方便來(lái)選擇被訪(fǎng)者,通常被訪(fǎng)者由于碰以研究者或訪(fǎng)問(wèn)者方便來(lái)選擇被訪(fǎng)者,通常被訪(fǎng)者由于碰巧在恰當(dāng)?shù)臅r(shí)間正處在恰當(dāng)?shù)牡攸c(diǎn)而被選中巧在恰當(dāng)?shù)臅r(shí)間正處在恰當(dāng)?shù)牡攸c(diǎn)而被選中 使用學(xué)生以及社會(huì)組織成員;使用學(xué)生以及社會(huì)組織成員; 醫(yī)院攔截患者;醫(yī)院攔截患者; “街上的行人街上的行人”訪(fǎng)談。訪(fǎng)談。優(yōu)點(diǎn):便利抽樣在所有抽樣技
9、術(shù)中成本最低、耗時(shí)最少,抽樣優(yōu)點(diǎn):便利抽樣在所有抽樣技術(shù)中成本最低、耗時(shí)最少,抽樣單位易于接近;單位易于接近;缺點(diǎn):不能代表總體。缺點(diǎn):不能代表總體。2021/6/418配額抽樣 配額抽樣可以被看成兩階段有約束的判斷抽樣配額抽樣可以被看成兩階段有約束的判斷抽樣 第一階段,由確定總體中的個(gè)體的控制類(lèi)別或者配額組成,第一階段,由確定總體中的個(gè)體的控制類(lèi)別或者配額組成,配額確保了樣本的組成與總體的組成在特定特征方面相同;配額確保了樣本的組成與總體的組成在特定特征方面相同; 第二階段,樣本個(gè)體在便利或者判斷的基礎(chǔ)上被選擇出來(lái)第二階段,樣本個(gè)體在便利或者判斷的基礎(chǔ)上被選擇出來(lái)缺點(diǎn)是缺點(diǎn)是: : 缺乏對(duì)總
10、體的代表性,無(wú)法計(jì)算抽樣誤差;缺乏對(duì)總體的代表性,無(wú)法計(jì)算抽樣誤差;優(yōu)點(diǎn)是優(yōu)點(diǎn)是: : 低成本,為每個(gè)配額選擇個(gè)體對(duì)訪(fǎng)談人員而言較為容易。低成本,為每個(gè)配額選擇個(gè)體對(duì)訪(fǎng)談人員而言較為容易。2021/6/419滾雪球抽樣 通常是先選出一組最初的調(diào)查對(duì)象,通常是隨機(jī)選出的,通常是先選出一組最初的調(diào)查對(duì)象,通常是隨機(jī)選出的,在訪(fǎng)談之后,要求這些被訪(fǎng)者推薦一些屬于目標(biāo)總體的其他在訪(fǎng)談之后,要求這些被訪(fǎng)者推薦一些屬于目標(biāo)總體的其他人,根據(jù)這些推選出后面的被訪(fǎng)者。與隨機(jī)的方式相比,被人,根據(jù)這些推選出后面的被訪(fǎng)者。與隨機(jī)的方式相比,被推舉的人將具備與推薦人更為翔實(shí)的人口及心理特征。推舉的人將具備與推薦人更
11、為翔實(shí)的人口及心理特征。優(yōu)點(diǎn)是:主要目的是估計(jì)總體中非常稀少的某些特征。優(yōu)點(diǎn)是:主要目的是估計(jì)總體中非常稀少的某些特征。缺點(diǎn)是:這種方式非常耗時(shí)。缺點(diǎn)是:這種方式非常耗時(shí)。2021/6/420概率抽樣與非概率抽樣間作抉擇決擇考慮方面決擇考慮方面有利于使用的條件有利于使用的條件非概率抽樣非概率抽樣概率抽樣概率抽樣研究的性質(zhì)研究的性質(zhì)探索性探索性描述性描述性抽樣誤差與非抽樣誤差的相對(duì)大小抽樣誤差與非抽樣誤差的相對(duì)大小非抽樣誤差較大非抽樣誤差較大抽樣誤差較大抽樣誤差較大總體的變異程度總體的變異程度同質(zhì)(低)同質(zhì)(低)異質(zhì)(高)異質(zhì)(高)統(tǒng)計(jì)上的考慮統(tǒng)計(jì)上的考慮不利不利有利有利操作上的考慮操作上的考慮
12、有利有利不利不利2021/6/421第四次衛(wèi)生服務(wù)調(diào)查(家庭健康調(diào)查)第四次衛(wèi)生服務(wù)調(diào)查(家庭健康調(diào)查)方法:多階段分層整群抽樣方法:多階段分層整群抽樣多階段:多階段:?。ㄖ陛犑校?縣(市、區(qū)) 鄉(xiāng)(街道) 行政村(居委會(huì)) 戶(hù)分層:分層:地理位置(東、中、西),城鄉(xiāng)結(jié)構(gòu)(城市按大、中、小;農(nóng)村按經(jīng)濟(jì)因素分1、2、3、4類(lèi)地區(qū)),家庭收入(5個(gè)等級(jí))整群:整群:抽查戶(hù)中每個(gè)成員都調(diào)查2021/6/422第四次衛(wèi)生服務(wù)調(diào)查(家庭健康調(diào)查)第四次衛(wèi)生服務(wù)調(diào)查(家庭健康調(diào)查)戶(hù)的抽樣:戶(hù)的抽樣:1.1.編號(hào):編號(hào):將樣本村(居委會(huì))內(nèi)全部住戶(hù)按名單順序編號(hào);2.2.按系統(tǒng)抽樣方法確定樣本戶(hù)抽樣間隔:
13、按系統(tǒng)抽樣方法確定樣本戶(hù)抽樣間隔:國(guó)家樣本點(diǎn)抽樣間隔=本村(居委會(huì))內(nèi)戶(hù)數(shù)/60 (四舍五入。取整)西部擴(kuò)點(diǎn)抽樣間隔=本村(居委會(huì))內(nèi)戶(hù)數(shù)/33 (四舍五入。取整);3.3.確定抽樣戶(hù):確定抽樣戶(hù):隨機(jī)抽一張百元人民幣,取其后4位數(shù),該數(shù)除以抽樣間隔后的余數(shù)K(0)定位第一個(gè)抽樣戶(hù),然后k值加抽樣間隔為第2個(gè)抽樣戶(hù),以此類(lèi)推。2021/6/423抽樣結(jié)果抽樣結(jié)果94個(gè)縣市/470個(gè)鄉(xiāng)鎮(zhèn)(街道)/940個(gè)行政村(居委會(huì))/56456戶(hù)/約18萬(wàn)人2021/6/424第四次衛(wèi)生服務(wù)調(diào)查(醫(yī)務(wù)人員調(diào)查)第四次衛(wèi)生服務(wù)調(diào)查(醫(yī)務(wù)人員調(diào)查)2021/6/425(China Health and Reti
14、rement Longitudinal Study , CHARLS )2021/6/426如何確定樣本量?2021/6/427確定樣本容量的方法 樣本容量的確定通常是介于理論上的完善方案樣本容量的確定通常是介于理論上的完善方案與實(shí)際的可行方案之間的一個(gè)折中方案。與實(shí)際的可行方案之間的一個(gè)折中方案。教條式方法教條式方法成本基本法成本基本法統(tǒng)計(jì)分析法統(tǒng)計(jì)分析法2021/6/428教條主義方法 任意方法也許基于經(jīng)驗(yàn),如總體的任意方法也許基于經(jīng)驗(yàn),如總體的5%5%規(guī)則規(guī)則 具有主觀性具有主觀性 優(yōu)點(diǎn):容易確定,簡(jiǎn)單易行優(yōu)點(diǎn):容易確定,簡(jiǎn)單易行 缺點(diǎn):無(wú)效率、不經(jīng)濟(jì)缺點(diǎn):無(wú)效率、不經(jīng)濟(jì)2021/6/4
15、29成本基礎(chǔ)法 將成本作為確定樣本容量的基礎(chǔ)將成本作為確定樣本容量的基礎(chǔ) 對(duì)于成本基礎(chǔ)法的區(qū)別很大;對(duì)于成本基礎(chǔ)法的區(qū)別很大; 通常會(huì)忽視調(diào)查結(jié)果對(duì)管理決策的價(jià)值;通常會(huì)忽視調(diào)查結(jié)果對(duì)管理決策的價(jià)值; 確定樣本容量一個(gè)好的辦法是考慮成本與調(diào)研確定樣本容量一個(gè)好的辦法是考慮成本與調(diào)研對(duì)于經(jīng)歷的價(jià)值之間的關(guān)系;對(duì)于經(jīng)歷的價(jià)值之間的關(guān)系;2021/6/430統(tǒng)計(jì)分析法 一些統(tǒng)計(jì)分析方法對(duì)最小樣本容量有要求一些統(tǒng)計(jì)分析方法對(duì)最小樣本容量有要求 如果要討論分類(lèi)變量的影響,那么每一分類(lèi)變?nèi)绻懻摲诸?lèi)變量的影響,那么每一分類(lèi)變量的樣本數(shù)應(yīng)符合統(tǒng)計(jì)分析數(shù)的需要;量的樣本數(shù)應(yīng)符合統(tǒng)計(jì)分析數(shù)的需要; 要將每一類(lèi)
16、樣本或子集看成一個(gè)總體。要將每一類(lèi)樣本或子集看成一個(gè)總體。2021/6/4311.單純隨機(jī)抽樣單純隨機(jī)抽樣(simple random sampling)nppnppNnSnSnSNnSpx)1 (1)1 ()1 (:)1 (:2無(wú)限總體無(wú)限總體)率的標(biāo)準(zhǔn)誤(有限總體體)均數(shù)的標(biāo)準(zhǔn)誤(有限總(1)方法 先對(duì)調(diào)查總體的全部觀察單位編號(hào),然后隨機(jī)抽取一部分作為樣本(2)標(biāo)準(zhǔn)誤的計(jì)算2021/6/432例14.1例例1 欲調(diào)查某農(nóng)村小學(xué)學(xué)生的蛔蟲(chóng)感染率,該校有學(xué)生2000人,若取樣本例數(shù)100人,試作單純隨機(jī)抽樣設(shè)計(jì)。解:解:先將全校學(xué)生編號(hào):0,1,2,3,1999;再用附表17隨機(jī)數(shù)字表,任意指
17、定某行某列,比如第5行第9列,由此處開(kāi)始,向右依次抄錄隨機(jī)數(shù)字100組,每組4個(gè)數(shù)字,凡后面出現(xiàn)與前面相同的數(shù)字棄去,如得0873,3732,0405,6930,1609,0588,。凡首字8者減8,6者減6,4減4,2減2,依次得873,1732,405,930,1609,588,。0392. 01100)2 . 01 (2 . 020001001, 2 . 0,1002000%201pSpnN,解:,求其標(biāo)準(zhǔn)誤。中查得蛔蟲(chóng)感染率為若例例例22021/6/433(3)單純隨機(jī)抽樣樣本含量估算無(wú)限總體所需樣本量 估計(jì)總體率時(shí),若事件發(fā)生概率在0.20.8之間,則) 1 ()1 (22pun若事
18、件發(fā)生的概率小于0.2或大于0.8時(shí),由于事件發(fā)生數(shù)服從Poisson分布,用Poisson分布的逼近公式計(jì)算:)2(sinsin42112pun估計(jì)總體均數(shù)時(shí),)3(0222uxun有限總體所需樣本量 ,)1 (Nnnn其中,N 為有限總體量,n 是上式(1)、(2)、(3)估計(jì)的結(jié)果。2021/6/434例例3 某醫(yī)院欲了解小學(xué)六年級(jí)學(xué)生的近視眼患病率,1998年試查患病率為8%,預(yù)計(jì)總體患病率約為10%,若取=0.05,問(wèn)需抽查多少小學(xué)生?784)08.0sin1.0(sin496.1286757.008.0sin,321751.01.0sin,96.1,05.0, 1.0,08.021
19、121105.0nup所以則解:例例4 某醫(yī)院擬用抽樣調(diào)查了解本地區(qū)健康成人血紅蛋白水平,要求誤差不超過(guò)0.2(g/L),據(jù)文獻(xiàn)報(bào)告,健康成人血紅蛋白的標(biāo)準(zhǔn)差為1.5(g/L),問(wèn)需調(diào)查多少人( =0.05 )?2172 . 0)5 . 1)(96. 1 (5 . 1, 2 . 0,96. 122205. 0nu則解:2021/6/435單純隨機(jī)抽樣的單純隨機(jī)抽樣的優(yōu)優(yōu)缺缺點(diǎn)點(diǎn)1.均數(shù)和標(biāo)準(zhǔn)誤的計(jì)算簡(jiǎn)便2.當(dāng)總體例數(shù)較多時(shí),對(duì)觀察單位編號(hào)不易操作2021/6/4362.系統(tǒng)抽樣系統(tǒng)抽樣(systematic sampling) (1)方法 按照一定的順序,機(jī)械地每隔若干個(gè)單位抽取一個(gè)觀察單位的
20、方法稱(chēng)系統(tǒng)抽樣。做法是:先將總體觀察單位按某一順序號(hào)分成n個(gè)部分,再?gòu)牡谝徊糠蛛S機(jī)抽取第k號(hào)觀察單位,依次用相等間隔,從每一部分各抽取一個(gè)觀察單位組成樣本。(2)標(biāo)準(zhǔn)誤的計(jì)算 系統(tǒng)抽樣誤差隨總體性質(zhì)、抽樣的間隔大小而異,無(wú)專(zhuān)用的標(biāo)準(zhǔn)誤計(jì)算公式。一般情況下,它比單純隨機(jī)抽樣誤差小。有人認(rèn)為可按單純隨機(jī)抽樣方法估計(jì)系統(tǒng)抽樣誤差。例例5 欲調(diào)查某社區(qū)貧血患病情況,該社區(qū)有居民1000人,按系統(tǒng)抽樣方法,抽取例數(shù)為100人的樣本。解: N=1000,n=100, 間隔為1000/100=10,先在110之間隨機(jī)確定一個(gè)數(shù)字,比如7,然后每間隔10個(gè)觀察單位抽取一個(gè),即7,17,27,997組成樣本。又
21、稱(chēng)機(jī)械抽樣或等距離抽樣2021/6/437系統(tǒng)抽樣的系統(tǒng)抽樣的優(yōu)優(yōu)缺缺點(diǎn)點(diǎn)1.系統(tǒng)抽樣簡(jiǎn)便易行2.容易得到一個(gè)按比例分配的樣本3.抽樣誤差小于單純隨機(jī)抽樣4.容易產(chǎn)生系統(tǒng)誤差5.抽樣誤差的估計(jì)只是近似的(用單純隨機(jī)抽樣標(biāo)準(zhǔn)誤估計(jì)往往偏大)2021/6/4383.整群抽樣整群抽樣(cluster sampling)(1)方法 先將總體按某種與研究指標(biāo)無(wú)關(guān)的特征分為K個(gè)組,再?gòu)腒個(gè)組中隨機(jī)抽取k個(gè)組,這k個(gè)組中的全部觀察值組成樣本(2)標(biāo)準(zhǔn)誤的估計(jì)數(shù)。為樣本各群的平均陽(yáng)性和,為樣本中各群陽(yáng)性數(shù)之率的標(biāo)準(zhǔn)誤:樣本率:的均數(shù)為各群內(nèi)觀察值之和為樣本第群的均數(shù)為樣本第值之和為樣本中各群全部觀察為總體觀察
22、單位數(shù)式中均數(shù)的標(biāo)準(zhǔn)誤:樣本均數(shù):不等:)群內(nèi)觀察單位()標(biāo)準(zhǔn)誤的計(jì)算:整群抽樣的均數(shù)(或率aaaakkKkNKSaNkKpkTTTTiTixxNTTkkKkNKSxmNkKxNkKxmaikiipiiiiiikiixii1212)() 1(1)1 (/,)() 1(112021/6/439(b)群內(nèi)觀察單位m相等群的率為樣本第率的標(biāo)準(zhǔn)誤:樣本率:均數(shù)的標(biāo)準(zhǔn)誤:樣本均數(shù):ipkkppKkSpkmkapkkxxKkSkxmkxxikiipiiixii)1()()1(1)1()(1122例例6 某校有80個(gè)班級(jí),各班學(xué)生50人,現(xiàn)用錫克試驗(yàn)調(diào)查該校學(xué)生白喉易感率,隨機(jī)抽查了8個(gè)班的全部學(xué)生,其中陽(yáng)
23、性人數(shù)分別為12,17,12,15,21,20,21,18。試估計(jì)該校學(xué)生錫克試驗(yàn)陽(yáng)性率。解: (群內(nèi)觀察單位相等) 各班的陽(yáng)性率分別為:0.24,0.34,0.24,0.30,0.42,0.40,0.42,0.36 總率p=(12+17+12+15+21+20+21+18)/(850)=0.34389.0291.00248.096.134.0%950248.0)34.036.0(.)34.034.0()34.024.0() 18(81)8081 (222可信區(qū)間為:總體率的pS2021/6/440( 3 ) 整群抽樣樣本量估計(jì)為所有群體數(shù)有限總體時(shí),無(wú)限總體時(shí),估計(jì)總體率所需樣本量KKkkk
24、mkppmukayii)1 () 1()()(22222為所有群體數(shù)有限總體時(shí),無(wú)限總體時(shí),量估計(jì)總體均數(shù)所需樣本KKkkkmkxxmukbyii)1 () 1()()(22222為允許誤差。均發(fā)生率;群的平均調(diào)查人數(shù)和平分別為和事件發(fā)生頻率;群調(diào)查人數(shù)和某分別為預(yù)查的群體中第和為預(yù)查的群體數(shù),上式中,yiiykpmipmk。群體觀察指標(biāo)的平均值個(gè)為值;個(gè)群體觀察指標(biāo)的平均為第的意義同前;和、上式中,yiiykxixmmk2021/6/441例例7 某市為了了解該市40歲以上人群高血壓患病率,擬對(duì)全市55個(gè)街區(qū)采用整群抽樣調(diào)查,隨機(jī)預(yù)查了2個(gè)街區(qū),第一街區(qū)調(diào)查了4180人,高血壓病人1060人
25、,患病率為25.36%;第二個(gè)街區(qū)調(diào)查了4180人,高血壓病人720人,患病率為14.49%,問(wèn)需調(diào)查幾個(gè)街區(qū)(=0.05,=0.1)?(街區(qū))解:319.21.04575121945.01449.049701945.02536.0418096.155,2,1945.04970418072010604575249704180, 1.0,96.1222222205.0kKkpmuy(街區(qū)),需作校正:因?yàn)樵撌袨橛邢蘅傮w,384. 25531355kK2021/6/442整群抽樣的整群抽樣的優(yōu)優(yōu)缺缺點(diǎn)點(diǎn)1.便于組織,適合大規(guī)模調(diào)查2.節(jié)省經(jīng)費(fèi)3.容易控制調(diào)查質(zhì)量4.抽樣誤差較單純隨機(jī)抽樣大2021
26、/6/4434.分層抽樣分層抽樣(stratified sampling)(1)方法 先將總體按對(duì)觀察指標(biāo)影響較大的某種特征分成若干層,再?gòu)拿繉又须S機(jī)抽取一定量的觀察單位組成樣本。;,;,iiiiiiiiiiiipWpippiissixWxixxnninniNN層的樣本率為第為樣本率層的率為總體第層的樣本標(biāo)準(zhǔn)差;為第為樣本標(biāo)準(zhǔn)差層的標(biāo)準(zhǔn)差為總體第層樣本均數(shù)第為樣本均數(shù),;層的觀察單位數(shù)為樣本第為樣本觀察單位數(shù)層的觀察單位數(shù);為總體第為總體觀察單位數(shù)列符號(hào):為敘述方便,先定義下1111/2222iNniSSSWNnSSWNnSNNWipxpiiipxiiixiiiii標(biāo)準(zhǔn)誤。對(duì)無(wú)限總體,層所用隨
27、機(jī)抽樣方法的為第和上式中,樣本率的標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)誤:令(2)標(biāo)準(zhǔn)誤的計(jì)算2021/6/444(3)分層抽樣樣本量估計(jì)先估計(jì)樣本總量n:例例8 在12萬(wàn)人口的居民區(qū)中調(diào)查某病患病率。居民區(qū)分4層,樣本總含量確定為1000人,請(qǐng)按比例分配法確定各層調(diào)查人數(shù)。NNnnii:Ni的多少分配按各層觀察單位數(shù)再分配各層觀察單位ni,方法有兩種:NSWuSWnNWuWniiiiiiiiiii/11222222總量:估計(jì)總體均數(shù)所需樣本量:估計(jì)總體率所需樣本總按比例分配:2021/6/445最優(yōu)分配: 按各層觀察單位Ni的多少以及標(biāo)準(zhǔn)差i的大小分配或預(yù)調(diào)查來(lái)估計(jì)一般可根據(jù)經(jīng)驗(yàn)、文獻(xiàn)和式中率的抽樣:均數(shù)
28、的抽樣:iiiiiiiiiiiiiiNNnnNNnn)1 ()1 (2021/6/446例例9 1990年某市曾測(cè)定24歲男童體重(kg)的均數(shù)及標(biāo)準(zhǔn)差(見(jiàn)表)。今年欲分層隨機(jī)測(cè)量24歲男童體重作進(jìn)一步分析,問(wèn)該市共需抽查多少男孩(=0.05,=0.2kg)?各年齡組需分別抽多少男孩?年齡i人數(shù)NiWi均值SiNiSiiWiSi/ iWiSi2ni237730.279111.511.485584.040.25420.67120.611364353240.393813.931.8910062.360.45801.20951.4067115444220.327115.601.436323.460.
29、28780.76020.668972合計(jì)135191.000021969.862.64092.6869251250135196869. 20104. 06409. 20104. 0/, 2 . 0,96. 1205. 005. 0nuun解:先求總樣本量計(jì)算中取整造成誤差!1990年某市24歲男童體重(kg)分層抽樣的樣本量估算2021/6/447分層抽樣的分層抽樣的優(yōu)優(yōu)缺缺點(diǎn)點(diǎn)1.抽樣誤差小于前三種抽樣方法2.便于對(duì)不同層采用不同抽樣方法3.便于對(duì)各層獨(dú)立進(jìn)行分析4.所需經(jīng)費(fèi)較大各種抽樣方法的抽樣誤差一般是:整群抽樣單純隨機(jī)抽樣系統(tǒng)抽樣分層抽樣2021/6/448謝謝!謝謝!部分資料從網(wǎng)絡(luò)收集整理而來(lái),供大家參考,感謝您的關(guān)注!
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高考政治一輪復(fù)習(xí):統(tǒng)編版選擇性必修1-3【共3冊(cè)重點(diǎn)知識(shí)點(diǎn)匯總】
- 2025年高考政治一輪復(fù)習(xí):七冊(cè)教材重點(diǎn)考點(diǎn)匯總
- 2025年高考生物一輪復(fù)習(xí):高中生物必修+選必修5冊(cè)教材重點(diǎn)知識(shí)點(diǎn)匯總
- 2025政府工作報(bào)告要點(diǎn)速覽發(fā)展總體要求和政策取向
- 《哪吒2》與DEEPSEEK年輕力量的崛起助力中國(guó)突破重圍
- 建設(shè)金融強(qiáng)國(guó)做好金融五篇大文章的指導(dǎo)意見(jiàn)
- 落實(shí)高質(zhì)量發(fā)展要求如期完成既定目標(biāo)任務(wù)更新理念科學(xué)統(tǒng)籌切實(shí)增強(qiáng)規(guī)劃執(zhí)行的系統(tǒng)性整體性協(xié)同性
- 如何成為一名暖護(hù)暖護(hù)的概念與職責(zé)
- 藥品儲(chǔ)存與養(yǎng)護(hù)醫(yī)療護(hù)理藥品儲(chǔ)存藥品養(yǎng)護(hù)藥品常識(shí)
- 手術(shù)室職業(yè)暴露與防護(hù)診療護(hù)理等過(guò)程中被患者血液體液等污染自身皮膚或黏膜導(dǎo)致的感染
- XX企業(yè)中層管理者領(lǐng)導(dǎo)力提升培訓(xùn)課程
- 醫(yī)院新員工入職培訓(xùn)醫(yī)院新員工必備主要職業(yè)意識(shí)醫(yī)院新員工必備工作觀
- 人工智能技術(shù)介紹人工智能DeepSeek人工智能的未來(lái)展望與發(fā)展
- 養(yǎng)娃要有松弛感家庭教育讓孩子在具有松弛感的家庭里慢慢成長(zhǎng)
- 醫(yī)院新員工入職培訓(xùn)醫(yī)院新員工必備主要職業(yè)意識(shí)