統(tǒng)計學(xué)教程(含spss)四參數(shù)估計.ppt
《統(tǒng)計學(xué)教程(含spss)四參數(shù)估計.ppt》由會員分享,可在線閱讀,更多相關(guān)《統(tǒng)計學(xué)教程(含spss)四參數(shù)估計.ppt(41頁珍藏版)》請在裝配圖網(wǎng)上搜索。
參數(shù) 估計,用SPSS作參數(shù)估計,抽樣與抽樣分布,區(qū)間估計,點 估 計,參數(shù) 估計,,抽樣方法,,樣本容量與抽樣分布,抽樣分布,抽樣與抽樣分布,,樣本(sample),總體(population),抽樣(sampling),總體容量(population size) N=45,樣本容量(sample size) n=10,為推斷總體的某些特征,而從總體中按一定方法抽取若干個體,這一過程稱為抽樣,所抽取的個體稱為樣本。,,,抽樣方法,自有限總體的簡單隨機抽樣,簡單隨機樣本,有限總體,總體中每一個體以相等的概率被抽出,稱簡單隨機抽樣。有放回抽樣與無放回抽樣之分。自有限總體的簡單隨機抽樣,特指有放回抽樣。,,,,抽樣方法,自無限總體的簡單隨機抽樣,無限總體,自無限總體抽取樣本,采用無放回抽樣。如果滿足以下兩個條件,則稱簡單隨機抽樣: ——每個個體來自同一個總體 ——樣本中每個個體的抽取是獨立的,,簡單隨機樣本,,抽樣方法,統(tǒng)計量,計算,總 體,確定性,樣 本,,隨機抽樣,隨機性,隨機性,樣本統(tǒng)計量做為隨機變量,具有特定的概率分布。 把握住他們的分布規(guī)律就找到了推斷總體參數(shù)的依據(jù)。,,總體參數(shù),理論上可計算,,,確定性,,,抽樣分布,1000名公司員工總體,500個容量為30的簡單隨機樣本的平均年薪、大學(xué)畢業(yè)生比率、年薪標準差的分布直方圖。,的分布,,抽樣分布,,,—隨機變量 的數(shù)學(xué)期望,—總體均值,—隨機變量 的標準差,—總體的標準差,—樣本容量,—總體容量,設(shè)總體均值為μ總體方差為σ2 ,則有:,設(shè)總體均值為μ總體方差為σ2 ,則有:,抽樣分布,,總體為正態(tài)概率分布時,對任何樣本容 量的 的分布均為正態(tài)分布。,,中心極限定理(central limit theorem),總體為任意分布,當樣本容量n→∞時, 的抽樣分布為正態(tài)分布。 實踐中n≥30, 的分布 即可用正態(tài)近似。,抽樣分布,中心極限定理作用下 的概率密度,,,,標準正態(tài)分布,,,,,抽樣分布,總體X的分布,樣 本 均值的 分 布,n=2,n=5,n=30,中心極限定理對三個總體作用的圖示,,抽樣分布,,,—總體比率,—隨機變量 p 的標準差,—總體的方差,—樣本容量,—總體容量,—隨機變量p的數(shù)學(xué)期望,對于 ,滿足下面兩個條件時認為樣本容量足夠大: —— —— 當樣本容量足夠大時, 的抽樣分布可用正態(tài)近似,即:,,,,,抽樣分布,,,,,,,,,,,,,,,,0.05,0.10,0.15,0.20,0.25,0.30,2600,3400,4200,5000,的分布,,,s2 服從卡方分布,但其分布函數(shù)不便于用數(shù)學(xué)式直接表達??梢缘贸雠c其相聯(lián)系的一個服從自由度為 n-1的卡方分布的統(tǒng)計量。,,抽樣分布,,,,與樣本容量有關(guān),與樣本容量無關(guān),,51800,,樣本容量與抽樣分布,點估計的概念,,,估計量的優(yōu)良性,點 估 計,,某連續(xù)生產(chǎn)線上生產(chǎn)的燈泡的使用壽命X服從正態(tài)分布N(μ,δ2),其中μ和δ2是未知總體參數(shù)。從中隨機抽取5只燈泡,測得使用壽命分別為1529小時、1513小時、1600小時、1527小時、1111小時。試估計μ和δ2。,從總體中抽取一個樣本,構(gòu)造適當?shù)慕y(tǒng)計量 ,來估計對應(yīng)的總體參數(shù) 。,點估計的概念,,估計量的優(yōu)良性,無偏性,有效性,一致性,,則稱統(tǒng)計量 是總體參數(shù) 的無偏估計量,參數(shù)θ不等于抽樣分布的均值,,,,(有偏估計量),參數(shù)θ等于抽樣分布的均值,(無偏估計量),,偏差,,,如果,,無偏性,,,,,,,,有效性,自正態(tài)總體抽樣時,總體均值與總體中位數(shù)相同,而中位數(shù)的標準誤差大約比均值的標準誤差大25%。因此,樣本均值更有效。,,,,,的抽樣分布,,,的抽樣分布,,有效性,均為一致性估計量,,,,,,,,,兩個無偏點估計量的抽樣分布,兩個不同容量樣本的點估計量的抽樣分布,,,,一致性,總體均值的區(qū)間估計,,總體比率的區(qū)間估計,樣本容量的確定,總體方差的區(qū)間估計,區(qū)間估計,,總體方差已知時總體均值的區(qū)間估計,,總體方差未知時總體均值的區(qū)間估計,總體均值的區(qū)間估計,,總體方差已知時總體均值的區(qū)間估計,,,,,,,,一批零件的長度服從正態(tài)分布,從中隨機抽取9件,測得其平均長度為21.4毫米。已知該批零件長度的標準差為0.15毫米,試以95%的把握程度,估計該批零件平均長度的存在區(qū)間。,總體方差已知時總體均值的區(qū)間估計,某大學(xué)從該校學(xué)生中隨機抽取100人,調(diào)查到他們平均每天參加體育鍛煉為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36)。,,總體方差已知時總體均值的區(qū)間估計,,,,,總體方差未知時總體均值的區(qū)間估計,某大學(xué)從該校學(xué)生中隨機抽取100人,調(diào)查到他們平均每天參加體育鍛煉為26分鐘,樣本方差為34。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間。,總體方差未知時總體均值的區(qū)間估計,是否為大樣本 n≥30,σ值是否已知,σ值是否已知,總體是否近 似正態(tài)分布,用樣本標準差s 估計δ,用樣本標準差s 估計δ,將樣本容量 增加到n≥30 以便進行區(qū)間 估計,,,,,,,,,,,,,,,,,,是,是,是,是,否,否,否,否,總體均值區(qū)間估計程序,,,,總體均值的區(qū)間估計,,,,,顯著性水平α下,P在1- α置信水平下的置信區(qū)間:,,總體比計的區(qū)間估計,某企業(yè)在一項關(guān)于職工流動原因的研究中,從企業(yè)前職工的總體中隨機抽選了200人組成一個樣本。在對其進行訪問時,有140說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開企業(yè)的人員的真正比率構(gòu)造95%的置信區(qū)間。,,總體比計的區(qū)間估計,,,,允許誤差(permissible),,,用歷史數(shù)據(jù)代替。若有若干個歷史數(shù)據(jù),應(yīng)以較大者代替。,樣本容量的確定,,,一家廣告公司想估計某類商店去年所花的平均廣告費有多少。經(jīng)驗表明,總體方差為1800000。如置信度取95%,并要使估計值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?,一家市場調(diào)研公司想估計某地區(qū)有彩色電視機的家庭所占的比率。該公司希望對 P 的估計誤差不超過0.05,要求可靠程度為 95%,應(yīng)取多大容量的樣本?,總體方差最大值為0.5×0.5=0.25,,,,,,,,,,,,總體方差的區(qū)間估計,,顯著性水平α下,σ2 的置信區(qū)間,,,,0,,,,,,,,=8.90655,=32.8523,0.025,0.025,自由度為19的χ2分布,從一批灌裝產(chǎn)品中,隨機抽取20灌,得樣本方差為0.0025。試以95%的置信度,估計總體方差的存在區(qū)間。,,總體方差的區(qū)間估計,0,,,,,,,,,=2.7044,=19.0228,0.025,0.025,自由度為9的χ2分布,對某種金屬的10個樣品所組成的一個隨機樣本作抗拉強度試驗。從試驗數(shù)據(jù)算出的方差為4,試求σ2 的95%值信區(qū)間。,,,總體方差的區(qū)間估計,結(jié) 束,關(guān)鍵術(shù)語,無放回抽樣(sampling without replacement)一個元素一旦選入樣本,就從總體中剔除,不能再次被選入 放回抽抽樣(sampling with replacement)一個元素一旦被選入樣本,仍被放回總體中。先前被選入的元素可能再次被抽到,并且在本樣中可能出現(xiàn)多次 抽樣分布(sampling distribution)樣本統(tǒng)計量所有可能值構(gòu)成的概率分布 點估計(point estimate)用做總體參數(shù)估計量的值。它是點估計量的具體的取值 點估計量(point estimator)提供總體參數(shù)點估計的樣本統(tǒng)計量 標準誤差(standard error)點估計量的標準差 中心極限定理(central limit theorem)當樣本容量大的時候,用正態(tài)分布近似樣本均值的分布和樣本比率的抽樣分布 區(qū)間估計(interval estimate)總體參數(shù)估計值的一個范圍,確信該范圍包括參數(shù)的值在內(nèi) 抽樣誤差(sample error)無偏估計值(如樣本均值)與所估計的總體值(如總體均值)之差的絕對值 置信水平(confidence level)與區(qū)間估計相聯(lián)系的置信度 邊際誤差(margin error)置信區(qū)間中從點估計值中所加上或減去的值 t分布(t distribution) 概率分布的一族,當總體是正態(tài)或者近似正態(tài)概率分布,并且總體標準差未知情況下,對總體均值進行區(qū)間估計時常用到該分布 自由度(degrees of freedom)t 分布的參數(shù),計算總體均值的區(qū)間估計中所用的t 分布的自由度為n-1,其中n是簡單單隨機樣本的樣本容量,結(jié) 束,案例5-1,某學(xué)者估計某城市一個家庭所收到的郵件中大約有70%是廣告。 一個由20個家庭組成的樣本給出了有關(guān)它們在一個星期中所收到的郵件的總份份數(shù)及所收到的廣告的份數(shù)的數(shù)據(jù).見數(shù)據(jù)集[案例5-1]。 要求: 1、每周所收到的廣告數(shù)據(jù)數(shù)量的均值的點估計為多少?并求總體均值的95%置信區(qū)間。 2、每周所收到郵件數(shù)量的點估計為多少?并求總體均值的95%置信區(qū)間。 3、由1和2中所得到的點估計與初始所給出的關(guān)于70%的郵件是廣告的說法是否一致。,案例5-2,某消費者研究組織,經(jīng)常要對消費者所使用的大量產(chǎn)品和服務(wù)進行評估。消費者抱怨,某一汽車制造商所生產(chǎn)的小汽車,在初期的使用過程中,傳動系統(tǒng)不佳。為了更好地了解該種小汽車傳動系統(tǒng)的問題,該消費者研究組織采用該地區(qū)一個汽車修理企業(yè)所提供的實際傳動系統(tǒng)的維修記錄為樣本。如下數(shù)據(jù)是50輛汽車傳動系統(tǒng)出現(xiàn)故障時所行駛的實際里程數(shù)據(jù)。見數(shù)據(jù)集[案例5-2]。 要求: 1、用適當?shù)拿枋鼋y(tǒng)計量匯總傳動系統(tǒng)數(shù)據(jù)。 2、求曾經(jīng)出現(xiàn)過傳動系統(tǒng)問題的汽車總體中在出現(xiàn)傳動系統(tǒng)問題時所行駛里程的均值的95%置信區(qū)間。并對該區(qū)間估計做出管理上的解釋。 3、按照一些汽車用戶曾經(jīng)歷過使用初期傳動系統(tǒng)失靈的說法,你的統(tǒng)計結(jié)果說明了什么? 4、如果研究公司想在5000公里的邊際誤差下,估計出現(xiàn)傳動系統(tǒng)問題時所行駛里程的均值,應(yīng)選取多大的樣本容量?(取置信度為95%。) 5、為了更全面地對該傳動系統(tǒng)問題做出評價,你還需要收集一些某他什么樣的信息?,案例,結(jié) 束,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 統(tǒng)計學(xué) 教程 spss 參數(shù)估計
鏈接地址:http://kudomayuko.com/p-1851216.html