貴州省貴陽市高中數(shù)學 2.2用樣本估計總體學案4(無答案)新人教版必修3(通用)
專題用樣本估計整體
1.基礎知識
1. 用樣本的頻率分布估計總體分布
1.樣本、個體等概念
(1) 總體、個體、樣本與樣本容量:所要考察的對象的全體叫做總體;總體中每一個考察對象叫做個體;從總體中所抽取的一部分個體叫做這個總體的一個樣本;樣本中個體的數(shù)目叫做樣本容量,樣本容量沒有單位.
(2)抽樣和普查:采用調(diào)查樣本的方式來收集數(shù)據(jù),這種調(diào)查稱為抽樣調(diào)查;而通過調(diào)查總體的方式來收集數(shù)據(jù)的調(diào)查稱為全面調(diào)查,也叫普查.
2.頻率分布直方圖
a. 頻數(shù):將一批數(shù)據(jù)按要求分為若干個組,各組內(nèi)數(shù)據(jù)的個數(shù),叫改組的頻數(shù)。 頻率:每組數(shù)除以全體數(shù)據(jù)的個數(shù)的商叫改組的頻率。
b. 樣本的頻率分布:根據(jù)隨機所抽樣本大小,分別計算某一事件出現(xiàn)的頻率,這些頻率的分布規(guī)律(取值情況),就叫做樣本的頻率分布。
c. 樣本頻率分布表:將樣本的容量、樣本中出現(xiàn)該事件的頻數(shù)以及計算所得的相應頻率列在一張表中,叫做樣本頻率分布表。
d. 頻率分布直方圖:在直角坐標系中,橫軸表示樣本數(shù)據(jù),縱軸表示頻率與組距的比值,將頻率分布表中各組頻率的大小用相應矩形面積的大小來表示,由此畫成的統(tǒng)計圖叫做頻率分布直直方圖。
e. 頻率分布折線圖:把頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖。
f. 總體密度曲線:如果樣本容量無限增大,分組的組距無限減小,曲線中所表示的頻率分布就越接近于總體在各個小組內(nèi)所取值的個數(shù)與總數(shù)比值的大小。這條光滑的曲線就叫做總體密度曲線。
2. 用樣本的數(shù)字特征估計總體的數(shù)字特征
a. 平均數(shù):平均數(shù)是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以數(shù)據(jù)的個數(shù)。
b. 眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)據(jù)叫這組數(shù)據(jù)的眾數(shù)。
c. 中位數(shù):將一組數(shù)據(jù)按從小到大的順序依次排列,當數(shù)據(jù)有奇數(shù)個時,處在最中間的一個數(shù)或當數(shù)據(jù)有偶數(shù)個時,處在最中間的兩個數(shù)的平均數(shù)是這組數(shù)據(jù)的中位數(shù)。
d. 方差:方差是各個數(shù)據(jù)與平均數(shù)之差的平方的平均數(shù)。
e. 標準差:標準差是方差的算術平方根。
3. 莖葉圖:它是一種將樣本將數(shù)組中數(shù)按位數(shù)進行比較,將數(shù)的大小基本不變或變化不大的位作為一個主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個主干后面的幾個數(shù),每個數(shù)具體是多少。
4. 求一組數(shù)據(jù)的頻率分布的步驟及頻率分布直方圖的畫法
a. 求一組數(shù)據(jù)的頻率分布的步驟:(1)計算極差 (2)決定組距與組數(shù) (3)決定分點 (4)列頻率分布表
b. 頻率分布直方圖畫法:(1)先制作頻率分布表,然后作直角坐標系,以橫軸表示樣本數(shù)據(jù),縱軸表述頻率與組距的比值(2)把橫軸分成若干段,每一段對應一個組的組距,得到頻率分布直方圖。
5. 標準差、方差的計算方法及應用
(1)算出樣本數(shù)據(jù)的平均數(shù) (2)算出每個樣本數(shù)據(jù)與樣本平均數(shù)的差 (3)算出 (4)算出方差的算術平方根,即為樣本標準差s
6.幾個常用公式
(1)有關平均數(shù)的幾個計算公式:
①一般公式:
②簡化公式:(其中是的平均數(shù),a為接
近樣本平均數(shù)的較“整”的常數(shù),直接計算繁鎖時適用).
③加權平均數(shù)計算公式:
其中(相同數(shù)據(jù)較多時適用)
(2)極差、方差、標準差是表示一組數(shù)據(jù)離散程度的指標,方差有一個較復雜的計算公式:
標準差是方差開平方后得到的值,它的數(shù)量單位與原數(shù)據(jù)的數(shù)量單位一致.
2.典型例題
1. 概念記憶。
例1在頻率分布直方圖中,小矩形的高表示( ).
A.頻率/樣本容量 B.組距×頻率 C.頻率 D.頻率/組距
例2 已知樣本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么頻率為0.2的范圍為( )
A 5.5—7.5 B 7.5—9.5 C 9.5—11.5 D 11.5—13.5
例3用樣本頻率分布估計總體頻率分布的過程中,下列說法正確的是( ).
A.總體容量越大,估計越精確 B.總體容量越小,估計越精確
C.樣本容量越大,估計越精確 D.樣本容量越小,估計越精確
2. 頻率分布直方圖繪制與應用
①頻率分布直方圖是用小長方形的 來表示在各個區(qū)間內(nèi)取值的頻率.直角坐標系中的縱軸表示 的比值,即小長方形面積= × ?。筋l率;
②各組頻率的和等于 ,即所有長方形面積的和等于 ??;
③頻率分布表在數(shù)量表示上比較 ,但不夠 、 ,不利于分析數(shù)據(jù)分布的 ?。?
④從頻率分布直方圖可以清楚地看出數(shù)據(jù)分布的 ,但是從直方圖本身得不出 ?。?
2.連接頻率分布直方圖中各個小長方形上端的 ,就得到頻率分布折線圖.隨著樣本容量的增加,作圖時所分的組數(shù)增加,組距減小,相應的頻率折線圖會越來越接近于一條 曲線,統(tǒng)計中稱這條 曲線為______密度曲線.總體密度曲線反映了總體在各個范圍內(nèi)取值的百分比,它能給我們提供更加精細的信息.
例:從全校參加科技知識競賽的學生試卷中,抽取一個樣本,考察競賽的成績分布.將樣本分成5組,繪成頻率分布直方圖(如圖),圖中從左到右各小組的小長方形的高的比是1∶3∶6∶4∶2,最后邊一組的頻數(shù)是6.
請結合頻率分布直方圖提供的信息,解答下列問題:
(1)樣本的容量是多少? (2)列出頻率分布表;
(3)成績落在哪個范圍內(nèi)的人數(shù)最多?并求該小組的頻數(shù)、頻率;
(4)估計這次競賽中,成績不低于60分的學生占總人數(shù)的百分比.
【變式訓練】1.某電子元件進行壽命追蹤調(diào)查,情況如下.
壽命(h)
100~200
200~300
300~400
400~500
500~600
個 數(shù)
20
30
80
40
30
(1)列出頻率分布表;
(2)畫出頻率分布直方圖;
(3)估計元件壽命在100~400 h以內(nèi)的在總體中占的比例;
(4)估計電子元件壽命在400 h以上的在總體中占的比例.
3. 莖葉圖的應用
將所有的兩位數(shù)的 位數(shù)字作為莖(若是三位數(shù),則將 數(shù)字作為莖), 位數(shù)字作為葉,若是兩組數(shù)據(jù),則共用一個莖,莖按從小到大的順序從上向下排列,共莖的葉一般按從大到小或從小到大同行列出.
在制作莖葉圖時,重復的數(shù)字要 記錄,不能遺漏,特別是葉的部分,同一數(shù)據(jù)出現(xiàn)幾次,就要在圖中
例“某班甲、乙兩學生的高考備考成績?nèi)缦拢?
甲:512 554 528 549 536 556 534 541 522 538
乙:515 558 521 543 532 559 536 548 527 531
(1)用莖葉圖表示兩學生的成績;(2)分別求兩學生成績的中位數(shù)和平均分
【變式訓練】為了檢查一批手榴彈的殺傷半徑,抽取了其中20顆做試驗,得到這20顆手榴彈的殺傷半徑,并列表如下:
(1)在這個問題中,總體、個體、樣本和樣本容量各是什么?做出莖葉圖。
(2)求出這20顆手榴彈的殺傷半徑的眾數(shù)、中位數(shù)和平均數(shù),并估計這批手榴彈的平均殺傷半徑.
4. 用樣本的數(shù)字特征估計總體的數(shù)字特征
(1)眾數(shù):一組數(shù)據(jù)中出現(xiàn) 最多的數(shù)據(jù)叫做眾數(shù);
(2)中位數(shù):將一組數(shù)據(jù)從小到大(或從大到小)依次排列,把 數(shù)據(jù)(或 的平均數(shù))叫做中位數(shù),中位數(shù)把樣本數(shù)據(jù)分成了相同數(shù)目的兩部分;
(3)平均數(shù):x1,x2,…,xn的平均數(shù)=___________________________
注:由于眾數(shù)僅能刻畫某一數(shù)據(jù)出現(xiàn)的次數(shù)較多, 對極端值不敏感,而 又受極端值左右,因此這些因素制約了僅依賴這些數(shù)字特征來估計總體數(shù)字特征的準確性.
標準差與方差
考察樣本數(shù)據(jù)的分散程度的大小,最常用的統(tǒng)計量是標準差.標準差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s表示.s=____________________________________________
例:甲乙二人參加某體育項目訓練,近期的五次測試成績得分情況如圖.
(1)分別求出兩人得分的平均數(shù)與方差;
(2)根據(jù)圖和上面算得的結果,對兩人的訓練成績作出評價.
【變式訓練】甲、乙兩種冬小麥試驗品種連續(xù)5年的平均單位面積產(chǎn)量如下(單位:t / hm2)
品種
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
其中產(chǎn)量比較穩(wěn)定的小麥品種是 。
【知識點總結】
1.眾數(shù)、中位數(shù)、平均數(shù)的異同
(1)眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量, 是最重要的量.
(2) 的大小與一組數(shù)據(jù)里每個數(shù)據(jù)均有關系,任何一個數(shù)據(jù)的變動都會引起 的變動,而中位數(shù)和眾數(shù)都不具備此性質(zhì).
(3)眾數(shù)考查各數(shù)據(jù)出現(xiàn)的 ,當一組數(shù)據(jù)中有不少數(shù)據(jù)多次出現(xiàn)時,眾數(shù)往往更能反映問題.
(4)中位數(shù)僅與數(shù)據(jù)的 有關,中位數(shù)可能出現(xiàn)在所給數(shù)據(jù)中,也可能不在所給數(shù)據(jù)中,當一組數(shù)據(jù)中的個別數(shù)據(jù)變動較大時,可用中位數(shù)描述其集中趨勢.
2.莖葉圖刻畫數(shù)據(jù)的優(yōu)點
(1)所有數(shù)據(jù)信息都 在莖葉圖中看到.
(2)莖葉圖便于記錄和表示,且能夠展示數(shù)據(jù)的分布情況.
3.利用頻率分布直方圖估計樣本的數(shù)字特征
(1)中位數(shù):在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的 相等,由此可以估計中位數(shù)的值.
(2)平均數(shù):平均數(shù)是頻率分布直方圖的“重心”,等于圖中 .
(3)眾數(shù):在頻率分布直方圖中,眾數(shù)是 的橫坐標.
3.當堂檢測
1.一個容量為20的樣本數(shù)據(jù),分組后,組別與頻數(shù)如下:
組別
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
頻數(shù)
2
3
4
5
4
2
則樣本在(20,50]上的頻率為 ( )
A.12% B.40% C.60% D.70%
2.甲、乙兩名同學在五次《數(shù)學基本能力》測試中,成績統(tǒng)計用莖葉圖表示如下,若甲、乙兩人的平均成績分別是X甲、X乙,則下列結論正確的是 ( )
A.X甲>X乙,甲比乙成績穩(wěn)定 B.X甲>X乙,乙比甲成績穩(wěn)定
C. X甲<X乙,甲比乙成績穩(wěn)定 D.X甲<X乙,乙比甲成績穩(wěn)定
3.200輛汽車通過某一段公路時的時速的頻率分布直方圖如圖所示,時速在[50,60)的汽車大約有( )
A.30輛 B.40輛 C.60輛 D.80輛
4.(2020·福建高考)一個容量為100的樣本,其數(shù)據(jù)的分組與各組的頻數(shù)如下:
組別
頻數(shù)
(0,10]
12
(10,20]
13
(20,30]
24
(30,40]
15
(40,50]
16
(50,60]
13
(60,70]
7
則樣本數(shù)據(jù)落在(10,40]上的頻率為( )
A.0.13 B.0.39 C.0.52 D.0.64
5.甲、乙兩射擊運動員進行比賽,射擊相同的次數(shù),已知兩運動員射擊的環(huán)數(shù)穩(wěn)定在7,8,9,10環(huán),他們的成績頻率分布條形圖如下:
由乙擊中8環(huán)及甲擊中10環(huán)的概率與甲擊中環(huán)數(shù)的平均值都正確的一組數(shù)據(jù)依次是
( )A.0.35 0.25 8.1 B.0.35 0.25 8.8 C.0.25 0.35 8.1 D.0.25 0.35 8.8
6.(2020·四川高考)設矩形的長為a,寬為b,其比滿足b:a=≈0.618,這種矩形給人以美感,稱為黃金矩形.黃金矩形常應用于工藝品設計中.下面是某工藝品廠隨機抽取兩個批次的初加工矩形寬度與長度的比值樣本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根據(jù)上述兩個樣本來估計兩個批次的總體平均數(shù),與標準值0.618比較,正確結論是( )
A.甲批次的總體平均數(shù)與標準值更接近
B.乙批次的總體平均數(shù)與標準值更接近
C.兩個批次總體平均數(shù)與標準值接近程度相同
D.兩個批次總體平均數(shù)與標準值接近程度不能確定
二、填空題
7.已知總體的各個體的值由小到大依次為2,3,3,7,a,b,12,13.7,18.3,20,且總體的中位數(shù)為10.5.若要使該總體的方差最小,則a、b的取值分別是____________.
8.某地教育部門為了解學生在數(shù)學答卷中的有關信息,從上次考試的10 000名考生的數(shù)學試卷中,用分層抽樣的方法抽取500人,并根據(jù)這500人的數(shù)學成績畫出樣本的頻率分布直方圖(如圖).則這10 000人中數(shù)學成績在[140,150]段的約是________人.
9.(2020·珠海模擬)如圖是CBA籃球聯(lián)賽中,甲乙兩名運動員某賽季一些場次得分的莖葉圖,則平均得分高的運動員是________.
三、解答題
10.甲、乙兩臺機床同時加工直徑為100 mm的零件,為了檢驗產(chǎn)品的質(zhì)量,從產(chǎn)品中各隨機抽取6件進行測量,測得數(shù)據(jù)如下(單位 mm):
甲:99,100,98,100,100,103
乙:99,100,102,99,100,100
(1)分別計算上述兩組數(shù)據(jù)的平均數(shù)和方差;
(2)根據(jù)(1)的計算結果,說明哪一臺機床加工的這種零件更符合要求.
11.甲、乙兩位學生參加數(shù)學競賽培訓,在培訓期間,他們參加的5項預賽成績記錄如下:
甲
82
82
79
95
87
乙
95
75
80
90
85
(1)用莖葉圖表示這兩組數(shù)據(jù);
(2)從甲、乙兩人的成績中各隨機抽取一個,求甲的成績比乙高的概率;
(3)現(xiàn)要從中選派一人參加數(shù)學競賽,從統(tǒng)計學的角度考慮,你認為選派哪位學生參加合適?說明理由.
12.從高三學生中抽取50名同學參加數(shù)學競賽,成績的分組及各組的頻數(shù)如下(單位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.(1)列出樣本的頻率分布表;(2)畫出頻率分布直方圖和頻率分布折線圖;(3)估計成績在[60,90)分的學生比例;(4)估計成績在85分以下的學生比例.