貴州省貴陽市高中數(shù)學(xué) 2.3變量間的相關(guān)關(guān)系與統(tǒng)計案例學(xué)案 新人教版必修3(通用)
統(tǒng)計案例
【考點分析】
1.會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,并利用散點圖認(rèn)識變量間的相關(guān)關(guān)系.
2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程. (線性回歸方程系數(shù)公式不要求記憶公式)
3.通過典型案例了解回歸分析的思想、方法。并能初步應(yīng)用回歸分析的思想、方法解決一些簡單的實際問題。
4.通過典型案例了解獨立檢驗(只要求2×2列聯(lián)表)的思想、方法.并能初步應(yīng)用獨立檢驗的思想、方法解決一些簡單的實際問題.
【知識梳理】
1.兩個變量之間的關(guān)系可能是________關(guān)系(如函數(shù)關(guān)系),也可能是_______關(guān)系。相關(guān)關(guān)系是一種__________關(guān)系?;貧w分析就是對具有_________的兩個變量進行統(tǒng)計分析的一種方法.
2.如果散點圖中的點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間有 ,這條直線叫做 ,回歸直線方程一定過___________。線性回歸模型中的自變量x稱為____________,因變量y稱為____________.散點圖中的點散布在從左下角到右上角的區(qū)域時稱為 _____相關(guān),點散布在從左上角到右下角的區(qū)域時稱為 相關(guān)。
3.我們常利用相關(guān)系數(shù)r來衡量兩個變量之間的線性相關(guān)關(guān)系,當(dāng)r>0時,表明兩個變量____相關(guān),當(dāng)r<0時,表明兩個變量____相關(guān);當(dāng)|r|越接近于1,說明兩個變量的線性相關(guān)關(guān)系越____,當(dāng)|r|越接近于0,說明兩個變量的線性相關(guān)關(guān)系越_____。(有時我們也用來衡量,結(jié)果和相關(guān)系數(shù)一樣)。
4.獨立性檢驗的基本方法:一般地,假設(shè)有兩個分類變量X和Y,它們的可能取值分別為{}和{}, 其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:
總計
總計
若要推斷的論述為Hl:X與Y有關(guān)系,可以按如下步驟判斷結(jié)論Hl 成立的可能性:根據(jù)觀測數(shù)據(jù)計算由公式所給出的檢驗隨機變量的觀測值k,并且k的值越大,說明“X與Y有關(guān)系”成立的可能性越大,利用以下數(shù)據(jù)來確定“X與Y有關(guān)系”的可信程度,
如果,就有的把握認(rèn)為“與有關(guān)系”;
如果,就有99%的把握認(rèn)為“與有關(guān)系”;
【方法指導(dǎo)】
1.相關(guān)關(guān)系與函數(shù)關(guān)系不同。函數(shù)關(guān)系中的兩個變量是一種確定性關(guān)系。例如正方形的面積s與邊長x之間的關(guān)系就是一種函數(shù)關(guān)系。相關(guān)關(guān)系是一種非確定性關(guān)系,即相關(guān)關(guān)系是非隨機變量與隨機變量之間的關(guān)系。例如人的身高與體重、商品的銷售額與廣告費都是相關(guān)關(guān)系.
2.⑴散點圖中各點并不集中在一條直線附近,這是也能按照求回歸直線方程步驟求出回歸直線方程。顯然這時求出的回歸直線方程沒有任何意義,所所以求回歸直線時先畫散點圖,判斷是否具有線性關(guān)系.
⑵求回歸直線的步驟:①計算出的值;②計算回歸系數(shù)a、b;③寫出回歸直線方程;
⑶回歸直線方程的應(yīng)用:利用回歸直線方程進行預(yù)測,把自變量x代入回歸方程對因變量進行估計;
3.在實際問題中,獨立性檢驗的結(jié)論也僅僅是一種數(shù)學(xué)關(guān)系,得到的結(jié)論也可能是錯誤的,比如,在推測吸煙與患肺癌是否有關(guān)時,通過收集、整理、分析數(shù)據(jù),我們得到“吸煙與患肺癌有關(guān)系”的結(jié)論,并且有99%的把握說明吸煙與患肺癌有關(guān)系,或者說這個結(jié)論出錯的概率在0.01以下。但實際上一個人吸煙也不一定會患肺癌,患肺癌也不一定是由吸煙引起的,這是數(shù)學(xué)中的統(tǒng)計思維與確定性思維差異的反映,但我們可以利用統(tǒng)計分析的結(jié)果去預(yù)測實際問題的結(jié)果.
【高考鏈接】
1.某商品銷售量y(件)與銷售價格x(元/件)負(fù)相關(guān),則其回歸方程可能是
A. B.
C. D.
解析:因為二者負(fù)相關(guān),答案顯然為A
2. 對變量x, y 有觀測數(shù)據(jù)理(i=1,2,…,10),得散點圖1;對變量u ,v 有觀測數(shù)據(jù)(i=1,2,…,10),得散點圖2. 由這兩個散點圖可以判斷.
(A)變量x 與y 正相關(guān),u 與v 正相關(guān) (B)變量x 與y 正相關(guān),u 與v 負(fù)相關(guān)
(C)變量x 與y 負(fù)相關(guān),u 與v 正相關(guān) (D)變量x 與y 負(fù)相關(guān),u 與v 負(fù)相關(guān)
解析:圖1是負(fù)相關(guān),圖2是正相關(guān),所以答案為C
3.某企業(yè)有兩個分廠生產(chǎn)某種零部件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質(zhì)品。從兩個分廠生產(chǎn)的零件中各抽出500件,量其內(nèi)徑尺寸,得結(jié)果如下表:
甲廠:
分組
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
頻數(shù)
12
63
86
182
92
61
4
乙廠:
分組
[29.86,
29.90)
[29.90,
29.94)
[29.94,
29.98)
[29.98,
30.02)
[30.02,
30.06)
[30.06,
30.10)
[30.10,
30.14)
頻數(shù)
29
71
85
159
76
62
18
⑴試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)頻率;
⑵根據(jù)以上統(tǒng)計數(shù)據(jù)列2×2聯(lián)表,并問是否有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”
解析:⑴甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)頻率為;乙廠生產(chǎn)的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率為。
⑵
甲廠
乙廠
合計
優(yōu)質(zhì)品
360
320
680
非優(yōu)質(zhì)品
140
180
320
合計
500
500
1000
>6.635,所以有99%的把握認(rèn)為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”。
【題型示例】
例1.下面那些變量是相關(guān)關(guān)系
(A)車租車車費與行駛里程 (B)正方形面積與棱長
(C)身高與體重 (D)鐵塊大小與質(zhì)量
【思路導(dǎo)引】
函數(shù)關(guān)系是確定性關(guān)系
相關(guān)關(guān)系是不確定性關(guān)系
答案:C
解:函數(shù)關(guān)系是確定性關(guān)系,答案A、B、D都是確定性關(guān)系,而C答案是非確定性關(guān)系,因此選C.
例2.某小賣部為了了解熱茶銷售量y(杯)與氣溫x(℃)之間的關(guān)系,隨機統(tǒng)計了某4天賣出的熱茶杯數(shù)與當(dāng)天的氣溫并制作了對照表:
月平均氣溫x(℃)
17
13
8
2
月銷售量y(杯)
24
34
38
64
由表中的數(shù)據(jù)算得線性回歸方程中的b≈-2,當(dāng)氣溫為-5℃時,預(yù)測熱茶銷售量為_______杯。
【思路導(dǎo)引】
求樣本中心點
回歸直線過樣本點中心
確定a的值
代入得答案:
解:由數(shù)據(jù)可得樣本中心點坐標(biāo)為(10,40),將樣本中心點坐標(biāo)和b=-2代入回歸直線得a得值,最后將x=-5代入回歸直線方程可得熱茶銷售量的預(yù)測值為70杯.
例3.某種產(chǎn)品的廣告費用支出x與銷售額y之間具有如下的對應(yīng)數(shù)據(jù)(單位:萬元):
支出x/萬元
2
4
5
6
8
銷售額y/萬元
30
40
60
50
70
試預(yù)測宣傳費用為10萬元時的銷售額大小。
【思路導(dǎo)引】
畫散點圖
球回歸直線方程
代入回歸直線方程
得到預(yù)測值
證明:畫出散點圖,可以發(fā)現(xiàn)點都集中在一條直線附近,所以x和y具有線性關(guān)系有公式可知,=5,=50,
b=6.5,a=17.5,所以回歸直線方程為,所以當(dāng)x=10萬元時,銷售額大約為82.5萬元。
例4.(2020年新課標(biāo))為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了500位老人,結(jié)果如下:
您是否需要志愿者
男
女
需要
40
30
不需要
160
270
(Ⅰ)估計該地區(qū)老年人中,需要志愿提供幫助的老年人的比例;
(Ⅱ)能否有99℅的把握認(rèn)為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關(guān)?
(Ⅲ)根據(jù)(Ⅱ)的結(jié)論,能否提出更好的調(diào)查辦法來估計該地區(qū)的老年人中,需要志愿者提供幫助的老年人的比例?說明理由。
0.050 0.010 0.001
3.841 6.635 10.828
附:
【思路導(dǎo)引】
用樣本中的比例估計總體中的比例
獨立性
檢驗
是否需要幫助與性別有關(guān)
采用分
層抽樣
解:(Ⅰ)調(diào)查的500位老年人中有70人需要志愿者提供幫助,所以該地區(qū)老年人中需要提供幫助的老年人的比例的估計值為。
(Ⅱ),由于9.967>6.635,所以又99%的把握認(rèn)為該地區(qū)的老年人是否需要幫助與性別有關(guān).
(Ⅲ)由(Ⅱ)的結(jié)論可知,該地區(qū)老年人是否需要志愿者提供幫助與性別有關(guān),并且從樣本數(shù)據(jù)可以看出該地區(qū)男性老人與女性老人中需要志愿者提供幫助的比例有明顯差異,因此在調(diào)查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法比采用簡單隨機抽樣方法更好。
【老師點拔】
1.求回歸直線方程不要求記憶公式,只要會用公式,同時回歸直線過樣本中心點是考試熱點.
2.回歸直線方程求出后,如果給出解釋變量的一個值,可以求出預(yù)測變量的值,但這個值只是一個預(yù)測估計值,并不能作為預(yù)報變量的準(zhǔn)確值.
3.在線性回歸模型中,和|r|一樣,值越大,說明回歸的效果越好,模型擬合的效果越好,值越小則擬合的效果越差.
4.獨立性檢驗的思想類似于反證法,先假設(shè)兩個分類變量無關(guān),而得到的的觀測值相對比較大,這與假設(shè)成立時可得出接近于零的結(jié)果相矛盾,所以得到假設(shè)不成立的結(jié)論,但這個結(jié)論不是一個確定性的結(jié)論,我們只能在一定程度上說明二者有關(guān)系。換句話說,我們得到的結(jié)論是有錯誤的可能的.
【過關(guān)練習(xí)】
1.對于兩個變量之間的相關(guān)系數(shù),下列說法中正確的是
( A)越大,相關(guān)程度越小
(B) ,越大,相關(guān)程度越小,越小,相關(guān)程度越大
(C) 且越接近于,相關(guān)程度越大;越接近于,相關(guān)程度越小
x
0
1
2
3
y
1
3
5
7
( D)以上說法都不對
2. 已知x與y之間的一組數(shù)據(jù)如右表:
則x與y的線性回歸直線必過點
(A)(2,2) (B)(1.5,0) (C)(1,2) (D)(1.5,4)
3.設(shè)有一個回歸方程為,則變量x增加一個單位時
( A)y平均增加1.5單位 (B) y平均增加2單位
(C) y平均減少1.5單位 ( D) y平均減少2單位
4.下列兩個變量之間的關(guān)系是相關(guān)關(guān)系的是( )
A.正方體的棱長和體積 B.角的弧度數(shù)和它的正弦值
C.速度一定時的路程和時間 D.日照時間與水稻的畝產(chǎn)量
5.一位母親記錄了她兒子3到9歲的身高,數(shù)據(jù)如下表。
年齡/歲
3
4
5
6
7
8
9
身高/cm
94.8
104.2
108.7
117.8
124.3
130.8
139.0
由此她建立了身高與年齡的回歸模型y=73.93+7.19x,她用這個模型預(yù)測兒子10歲時的身高,則下面的敘述正確的是( )
(A)身高一定是145.83cm (B)身高在145.83CM以上
(C)身高在145.83cm左右 (D)身高在145.83cm以下
6.關(guān)于分類變量X與Y的隨機變量的觀測值k,下列說法正確的是
(A)k 越大,“X與Y有關(guān)系”的可信程度越小
(B)k 越小,“X與Y有關(guān)系”的可信程度越小
(C)k 越接近于0,“X與Y無關(guān)”的可信程度越小
(D)k 越大,“X與Y無關(guān)”的可信程度越大
7.某商店統(tǒng)計了最近6個月某商品的進價x與售價y(單位:元)的對應(yīng)數(shù)據(jù)如下:
x
3
5
2
8
9
12
y
4
6
3
9
12
14
, , , ,回歸方程為 .
8.某服裝商場為了了解毛衣的月銷售量y(件)與月平均氣溫x(℃)之間的關(guān)系,隨機統(tǒng)計了某4個月的月銷售量與當(dāng)月平均氣溫,其數(shù)據(jù)如下表,由表中數(shù)據(jù)算出線性回歸方程中的b≈-2.氣象部門預(yù)測下個月的平均氣溫約為6℃,據(jù)此估計該商場下個月毛衣的銷售量約為_______件。
月平均氣溫x(℃)
17
13
8
2
月銷售量y(件)
24
33
40
55
9.春節(jié)期間,某市物價部門對本市五個商場銷售的某商品一天的銷售量及其價格進行調(diào)查,五個商場的售價x元和銷售量y件之間的一組數(shù)據(jù)如下表所示:
價格x
9
9.5
10
10.5
11
銷售量y
11
10
8
6
5
通過分析,發(fā)現(xiàn)銷售量y與商品的價格x具有相關(guān)關(guān)系,則銷售量y關(guān)于商品的價格x的回歸直線方程為_____________________。
10.下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對照數(shù)據(jù)
x
3
4
5
6
y
2.5
3
4
4.5
⑴請畫出上表數(shù)據(jù)的散點圖;
⑵請根據(jù)上表提供的數(shù)據(jù),求出y關(guān)于x的線性回歸方程;
⑶已知該廠技術(shù)改造前100噸甲產(chǎn)品能耗為90噸標(biāo)準(zhǔn)煤。試根據(jù)⑵求出的線性回歸方程,預(yù)測生產(chǎn)100噸
甲產(chǎn)品的生產(chǎn)能耗比技術(shù)改造前降低多少噸標(biāo)準(zhǔn)煤?
11.(2020年廣東卷)某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調(diào)查中,隨機抽取了100名電視觀眾,相關(guān)的數(shù)據(jù)如下表所示:
文藝節(jié)目
新聞節(jié)目
總計
20到40歲
40
18
58
大于40歲
15
27
42
總計
55
45
100
(1)由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關(guān)?
(2)用分層抽樣方法在收看新聞節(jié)目的觀眾中隨機抽取5名,大于40歲的觀眾應(yīng)該抽取幾名?
(3)在上述抽取的5名觀眾中任取2名,求恰有1名觀眾的年齡為20至40歲的概率。
【高考預(yù)測】
1.一經(jīng)濟研究小組對全國50個中小城市的職工人均平均工資x與居民人均消費y進行了統(tǒng)計調(diào)查,發(fā)現(xiàn)y與x具有相關(guān)關(guān)系,回歸方程為(單位:千元)。若某城市居民的消費水平為7.675千元,估計該城市消費額占人均工資收入的百分比為
(A)66% (B)72.3% (C)67.3% (D)83%
2.已知算得某工廠在某年里每月產(chǎn)品的總成本y(萬元)與該月產(chǎn)量x(萬件)之間的回歸方程,計算x=2時,總成本y的估計值為___________。
3.為調(diào)查中學(xué)生的近視情況,隨機抽取某校男生150名,女生140名,其中男生中有80名近視,女生中有70名近視。在檢驗這些中學(xué)生的眼睛近視是否與性別有關(guān)時,最有說服力的方法是
(A) 期望與方差 (B) 排列與組合 (C) 概率 (D) 獨立性檢驗
4.下表是某廠1~4月份用水量(單位:百噸)的一組數(shù)據(jù):
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由其散點圖可以看出,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸方程是,則a=_________。
答案部分:
【知識梳理】1.確定性,非確定性,非確定性,相關(guān)關(guān)系2.線性相關(guān)關(guān)系,回歸直線,樣本中心點,解釋變量,預(yù)報變量,正,負(fù)3.正,負(fù),強,弱4.99.9%,6.635
【達(dá)標(biāo)練習(xí)】1.C,2.D,3.C,4.D,5.C,6.B,7.6.5,8,327,396,,8.46, 9.,10.⑴略,⑵,⑶19.65
11.解:⑴有關(guān),新聞節(jié)目多為年齡大的
⑵應(yīng)抽取的人數(shù)為:(人)
⑶由⑵知,抽取的5名觀眾中,有2名觀眾年齡處于20~40歲,3名觀眾的年齡大于40歲,所求概率為P=
【高考預(yù)測】1.D,2.3.404,3.D,4.5.25.