2019-2020年高考數(shù)學(xué)復(fù)習(xí) 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例.doc
《2019-2020年高考數(shù)學(xué)復(fù)習(xí) 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《2019-2020年高考數(shù)學(xué)復(fù)習(xí) 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例.doc(9頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
2019-2020年高考數(shù)學(xué)復(fù)習(xí) 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例 以選擇題或填空題的形式考查回歸分析及獨(dú)立性檢驗(yàn)中的基本思想方法及其簡(jiǎn)單應(yīng)用. 【復(fù)習(xí)指導(dǎo)】 高考在該部分的主要命題點(diǎn)就是回歸分析和獨(dú)立性檢驗(yàn)的基礎(chǔ)知識(shí)和簡(jiǎn)單應(yīng)用.復(fù)習(xí)時(shí)要掌握好回歸分析和獨(dú)立性檢驗(yàn)的基本思想、方法和基本公式. 基礎(chǔ)梳理 1.相關(guān)關(guān)系的分類 從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān);點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān). 2.線性相關(guān) 從散點(diǎn)圖上看,如果這些點(diǎn)從整體上看大致分布在一條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線. 3.回歸方程 (1)最小二乘法:使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離平方和最小的方法叫最小二乘法. (2)回歸方程:兩個(gè)具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù): (x1,y1),(x2,y2),…,(xn,yn),其回歸方程為=x+,則 其中,b是回歸方程的斜率,a是在y軸上的截距. 4.樣本相關(guān)系數(shù) r=,用它來衡量?jī)蓚€(gè)變量間的線性相關(guān)關(guān)系. (1)當(dāng)r>0時(shí),表明兩個(gè)變量正相關(guān); (2)當(dāng)r<0時(shí),表明兩個(gè)變量負(fù)相關(guān); (3)r的絕對(duì)值越接近1,表明兩個(gè)變量的線性相關(guān)性越強(qiáng);r的絕對(duì)值越接近于0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.通常當(dāng)|r|>0.75時(shí),認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系. 5.線性回歸模型 (1)y=bx+a+e中,a、b稱為模型的未知參數(shù);e稱為隨機(jī)誤差. (2)相關(guān)指數(shù) 用相關(guān)指數(shù)R2來刻畫回歸的效果,其計(jì)算公式是:R2= ,R2的值越大,說明殘差 平方和越小,也就是說模型的擬合效果越好.在線性回歸模型中,R2表示解釋變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸效果越好. 6.獨(dú)立性檢驗(yàn) (1)用變量的不同“值”表示個(gè)體所屬的不同類別,這種變量稱為分類變量.例如:是否吸煙,宗教信仰,國(guó)籍等. (2)列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表. (3)一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為: 22列聯(lián)表 y1 y2 總計(jì) x1 a b a+b x2 c d c+d 總計(jì) a+c b+d a+b+c+d K2=(其中n=a+b+c+d為樣本容量),可利用獨(dú)立性檢驗(yàn)判斷表來判斷“x與y的關(guān)系”. 這種利用隨機(jī)變量K2來確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn). 兩個(gè)規(guī)律 (1)函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系.事實(shí)上,函數(shù)關(guān)系是兩個(gè)非隨機(jī)變量的關(guān)系,而相關(guān)關(guān)系是非隨機(jī)變量與隨機(jī)變量的關(guān)系. (2)當(dāng)K2≥3.841時(shí),則有95%的把握說事A與B有關(guān); 當(dāng)K2≥6.635時(shí),則有99%的把握說事件A與B有關(guān); 當(dāng)K2≤2.706時(shí),則認(rèn)為事件A與B無關(guān). 三個(gè)注意 (1)回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法,只有在散點(diǎn)圖大致呈線性時(shí),求出的回歸直線方程才有實(shí)際意義,否則,求出的回歸直線方程毫無意義. (2)線性回歸方程中的截距和斜率都是通過樣本數(shù)據(jù)估計(jì)而來的,存在誤差,這種誤差會(huì)導(dǎo)致預(yù)報(bào)結(jié)果的偏差;而且回歸方程只適用于我們所研究的樣本總體. (3)獨(dú)立性檢驗(yàn)的隨機(jī)變量K2=3.841是判斷是否有關(guān)系的臨界值,K2≤3.841應(yīng)判斷為沒有充分證據(jù)顯示事件A與B有關(guān)系,而不能作為小于95%的量化值來判斷. 雙基自測(cè) 1.(人教A版教材習(xí)題改編)下面哪些變量是相關(guān)關(guān)系( ). A.出租車車費(fèi)與行駛的里程 B.房屋面積與房屋價(jià)格 C.身高與體重 D.鐵塊的大小與質(zhì)量 解析 A,B,D都是函數(shù)關(guān)系,其中A一般是分段函數(shù),只有C是相關(guān)關(guān)系. 答案 C 2.對(duì)變量x,y有觀測(cè)數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點(diǎn)圖(1);對(duì)變量u,v有觀測(cè)數(shù)據(jù)(ui、vi)(i=1,2,…,10),得散點(diǎn)圖(2).由這兩個(gè)散點(diǎn)圖可以判斷 ( ). A.變量x與y正相關(guān),u與v正相關(guān) B.變量x與y正相關(guān),u與v負(fù)相關(guān) C.變量x與y負(fù)相關(guān),u與v正相關(guān) D.變量x與y負(fù)相關(guān),u與v負(fù)相關(guān) 解析 由題圖(1)可知,各點(diǎn)整體呈遞減趨勢(shì),x與y負(fù)相關(guān);由題圖(2)可知,各點(diǎn)整體呈遞增趨勢(shì),u與v正相關(guān). 答案 C 3.(xx南昌模擬)某商品銷售量y(件)與銷售價(jià)格x(元/件)負(fù)相關(guān),則其回歸方程可能是( ). A.=-10x+200 B.=10x+200 C.=-10x-200 D.=10x-200 解析 因?yàn)殇N量與價(jià)格負(fù)相關(guān),由函數(shù)關(guān)系考慮為減函數(shù),又因?yàn)閤,y不能為負(fù)數(shù),再排除C,故選A. 答案 A 4.(xx棗莊模擬)下面是22列聯(lián)表: y1 y2 合計(jì) x1 a 21 73 x2 22 25 47 合計(jì) b 46 120 則表中a,b的值分別為( ). A.94,72 B.52,50 C.52,74 D.74,52 解析 ∵a+21=73,∴a=52,又a+22=b,∴b=74. 答案 C 5.在一項(xiàng)打鼾與患心臟病的調(diào)查中,共調(diào)查了1 671人,經(jīng)過計(jì)算K2的觀測(cè)值k=27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是________的(有關(guān),無關(guān)). 解析 由觀測(cè)值k=27.63與臨界值比較,我們有99%的把握說打鼾與患心臟病有關(guān). 答案 有關(guān) 考向一 相關(guān)關(guān)系的判斷 【例1】?山東魯潔棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗(yàn)田上對(duì)某棉花新品種進(jìn)行施化肥量x對(duì)產(chǎn)量y影響的試驗(yàn),得到如下表所示的一組數(shù)據(jù)(單位:kg): 施化肥量x 15 20 25 30 35 40 45 棉花產(chǎn)量y 330 345 365 405 445 450 455 (1)畫出散點(diǎn)圖; (2)判斷是否具有相關(guān)關(guān)系. [審題視點(diǎn)] (1)用x軸表示化肥施用量,y軸表示棉花產(chǎn)量,逐一畫點(diǎn). (2)根據(jù)散點(diǎn)圖,分析兩個(gè)變量是否存在相關(guān)關(guān)系. 解 (1)散點(diǎn)圖如圖所示 (2)由散點(diǎn)圖知,各組數(shù)據(jù)對(duì)應(yīng)點(diǎn)大致都在一條直線附近,所以施化肥量x與產(chǎn)量y具有線性相關(guān)關(guān)系. 利用散點(diǎn)圖判斷兩個(gè)變量是否有相關(guān)關(guān)系是比較簡(jiǎn)便的方法.在散點(diǎn)圖中如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系.即變量之間具有函數(shù)關(guān)系.如果所有的樣本點(diǎn)落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系;如果所有的樣本點(diǎn)都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系. 【訓(xùn)練1】 根據(jù)兩個(gè)變量x,y之間的觀測(cè)數(shù)據(jù)畫成散點(diǎn)圖如圖所示,這兩個(gè)變量是否具有線性相關(guān)關(guān)系________(填“是”與“否”). 解析 從散點(diǎn)圖看,散點(diǎn)圖的分布成團(tuán)狀,無任何規(guī)律,所以兩個(gè)變量不具有線性相關(guān)關(guān)系. 答案 否 考向二 獨(dú)立性檢驗(yàn) 【例2】?(xx全國(guó)新課標(biāo))為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡(jiǎn)單隨機(jī)抽樣方法從該地區(qū)調(diào)查了500位老年人,結(jié)果如下: 性別 是否需要志愿者 男 女 需要 40 30 不需要 160 270 (1)估計(jì)該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例; (2)能否有99%的把握認(rèn)為該地區(qū)老年人是否需要志愿者提供幫助與性別有關(guān)? (3)根據(jù)(2)的結(jié)論,能否提出更好的調(diào)查方法來估計(jì)該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例?說明理由. 附: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 K2= [審題視點(diǎn)] 第(2)問由a=40,b=30,c=160,d=270,代入公式可求K2,由K2的值與6.635比較斷定.第(3)問從抽樣方法說明. 解 (1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例的估計(jì)值為=14%. (2)K2=≈9.967. 由于9.967>6.635,所以有99%的把握認(rèn)為該地區(qū)老年人是否需要幫助與性別有關(guān). (3)由(2)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時(shí),先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層,采用分層抽樣方法,這要比采用簡(jiǎn)單隨機(jī)抽樣方法更好. 獨(dú)立性檢驗(yàn)的步驟: (1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表; (2)根據(jù)公式K2=計(jì)算K2的觀測(cè)值; (3)比較K2與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷. 【訓(xùn)練2】 某企業(yè)有兩個(gè)分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質(zhì)品.從兩個(gè)分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得結(jié)果如下表: 甲廠: 分組 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 頻數(shù) 12 63 86 182 92 61 4 乙廠: 分組 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 頻數(shù) 29 71 85 159 76 62 18 (1)試分別估計(jì)兩個(gè)分廠生產(chǎn)零件的優(yōu)質(zhì)品率; (2)由以上統(tǒng)計(jì)數(shù)據(jù)填下面22列聯(lián)表,并問是否有99%的把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件的質(zhì)量有差異”. 甲 廠 乙 廠 合 計(jì) 優(yōu)質(zhì)品 非優(yōu)質(zhì)品 合 計(jì) 附 K2=, P(K2≥k) 0.05 0.01 k 3.841 6.635 解 (1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計(jì)為100%=72%; 乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計(jì)為100%=64%. (2) 甲 廠 乙 廠 合 計(jì) 優(yōu)質(zhì)品 360 320 680 非優(yōu)質(zhì)品 140 180 320 合 計(jì) 500 500 1 000 K2=≈7.35>6.635, 所以有99%的把握認(rèn)為“兩個(gè)分廠生產(chǎn)的零件的質(zhì)量有差異”. 考向三 線性回歸方程 【例3】?(xx菏澤模擬)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對(duì)照數(shù)據(jù). x 3 4 5 6 y 2.5 3 4 4.5 (1)請(qǐng)畫出上表數(shù)據(jù)的散點(diǎn)圖; (2)請(qǐng)根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程=x+; (3)已知該廠技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤.試根據(jù)(2)求出的線性回歸方程.預(yù)測(cè)生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤? (參考數(shù)值:32.5+43+54+64.5=66.5) [審題視點(diǎn)] (2)問利用公式求、,即可求出線性回歸方程. (3)問將x=100代入回歸直線方程即可. 解 (1)由題設(shè)所給數(shù)據(jù),可得散點(diǎn)圖如圖所示. (2)由對(duì)照數(shù)據(jù),計(jì)算得:=86, ==4.5(噸),==3.5(噸). 已知iyi=66.5, 所以,由最小二乘法確定的回歸方程的系數(shù)為: ===0.7, =-=3.5-0.74.5=0.35. 因此,所求的線性回歸方程為=0.7x+0.35. (3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的生產(chǎn)能耗為: 90-(0.7100+0.35)=19.65(噸標(biāo)準(zhǔn)煤). 在解決具體問題時(shí),要先進(jìn)行相關(guān)性檢驗(yàn),通過檢驗(yàn)確認(rèn)兩個(gè)變量是否具有線性相關(guān)關(guān)系,若它們之間有線性相關(guān)關(guān)系,再求回歸直線方程. 【訓(xùn)練3】 (2011江西)為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對(duì)父子的身高數(shù)據(jù)如下: 父親身高x/cm 174 176 176 176 178 兒子身高y/cm 175 175 176 177 177 則y對(duì)x的線性回歸方程為( ). A.y=x-1 B.y=x+1 C.y=88+x D.y=176 解析 由題意得==176(cm), ==176(cm),由于(,)一定滿足線性回歸方程,經(jīng)驗(yàn)證知選C. 答案 C 閱卷報(bào)告15——數(shù)據(jù)處理不當(dāng)導(dǎo)致計(jì)算錯(cuò)誤而失分 【問題診斷】 由于大多數(shù)省市高考要求不準(zhǔn)使用計(jì)算器,而線性回歸問題和獨(dú)立性檢驗(yàn)問題仍是近幾年新課標(biāo)高考的??键c(diǎn),并且大多是考查考生的計(jì)算能力,就計(jì)算方面常有不少考生因計(jì)算出錯(cuò)而失分. 【防范措施】 平時(shí)訓(xùn)練時(shí)首先養(yǎng)成勤于動(dòng)手的習(xí)慣,親自動(dòng)手計(jì)算,再者考場(chǎng)上要保持心態(tài)放松,做題時(shí)細(xì)心認(rèn)真,最終可減少錯(cuò)誤的發(fā)生. 【示例】?(2011安徽)某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計(jì)數(shù)據(jù): 年份 xx xx xx xx xx 需求量(萬噸) 236 246 257 276 286 (1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程=bx+a; (2)利用(1)中所求出的直線方程預(yù)測(cè)該地xx年的糧食需求量. 實(shí)錄 (1)=2 006,==260.2. b= + =6.2, 錯(cuò)因 求b時(shí)計(jì)算出錯(cuò),b值不準(zhǔn)確.a(chǎn)=-b=260.2-6.22 006=-12 177. ∴=6.2x-12 177. (2)=6.22 012-12 177=297.4. 正解 (1)由所給數(shù)據(jù)看出,年需求量與年份之間是近似直線上升,下面來配回歸直線方程,為此對(duì)數(shù)據(jù)預(yù)處理如下: 年份-xx -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 對(duì)預(yù)處理后的數(shù)據(jù),容易算得, =0,=3.2, b= ==6.5,a=-b=3.2. 由上述計(jì)算結(jié)果,知所求回歸直線方程為-257=b(x-2 006)+a=6.5(x-2 006)+3.2, 即=6.5(x-2 006)+260.2.① (2)利用直線方程①,可預(yù)測(cè)xx年的糧食需求量為 6.5(2 012-2 006)+260.2=6.56+260.2=299.2(萬噸).- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 2019-2020年高考數(shù)學(xué)復(fù)習(xí) 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計(jì)案例 2019 2020 年高 數(shù)學(xué) 復(fù)習(xí) 變量 相關(guān) 關(guān)系 統(tǒng)計(jì) 案例
鏈接地址:http://kudomayuko.com/p-3245033.html