《高考數(shù)學(xué)總復(fù)習(xí) 第10章 第3節(jié) 變量間的相關(guān)關(guān)系、統(tǒng)計案例課件 新人教A版》由會員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué)總復(fù)習(xí) 第10章 第3節(jié) 變量間的相關(guān)關(guān)系、統(tǒng)計案例課件 新人教A版(52頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第三節(jié)變量間的相關(guān)關(guān)系、統(tǒng)計案例 1會作兩個有關(guān)聯(lián)變量數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關(guān)關(guān)系2了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程3了解下列常見的統(tǒng)計方法,并能應(yīng)用這些方法解決一些實際問題(1)了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應(yīng)用(2)了解回歸的基本思想、方法及其簡單應(yīng)用一、兩個變量的線性相關(guān)1正相關(guān)在散點圖中,點散布在從 到 的區(qū)域,對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān)左下角右上角2負相關(guān)在散點圖中,點散布在從 到 的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為負相關(guān)3線性相關(guān)關(guān)系、回歸直線如果散點圖中點的分布從整體上看大致在
2、 ,就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線左上角右下角附近一條直線相關(guān)關(guān)系與函數(shù)關(guān)系有何異同點?提示:相同點:兩者均是指兩個變量的關(guān)系不同點:函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系二、回歸方程1最小二乘法求回歸直線使得樣本數(shù)據(jù)的點到回歸直線的 的方法叫做最小二乘法平方和最小距離的三、回歸分析1定義:對具有的兩個變量進行統(tǒng)計分析的一種常用方法2隨機誤差:線性回歸模型用ybxae表示,其中a和b為模型的 ,稱為隨機誤差3樣本點的中心在具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)中,回歸方程的截距和斜率的最小二乘估計公式分別為:相關(guān)關(guān)系未知參數(shù)
3、e4相關(guān)系數(shù)r;當(dāng)r0時,表明兩個變量;當(dāng)r0時,表明兩個變量r的絕對值越接近于1,表明兩個變量的線性相關(guān)性 ,r的絕對值越接近于0時,表明兩個變量之間 ,通常|r|大于時,認為兩個變量有很強的線性相關(guān)性正相關(guān)負相關(guān)越強相關(guān)性越弱0.75四、殘差分析1總偏差平方和把每個效應(yīng)(觀測值減去總的平均值)的平方加起來即: .2殘差數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異 是的效應(yīng),稱 為相應(yīng)于點(xi,yi)的殘差3殘差平方和 .隨機誤差4相關(guān)指數(shù)R2.R2的值越大,說明殘差平方和,也就是說模型的擬合效果 在線性回歸模型中,R2表示解釋變量對預(yù)報變量變化的貢獻率,R2越接近于1,表示回歸的效果 越小越好越
4、好五、獨立性檢驗1分類變量:變量的不同“值”表示個體所屬的 ,像這樣的變量稱為分類變量2列聯(lián)表:列出兩個分類變量的,稱為列聯(lián)表假設(shè)有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為22列聯(lián)表不同類別頻數(shù)表y1y2總計x1ababx2cdcd總計acbdabcd構(gòu)造一個隨機變量K2,其中n 為樣本容量3獨立性檢驗利用隨機變量、 來確定是否一定有把握認為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗abcd獨立性假設(shè)1下列兩個變量之間的關(guān)系哪個是相關(guān)關(guān)系()A角度和它的余弦值B正方形的邊長和它的面積C正n邊形的邊數(shù)和頂點角度之和D人的年
5、齡和身高解析:A、B、C中的兩個變量都是函數(shù)關(guān)系,它們可以用函數(shù)關(guān)系式來表示,D中的兩個變量之間的關(guān)系是相關(guān)關(guān)系答案:DA變量x與y正相關(guān),u與v正相關(guān)B變量x與y正相關(guān),u與v負相關(guān)C變量x與y負相關(guān),u與v正相關(guān)D變量x與y負相關(guān),u與v負相關(guān)解析:由正、負相關(guān)的定義知,x與y負相關(guān),u與v正相關(guān)答案:C3(2011江西高考)為了解兒子身高與其父親身高的關(guān)系,隨機抽取5對父子的身高數(shù)據(jù)如下:父親身高x(cm)174176176176178兒子身高y(cm)175175176177177答案:C答案:0.2545為了了解患慢性氣管炎與吸煙的關(guān)系,調(diào)查了228人,其中每天的吸煙支數(shù)在10支以上
6、20支以下的調(diào)查中,患者人數(shù)有98人,非患者人數(shù)有89人;每天的吸煙支數(shù)在20支以上的調(diào)查者中,患者人數(shù)有25人,非患者人數(shù)有16人,試問患慢性氣管炎與吸煙量_(填“是”或“否”)相互獨立解析:由已知條件得出下表:10支19支20支以上合計患者人數(shù)9825123非患者人數(shù)8916105合計18741228答案:是 在散點圖中,如果所有的樣本點都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系 在某地區(qū)的1230歲居民中隨機抽取了10個人的身高和體
7、重的統(tǒng)計資料如下表:根據(jù)上述數(shù)據(jù),畫出散點圖并判斷居民的身高和體重之間是否有相關(guān)關(guān)系身高(cm)143 156 159 172 165 171 177 161 164 160體重(kg)41496179686974696854【特別提醒】函數(shù)關(guān)系是一種理想的關(guān)系模型,而相關(guān)關(guān)系是一種更為一般的情況利用當(dāng)r0時,兩個變量正相關(guān),當(dāng)r0時,兩個變量負相關(guān);r的絕對值越接近于1,表明兩個變量的線性相關(guān)性越強;r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系通常當(dāng)|r|大于0.75時,認為兩個變量有很強的線性相關(guān)關(guān)系,因而求回歸直線方程才有意義如果k7.879,就有99.5%的把握認為“X
8、與Y有關(guān)系”;如果k6.635,就有99%的把握認為“X與Y有關(guān)系”;如果k5.024,就有97.5%的把握認為“X與Y有關(guān)系”;如果k3.841,就有95%的把握認為“X與Y有關(guān)系”;如果k2.706,就有90%的把握認為“X與Y有關(guān)系”;如果k2.706,就認為沒有充分的證據(jù)顯示“X與Y有關(guān)系”在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,利用獨立性檢驗的方法來判斷色盲與性別是否有關(guān)?你所得到的結(jié)論在什么范圍內(nèi)有效?題眼:線性回歸問題 (12分)某電腦公司有6名產(chǎn)品推銷員,其工作年限與年推銷金額的數(shù)據(jù)如下表:推銷員編號12345工作年限x/年35679推銷金額y/萬
9、元23345(1)以工作年限為自變量x,推銷金額為因變量y,作出散點圖;(2)求年銷售金額y關(guān)于工作年限x的回歸直線方程;(3)若第6名推銷員的工作年限為11年,試估計他的年推銷金額【審題】(1)先用散點圖判斷x、y的線性相關(guān)關(guān)系;(2)求回歸直線方程;(3)作出估計(3)由(2)可知,當(dāng)x11時,0.5x0.40.5110.45.9(萬元)可以估計第6名推銷員的年推銷金額為5.9萬元.12分【答題樣板】第一步:判斷兩個變量的線性相關(guān)性;第二步:求回歸直線的斜率和截距;第三步:確定回歸直線方程;第四步:根據(jù)回歸直線方程對隨機變量作出預(yù)測;第五步:反思回顧,查看關(guān)鍵點,易錯點和答題規(guī)范【心得】(1)本題易錯點有兩個,一是忽略對變量間的相關(guān)性進行檢驗;二是計算易出錯(2)如果不先作線性相關(guān)性檢驗,我們雖然也可以求出x與y的回歸直線方程,但這時的回歸直線方程也許沒有任何實際價值,它也就不能確定地反映變量x與y之間的變化規(guī)律,只有在x與y之間具有相關(guān)關(guān)系時,求得的回歸直線方程才具有實際意義