2020版高考數(shù)學一輪復習 10.4 相關性、最小二乘估計與統(tǒng)計案例課件 理 北師大版.ppt
《2020版高考數(shù)學一輪復習 10.4 相關性、最小二乘估計與統(tǒng)計案例課件 理 北師大版.ppt》由會員分享,可在線閱讀,更多相關《2020版高考數(shù)學一輪復習 10.4 相關性、最小二乘估計與統(tǒng)計案例課件 理 北師大版.ppt(44頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、10.4相關性、最小二乘估計 與統(tǒng)計案例,知識梳理,考點自診,1.相關性 (1)散點圖:在考慮兩個量的關系時,為了對變量之間的關系有一個大致的了解,人們通常將變量所對應的點描出來,這些點就組成了變量之間的一個圖,通常稱這種圖為變量之間的. (2)線性相關:若兩個變量x和y的散點圖中,所有點看上去都在_______________附近波動,則稱變量間是線性相關的,此時,我們可以用來近似. (3)非線性相關:在兩個變量x和y的散點圖中,若所有點看上去都在某條附近波動,則稱此相關為非線性相關的.此時,可以用一條來擬合.如果所有的點在散點圖中沒有顯示任何關系,則稱變量間是.,散點圖,一條直線,一條直
2、線,曲線,曲線,不相關的,知識梳理,考點自診,2.最小二乘法與線性回歸方程 (1)最小二乘法:如果有n個點:(x1,y1),(x2,y2),,(xn,yn),可以用下面的表達式來刻畫這些點與直線y=a+bx的接近程度:y1-(a+bx1)2+ y2-(a+bx2)2++yn-(a+bxn)2. 使得上式達到最小值的直線y=a+bx就是我們所要求的直線,這種方法稱為.,a=.這樣得到的直線方程稱為線性回歸方程,a,b是線性回歸方程的系數(shù).,最小二乘法,知識梳理,考點自診,3.獨立性檢驗 (1)22列聯(lián)表,構造一個隨機變量2= , 其中n=為樣本容量. (2)獨立性檢驗 利用隨機變量來判斷
3、“兩個變量”的方法稱為獨立性檢驗.,a+b+c+d,有關聯(lián),知識梳理,考點自診,(3)當數(shù)據(jù)量較大時,在統(tǒng)計中,用以下結(jié)果對變量的獨立性進行判斷 當22.706時,沒有充分的證據(jù)判定變量A,B有關聯(lián),可以認為變量A,B是沒有關聯(lián)的; 當22.706時,有90%的把握判定變量A,B有關聯(lián); 當23.841時,有95%的把握判定變量A,B有關聯(lián); 當26.635時,有99%的把握判定變量A,B有關聯(lián).,知識梳理,考點自診,1.判斷下列結(jié)論是否正確,正確的畫“”,錯誤的畫“”. (1)相關關系與函數(shù)關系都是一種確定性的關系,也是一種因果關系. () (2)利用散點圖可以直觀判斷兩個變量的關系是否可以
4、用線性關系表示. () (3)只有兩個變量有相關關系,所得到的回歸模型才有預測價值. () (4)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的2的值越大. () (5)通過回歸方程y=bx+a可以估計和觀測變量的取值和變化趨勢. (),,,,,,知識梳理,考點自診,2.(2018黑龍江仿真模擬七,3)為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗,得到5組數(shù)據(jù):(x1,y1),(x2,y2), (x3,y3),(x4,y4),(x5,y5).根據(jù)收集到的數(shù)據(jù)可知x1+x2+x3+x4+x5=150,由最小二乘法求得回歸直線方程為y=0.67x+54.9,則y1+y2+y3+
5、y4+y5的值為() A.75B.155.4C.375D.466.2,A,知識梳理,考點自診,3.(2018遼寧丹東二模,5)已知某種商品的廣告費支出x(單位:萬元)與銷售額y(單位:萬元)之間有如下對應數(shù)據(jù):,根據(jù)上表可得回歸方程y=bx+a,計算得b=7,則當投入10萬元廣告費時,銷售額的預報值為() A.75萬元B.85萬元C.99萬元D.105萬元,B,回歸直線y=7x+a過樣本中心(5,50), 50=75+a,解得a=15,回歸直線方程為y=7x+15. 當x=10時,y=710+15=85, 故當投入10萬元廣告費時,銷售額的預報值為85萬元,故選B.,知識梳理,考點自診,4.(
6、2018山西大同、陽泉二模,文4)某班主任對全班50名學生進行了作業(yè)量的調(diào)查,數(shù)據(jù)如表:,若推斷“學生的性別與認為作業(yè)量大有關”,則(),知識梳理,考點自診,A.有99%的把握判定它們有關聯(lián) B.有95%的把握判定它們有關聯(lián) C.有90%的把握判定它們無關聯(lián) D.沒有充分的證據(jù)判定它們有關聯(lián),答案:B 解析:根據(jù)表中數(shù)據(jù)得到 5.0593.841,所以,若推斷“學生的性別與認為作業(yè)量大有關”,則有95%的把握判定它們有關聯(lián),故選B.,知識梳理,考點自診,5.(2018遼寧葫蘆島二模,15改編)下列說法: 線性回歸方程y=bx+a必過 ; 相關系數(shù)r越接近1,表明兩個變量相關性
7、越弱; 在回歸直線方程y=-0.5x+2中,當解釋變量x每增加一個單位時,預報變量y平均減少0.5個單位; 在一個22列聯(lián)表中,由計算得2=8.079,則有99%的把握認為這兩個變量間有關系; 對分類變量X與Y,它們的隨機變量2的值來說,k越小,“X與Y有關系”的把握程度越大. 其中正確的說法是.(把你認為正確的結(jié)論都寫在橫線上) 本題可參考獨立性檢驗臨界值表:,,知識梳理,考點自診,解析:線性回歸方程y=bx+a必過樣本中心點 ,故正確; 相關系數(shù)r絕對值越接近1,表明兩個變量相關性越強,故錯誤;在回歸直線方程y=-0.5x+2中,當解釋變量x每增加一個單位時,預報變量y平均減少0.5個
8、單位,故正確;在一個22列聯(lián)表中,由計算得2=8.079,則有99%的把握認為這兩個變量間有關系,故正確;對分類變量X與Y,它們的隨機變量2的值來說,2值越小,“X與Y有關系”的把握程度越小;故錯誤.綜上,答案為.,考點1,考點2,考點3,相關關系的判斷 例1(1)(2018北京八中烏蘭察布分校期末,10)對四組數(shù)據(jù)進行統(tǒng)計,獲得以下散點圖,關于其相關系數(shù)的比較,正確的是() A.r2 9、變量的一組數(shù)據(jù)的散點圖和回歸直線,若去掉一個點使得余下的5個點所對應的數(shù)據(jù)的相關系數(shù)最大,則應當去掉的點是() A.DB.E C.FD.A,B,考點1,考點2,考點3,解析: (1)圖1和圖3是正相關,相關系數(shù)大于0;圖2和圖4是負相關,相關系數(shù)小于0;圖1和圖2的點相對更加集中,所以相關性較強,所以r1接近于1,r2接近于-1,由此可得r2 10、題心得判斷相關關系的2種方法 (1)散點圖法:如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關關系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系. (2)相關系數(shù)法:利用相關系數(shù)判定,當|r|越趨近于1相關性越強.,考點1,考點2,考點3,對點訓練1(1)(2018河北張家口模擬,4)已知x,y是兩個變量,下列四個散點圖中,x,y呈正相關趨勢的是 (),A,考點1,考點2,考點3,(2)(2018湖南長沙模擬,11)某市國慶節(jié)7天假期的樓房認購量(單位:套)與成交量(單位:套)的折線圖如圖所示,小明同學根據(jù)折線圖對這7天的認購量與成交量作出如下判斷:日成交量的中位數(shù)是 11、16;日成交量超過日平均成交量的有2天;認購量與日期正相關;10月7日認購量的增量大于10月7日成交量的增量.上述判斷中錯誤的個數(shù)為() A.1B.2 C.3D.4,C,考點1,考點2,考點3,解析: (1)當x,y呈正相關趨勢時,散點圖應該是從左下到右上趨勢,由圖可知選項A中的散點圖是從左下到右上趨勢,描述了y隨著x的增加而增加的變化趨勢,故選A. (2)將成交量數(shù)據(jù)按大小順序排列,中位數(shù)為26,所以錯;日平均成交量為 ,超過42.7的只有一天,所以錯;由圖中可以看出,數(shù)據(jù)點并不是從左下分布至右上,所以錯;10月7日認購量增量為276-112=164,成交量增量為1 12、66-38=128,所以對,故選C.,考點1,考點2,考點3,回歸方程的求法及回歸分析,例2一次考試中,五名學生的數(shù)學、物理成績(單位:分)如下表所示: (1)要從5名學生中選2人參加一項活動,求選中的學生中至少有一人的物理成績高于90分的概率; (2)根據(jù)上表數(shù)據(jù),作出散點圖,并求變量y與x的相關系數(shù)說明物理成績y與數(shù)學成績x之間線性相關關系的強弱.如果具有較強的線性相關關系,求y與x的線性回歸方程(系數(shù)精確到0.01);如果不具有線性相關關系,請說明理由.,考點1,考點2,考點3,考點1,考點2,考點3,解 (1)從5名學生中任取2名學生的情況共有10種,其中至少有一人的物理成績高于90 13、分的情況有7種,故選中的學生中至少有一人的物理成績高于90分的概率為 (2)變量y與x的相關系數(shù) 可以看出,物理成績與數(shù)學成績高度正相關. 散點圖如圖所示. 從散點圖可以看出這些點大致分布在一條直 線附近,并且在逐步上升,故物理成績與數(shù)學成績正相關. 設y與x的線性回歸方程是y=bx+a, 根據(jù)所給的數(shù)據(jù),可以計算出 所以y與x的線性回歸方程是y=0.75x+20.25.,考點1,考點2,考點3,思考對已知的兩個變量的一組數(shù)據(jù)如何做回歸分析? 解題心得1.回歸直線方程中系數(shù)的2種求法 (1)公式法:利用公式,求出回歸系數(shù)b,a. (2)待定系數(shù)法:利用回歸直線過樣本點中心 求系數(shù). 2.回 14、歸分析的2種策略 (1)利用回歸方程進行預測:把回歸直線方程看作一次函數(shù),求函數(shù)值. (2)利用回歸直線判斷正、負相關:決定正相關還是負相關的是回歸系數(shù)b.,考點1,考點2,考點3,對點訓練2(2018河北衡水模擬二,19)下表是某學生在4月份開始進入沖刺復習至高考前的5次大型聯(lián)考數(shù)學成績(分):,(1)請畫出上表數(shù)據(jù)的散點圖:,考點1,考點2,考點3,考點1,考點2,考點3,解 (1)散點圖如圖:,考點1,考點2,考點3,考點1,考點2,考點3,獨立性檢驗 例3(2018全國3,文18改編)某工廠為提高生產(chǎn)效率,開展技術創(chuàng)新活動,提出了完成某項生產(chǎn)任務的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的 15、效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務的工作時間(單位:min)繪制了如下莖葉圖:,考點1,考點2,考點3,(1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由; (2)求40名工人完成生產(chǎn)任務所需時間的中位數(shù)m,并將完成生產(chǎn)任務所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表:,(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異?,考點1,考點2,考點3,解 (1)第二種生產(chǎn)方式的效率更高. 理由如下: 由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時 16、間至少80分鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至多79分鐘.因此第二種生產(chǎn)方式的效率更高. 由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為85.5分鐘,用第二種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為73.5分鐘.因此第二種生產(chǎn)方式的效率更高. 由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間高于80分鐘;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間低于80分鐘.因此第二種生產(chǎn)方式的效率更高.,考點1,考點2,考點3,由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖8上的最多,關于莖8大致呈對稱分布;用第二種生 17、產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖7上的最多,關于莖7大致呈對稱分布.又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布的區(qū)間相同,故可以認為用第二種生產(chǎn)方式完成生產(chǎn)任務所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務所需的時間更少.因此第二種生產(chǎn)方式的效率更高. 以上給出了4種理由,考生答出其中任意一種或其他合理理由均可得分.,考點1,考點2,考點3,考點1,考點2,考點3,思考獨立性檢驗得出的結(jié)論是什么?它對我們?nèi)粘I钣惺裁磶椭? 解題心得,考點1,考點2,考點3,對點訓練3(2018鄭州三模,18)在2018年3月鄭州第二次模擬考試中,某校共有100名文科學生參加考試,其中語文考試成績低于1 18、30的占95%,數(shù)學成績的頻率分布直方圖如圖: (1)如果成績不低于130的為特別優(yōu)秀,這100名學生中本次考試語文、數(shù)學成績特別優(yōu)秀的大約各多少人?,考點1,考點2,考點3,(2)如果語文和數(shù)學兩科都特別優(yōu)秀的共有3人. 從(1)中的這些同學中隨機抽取2人,求這兩人兩科成績都優(yōu)秀的概率. 根據(jù)以上數(shù)據(jù),完成22列聯(lián)表,并分析是否有99%的把握認為語文特別優(yōu)秀的同學,數(shù)學也特別優(yōu)秀.,考點1,考點2,考點3,解 (1)某校共有100名文科學生參加考試,其中語文考試成績低于130的占95%,語文成績特別優(yōu)秀的概率為P1=1-0.95=0.05,語文特別優(yōu)秀的同學有1000.05=5人,數(shù)學成績 19、特別優(yōu)秀的概率為P2=0.00220=0.04,數(shù)學特別優(yōu)秀的同學有1000.04=4人. (2)語文和數(shù)學兩科都優(yōu)秀的有3人,單科優(yōu)秀的有3人,記兩科都優(yōu)秀的3人分別為A1,A2,A3,單科優(yōu)秀的3人分別為B1,B2,B3,從中隨機抽取2人,共有:(A1,A2),(A1,A3),(A2,A3),(B1,B2),(B1,B3),(B2,B3),(A1,B1), (A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3) (A3,B1),(A3,B2),(A3,B3)共15種,其中這兩人成績都優(yōu)秀的有(A1,A2),(A1,A3),(A2,A3)3種,則這兩人兩科成績都優(yōu)秀的 20、概率為:,考點1,考點2,考點3,考點1,考點2,考點3,1.求回歸方程,關鍵在于正確求出回歸系數(shù)a,b.由于a,b的計算量大,因此計算時應仔細謹慎,分層進行,避免因計算而產(chǎn)生錯誤.(注意線性回歸方程中一次項系數(shù)為b,常數(shù)項為a,這與一次函數(shù)的習慣表示不同) 2.回歸分析是處理變量相關關系的一種數(shù)學方法.主要解決:(1)確定特定量之間是否有相關關系,如果有,就找出它們之間貼近的數(shù)學表達式;(2)根據(jù)一組觀測值,預測變量的取值及判斷變量取值的變化趨勢;(3)求出線性回歸方程. 3.根據(jù)2的值可以判斷兩個分類變量有關的可信程度,并用來指導科研和實際生活.,考點1,考點2,考點3,1.相關關系與函數(shù) 21、關系的區(qū)別 相關關系與函數(shù)關系不同,函數(shù)關系中的兩個變量之間是一種確定性關系.例如正方形面積S與邊長x之間的關系S=x2就是函數(shù)關系.相關關系是一種非確定性關系,即相關關系是非隨機變量與隨機變量之間的關系.例如商品的銷售額與廣告費之間的關系是相關關系.兩個變量具有相關關系是回歸分析的前提. 2.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性分布時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義.根據(jù)回歸方程進行預報,僅是一個預報值,而不是真實發(fā)生的值.,數(shù)學核心素養(yǎng)例釋數(shù)學建模 1.數(shù)學建模是對現(xiàn)實問題進行數(shù)學抽象,用數(shù)學語言表達問題、用數(shù)學知識 22、與方法構建模型解決問題的過程.主要包括:在實際情境中從數(shù)學的視角發(fā)現(xiàn)問題、提出問題,分析問題、構建模型,求解結(jié)論,驗證結(jié)果并改進模型,最終解決實際問題. 2.數(shù)學模型構建了數(shù)學與外部世界的橋梁,是數(shù)學應用的重要形式.數(shù)學建模是應用數(shù)學解決實際問題的基本手段,也是推動數(shù)學發(fā)展的動力.,典例(原創(chuàng)題)右圖是我國2011年至2017年生活垃圾無害化處理量(單位:億噸)的折線圖. 注:年份代碼17分別對應年份20112017 (1)由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明; (2)請建立y關于t的回歸方程(系數(shù)精確到0.01),預測2021年我國生活垃圾無害化處理量.,評析:先在實際問題中收集數(shù)據(jù),畫散點圖確定相關關系,再用最小二乘法求回歸方程,進而用回歸模型對實際問題進行預測.,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。