高考數學總復習 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 理.ppt
《高考數學總復習 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 理.ppt》由會員分享,可在線閱讀,更多相關《高考數學總復習 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 理.ppt(42頁珍藏版)》請在裝配圖網上搜索。
第 10 講,回歸分析與獨立性檢驗,1.會作兩個有關聯變量數據的散點圖,會利用散點圖認識變量間的相關關系. 2.了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程. 3.了解下列一些常見的統(tǒng)計方法,并能應用這些方法解決一些實際問題. (1)了解獨立性檢驗(只要求22列聯表)的基本思想、方法及其簡單應用. (2)了解假設檢驗的基本思想、方法及其簡單應用. (3)了解回歸的基本思想、方法及其簡單應用.,1.變量間的關系,(1)常見的兩變量之間的關系有兩類:一類是函數關系,另 一類是相關關系;與函數關系不同,相關關系是一種非確定性 關系.,(2)將樣本中 n 個數據點(xi,yi)(i=1,2,…,n)描在平面直 角坐標系中,表示兩個變量關系的一組數據的圖形叫做散點圖.,(3)正相關、負相關.,在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩,個變量的這種相關關系稱為正相關.,在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變,量的這種相關關系稱為負相關.,2.回歸分析,(1)定義:對具有相關關系的兩個變量進行統(tǒng)計分析的一種,常用方法.,(2)線性相關關系:,觀察散點圖的特征,如果散點圖中點的分布從整體上看大 致在一條直線附近,我們就稱這兩個變量之間具有線性相關關 系,這條直線叫做回歸直線.,(3)回歸直線的求法:,當 r0 時,表明兩個變量________.,負相關,r 的絕對值越接近于 1,表明兩個變量的線性相關性越強. r 的絕對值越接近于 0,表明兩個變量之間幾乎不存在線性相關 關系.通常|r|大于 0.75 時,認為兩個變量有很強的線性相關性.,(5)相關指數:,R2 的值越大,說明殘差平方和越小,也就是說模型的擬合 效果越好.在線性回歸模型中,R2 表示解釋變量對于預報變量 變化的貢獻率,R2 越接近于 1,表示回歸的效果越好. 3.獨立性檢驗 (1)分類變量:變量的不同“值”表示個體所屬的不同類 別,像這類變量稱為分類變量.,(2)列聯表:列出兩個分類變量的頻數表,稱為列聯表.假 設有兩個分類變量X 和Y,它們的可能取值分別為{x1,x2}和{y1, y2},其樣本頻數列聯表(稱為 22 列聯表)為,22 列聯表,a+b+c+d,(3)獨立性檢驗: 利用隨機變量 K2 來判斷“兩個分類變量有關系”的方法 稱為獨立性檢驗.,1.有關線性回歸的說法,不正確的是(,),D,A.相關關系的兩個變量是非確定關系 B.散點圖能直觀地反映數據的相關程度 C.回歸直線最能代表線性相關的兩個變量之間的關系 D.散點圖中的點越集中,兩個變量的相關性越強,2.(2013 年湖北)四名同學根據各自的樣本數據研究變量 x, y 之間的相關關系,并求得回歸直線方程,分別得到以下四個 結論:,其中一定不正確的結論的序號是(,),D,A.①②,B.②③,C.③④,D.①④,3.通過隨機詢問 110 名性別不同的大學生是否愛好某項運 動,得到如下的列聯表:,附表:,參照附表,得到的正確結論是(,),A,A.有 99%以上的把握認為“愛好該項運動與性別有關” B.有 99%以上的把握認為“愛好該項運動與性別無關” C.在犯錯誤的概率不超過 0.1%的前提下,認為“愛好該 項運動與性別有關” D.在犯錯誤的概率不超過 0.1%的前提下,認為“愛好該 項運動與性別無關”,P(K2≥k),4.(2013 年廣東江門一模)某產品的廣告費用 x 與銷售額 y 的統(tǒng)計數據如下表:,65.5,考點 1,線性回歸分析,例 1:已知 x 與 y 之間的幾組數據如下表:,答案:C,【互動探究】 1.(2014年湖北)根據如下樣本數據:,解析:依題意,畫散點圖,如圖 D52,兩個變量負相關,,圖 D52,答案:A,考點 2,獨立性檢驗,例 2:(2014 年安徽)某高校共有 15 000 人,其中男生有 10 500 人,女生有 4500 人,為調查該校學生每周平均體育運動時 間的情況,采用分層抽樣的方法,收集 300 位學生每周平均體 育運動時間的樣本數據(單位:小時). (1)應收集多少位女生樣本數據? (2)根據這 300 個樣本數據,得到學生每周平均體育運動時 間的頻率分布直方圖(如圖 9-10-1),其中樣本數據分組區(qū)間為: [0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學生每周 平均體育運動時間超過 4 個小時的概率.,圖 9-10-1,(3)在樣本數據中,有 60 位女生的每周平均體育運動時間 超過 4 個小時.請完成每周平均體育運動時間與性別的列聯表, 并判斷是否有 95%的把握認為“該校學生的每周平均體育運動 時間與性別有關”.,,解:(1)應收集女生樣本數據為 300,4500 15 000,=90.,(2)由頻率分布直方圖,得 1-2(0.100+0.025)=0.75,所 以該校學生每周平均體育運動時間超過 4 個小時的概率為 0.75.,P(K2≥k0),(3)由(2)知,300 名學生中有 3000.75=225 名學生每周平 均體育運動時間超過 4 個小時,75 名學生每周平均體育運動時 間不超過 4 個小時,又因為該數據中有男生 210 名,女生 90 名, 根據題意列表如下:,每周平均體育運動時間與性別列聯表,因此有 95%的把握認為“該校學生的每周平均體育運動時 間與性別有關”.,【規(guī)律方法】解決獨立性檢驗問題的一般步驟: ①制作列聯表;,要精確到小數點后三位; ③查表得出結論,要選擇滿足條件P(K2k0)=α的k0 作為拒 絕域的臨界值.,【互動探究】 2.(2014 年江西)某人研究中學生的性別與成績、視力、智 商、閱讀量這 4 個變量之間的關系,隨機抽查 52 名中學生,得 到統(tǒng)計數據如表 1 至表 4,這與性別有關聯的可能性最大的變,量是(,),A.成績,B.視力,C.智商,D.閱讀量,答案: D,考點 3,回歸分析的綜合運用,例 3:某興趣小組欲研究晝夜溫差大小與患感冒人數多少 之間的關系,他們分別到氣象局與某醫(yī)院抄錄了 1 至 6 月份每 月 10 日的晝夜溫差情況與因患感冒而就診的人數,得到如下資 料:,該興趣小組確定的研究方案是:先從這六組數據中選取 2 組,用剩下的 4 組數據求線性回歸方程,再用被選取的 2 組數 據進行檢驗. (1)求選取的 2 組數據恰好是相鄰兩個月的概率; (2)若選取的是 1 月與 6 月的兩組數據,請根據 2 至 5 月份 的數據,求出 y 關于 x 的線性回歸方程^y=b^x+a^; (3)若由線性回歸方程得到的估計數據與所選出的檢驗數 據的誤差均不超過 2 人,則認為得到的線性回歸方程是理想的, 試問該小組所得線性回歸方程是否理想?,(2)回歸分析是處理變量相關關系的一種數學方法.主要解 決:①確定特定量之間是否有相關關系,如果有,就找出它們 之間的數學表達式;②根據一組觀察值,預測變量的取值及判 斷變量取值的變化趨勢;③求出回歸直線方程.,【互動探究】,3.(2014年新課標Ⅱ)某地區(qū)2007年至2013年農村居民家庭人均收入y(單位:千元)的數據如下表:,(1)求y關于t的線性回歸方程; (2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農村居民家庭人均純收入的變化情況,并預測該地區(qū)2015年農村居民家庭人均收入.,●易錯、易混、易漏●,⊙對回歸分析的理解,例題:(2015 年廣東廣州調研)某位同學進行寒假社會實踐 活動,為了對白天平均氣溫與某奶茶店的某種飲料銷量之間的 關系進行分析研究,他分別記錄了 1 月 11 日至 1 月 15 日的白 天平均氣溫(單位:℃)與該奶茶店的這種飲料銷量(單位:杯), 所得數據如下表:,(1)若從這 5 組數據中隨機抽出 2 組,求抽出的 2 組數據恰 好是相鄰 2 天數據的概率;,解:(1)設“選取的 2 組數據恰好是相鄰 2 天數據”為事件 A. 所有基本事件(m,n)(其中m,n 為1 月份的日期數)有(11,12), (11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14), (13,15),(14,15),共 10 種.,事件 A 包括的基本事件有(11,12),(12,13),(13,14),(14,15), 共 4 種.,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 高考數學總復習 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 高考 數學 復習 第九 概率 統(tǒng)計 10 回歸 分析 獨立性 檢驗 課件
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://kudomayuko.com/p-2330817.html