分類變量資料的統(tǒng)計分析 ppt課件
《分類變量資料的統(tǒng)計分析 ppt課件》由會員分享,可在線閱讀,更多相關《分類變量資料的統(tǒng)計分析 ppt課件(37頁珍藏版)》請在裝配圖網(wǎng)上搜索。
>計數(shù)資料的統(tǒng)計分析統(tǒng)計資料的類型數(shù)值變量 : 計量資料分類變量 : 計數(shù)資料 有序分類 : 變量之間有程度的差別 , 且排列有序 . (等級變量 )無序分類 : 二項分類多項分類變量的轉(zhuǎn)換 : 定量 定性連續(xù)型計量資料離散型計量資料第十章 分類變量資料的統(tǒng)計分析第一節(jié) 統(tǒng)計描述一 .描述指標 (相對數(shù) )1. 率 (rate) :單位 : %,‰,萬分率 ,10萬分率2. 構成比 (constituent ratio) 單位 : % 特點 :3. 相對比 (relative ratio)常用率比 ? 例 10-1某研究者 2000年對某校的初中生進行了近視患病情況調(diào)查 ,試計算各年級近視患病率和構成比及三年級和一年級患病率的相對比 .年級 檢查人數(shù) 患病人數(shù) 患病率 構成比 相對比一 年級 442 67 二年級 428 68三年級 405 74 合計 1275 209 16.39 100.015.16 32.0615.89 32.53 18.27 35.41 1.2二 . 應用相對數(shù)時注意事項1. 分母 不宜太小2. 率和構成比的區(qū)別3. 樣本含量不等的 幾個率的平均值 不等于 幾個率的算數(shù)平均值4. 對率或構成比進行比較時 ,應注意 資料的可比性5. 率的標準化6. 兩樣本率進行比較時應進行 假設檢驗三 .率的標準化1.基本思想 : 為消除內(nèi)部構成不同對指標的影響, 采用統(tǒng)一的內(nèi)部構成計算標準化率 ,使得出的標準化率具有可比性 .2.計算方法 : 直接法 : 已知各年齡組的實際發(fā)病率 ,用標準人口數(shù)或標準人口構成進行計算間接法 : 標準化死亡比 (SMR), 實際死亡數(shù)與預期死亡數(shù)的比3. 率的標準化應注意的問題第三節(jié) 率的標準化法 (standardization)西醫(yī)組 中西醫(yī)結(jié)合組 病型 病例數(shù) 治愈數(shù) 治愈率 (%) 病例數(shù) 治愈數(shù) 治愈率 (%) 普通型 60 36 60 20 13 65重型 20 8 40 60 27 45 爆發(fā)型 20 4 20 20 5 25合計 100 48 48 100 45 45例 : 某病兩種療法治愈率的比較西醫(yī)標準化治愈率 P'= 88÷200 = 44%中西醫(yī)標準化治愈率 P'= 98÷200 = 49%例 : 某病兩種療法治愈率的比較西醫(yī)組 中西醫(yī)結(jié)合組 病型 病例數(shù) 原治愈率 (%) 預期治愈數(shù) 原治愈率 (%) 預期治愈數(shù) 普通型 80 60 48 65 52重型 80 40 32 45 36 爆發(fā)型 40 20 8 25 10合計 200 88 98率的標準化1.基本思想 : 為消除 內(nèi)部構成不同 對指標的影響 , 采用 統(tǒng)一的內(nèi)部構成 計算標準化率 ,使得出的標準化率具有可比性 .2.計算方法 : 直接法 : 已知各年齡組的實際發(fā)病率 ,用標準人口數(shù)或標準人口構成進行計算間接法 : 標準化死亡比 (SMR), 實際死亡數(shù)與預期死亡數(shù)的比 3. 率的標準化應注意的問題? 由于內(nèi)部構成不同 ,影響到要比較的總率 ,需要標準化處理?? 標準化率只用于比較,已經(jīng)不代表實際的水平。? 各分組率有交叉 ,不能用標準化率比較? 抽樣得到的標準化率的比較 ,也應該進行假設檢驗 .第二節(jié) 計數(shù)資料統(tǒng)計推斷一 . 率的抽樣誤差和標準誤樣本率和總體率或樣本率之間存在的差異 ,稱抽樣誤差 .率的抽樣誤差用率的標準誤表示 .(?p or Sp).( p =陽性率 , 1- p=陰性率 )二 . 總體率的區(qū)間估計2. 查表法 : 當 n ≤50, 樣本率 p 接近與 0或 1時 ,該資料服從二項分布 ,用查表法估計樣本含量p ? u?× Sp1. 正態(tài)近似法 :np 和 n(1-p)>5條件 : n 足夠大 ,樣本率 p 或 1-p均不太小時 , 即例 10-5為了解某地乙肝表面抗原攜帶情況 ,某研究者在該地人群中隨機檢測了該地 200人 ,乙肝表面抗原陽性 7人 ,乙肝表面抗原攜帶率為 3.5%, 試計算標準誤并估計 95% 和 99% 可信區(qū)間 .95% 可信區(qū)間 : 3.5% ? 1.96 Sp99% 可信區(qū)間 : 3.5% ? 2.58 Spn=200 X=7, P=3.5% 三 . 兩個率比較的 u 檢驗當 np和 n(1-p) ≧ 5 時 樣本率的分布近似正態(tài)分布 — u 檢驗(一 ) 檢驗步驟 : 1. 建立假設 , 確定檢驗水準 αH0: H1:α =0.052. 選擇檢驗方法 , 計算 u 值3. 確定 P 值 , 判斷結(jié)果(二 )資料類型1. 樣本率與總體率的比較 (例 10-6)計算公式 :2. 兩個樣本率的比較 (例 10-7)計算公式 :第三節(jié) X2 檢驗 (chi-square test)基本思想檢驗實際頻數(shù)與理論頻數(shù)的吻合程度 ,實際頻數(shù)與理論頻數(shù)越相近 , X2 值越小 ; 反之 ,實際數(shù)與理論數(shù)相差越大 , X2值越大 .計算公式 :理論頻數(shù)的計算 : TRC= nRnC / ndf=(行數(shù) -1)(列數(shù) -1)例 10-8 某醫(yī)生用 A,B兩種藥物治療急性下呼吸道感染 .A藥治療 74例 ,有效 68例 ;B藥治療 63例 ,有效 52例 .問兩種藥物的有效率是否有差別 ?處理 有效 無效 合計 有效率(%)A 藥 68 6 74 91.89B 藥 52 11 63 82.54合計 120 17 137 87.59例 10-8 某醫(yī)生用 A,B兩種藥物治療急性下呼吸道感染 .A藥治療 74例 ,有效 68例 ;B藥治療 63例 ,有效 52例 .問兩種藥物的有效率是否有差別 ?處理 有效 無效 合計 有效率(%)A 藥 68 (64.82) 6 (9.18) 74 91.89B 藥 52 (55.18) 11(7.82) 63 82.54合計 120 17 137 87.59二 . Χ2 檢驗的基本步驟?建立檢驗假設 ,確定檢驗水準H0: ?1= ?2H1: ?1 ? ?2?=0.052. 計算 Χ2 值資料類型不同 ,計算公式不同3. 確定 P 值 , 判斷結(jié)果根據(jù)查 Χ2 界值表 , 確定 P值三 . 四格表資料的 Χ2 檢驗1. 四格表資料的 Χ2 檢驗的 專用公式df =(R-1)(C-1)=1?四格表資料的 Χ2 檢驗的校正-- Yates 連續(xù)校正校正公式 :校正的目的 :英國統(tǒng)計學家 (Yates)認為 ?2分布是一種連續(xù)性分布 ,而四格表中的資料屬離散性分布 ,得到的 ?2統(tǒng)計量的抽樣分布也是離散的 .因此 ,為改善 ?2統(tǒng)計量分布的連續(xù)性 ,建議進行校正 .連續(xù)性校正應遵循的條件 :1. T ? 5, 且 N ? 40時 , 用非校正的公式2. 1? T 40:當 b+c<40 時 , 用校正公式 . (McNemar 檢驗 )4. 行 ×列表資料的 ?2檢驗 (R ×C 表資料 )基本公式 : A — 每個格子的實際頻數(shù) nR – A所對應的行合計nC – A所對應的列合計例 10-12. 某研究者欲比較甲、乙、丙三家醫(yī)院住院患者院內(nèi)感染情況,隨機抽查同一時期住院患者感染情況,結(jié)果如下:試比較三家醫(yī)院院內(nèi)感染率有無差別。表 10-12 三家醫(yī)院住院患者的院內(nèi)感染率比較醫(yī)院 感染 未感染 合計合計 77 509 586甲 43 188 231乙 19 170 189丙 15 151 166H0:三家醫(yī)院院內(nèi)感染率相同H1:三家醫(yī)院院內(nèi)感染率不相同或不全相同α= 0.05 df=(行數(shù) -1)(列數(shù) -1)= (3- 1)(2- 1) =2查 X2界值表: X20.05(2)=5.99 X20.01(2)=9.21 按 α = 0.05,拒絕 H0,接受 H1,差別有統(tǒng)計學意義,即可認為三家醫(yī)院住院病人的院內(nèi)感染率有差別。然而,三者之間誰和誰有差別,還不知道。應該進一步進行兩兩比較兩兩比較,可采用 X2分割行 ?列表資料 ?2檢驗應注意事項1. 行 ?列表資料 ?2檢驗公式的應用條件 :不能有 1/5以上 的格子的 理論數(shù) <5,或者 ,不能有 1個格子 的 理論數(shù) <12. 如果資料不能滿足上述條件 ,則可以通過(1) 在可能的情況下再增加樣本量 ;(2)專業(yè)上允許的情況下 ,合并相鄰的行或列;(3) 刪去理論數(shù)太小的行和列3. 假設檢驗結(jié)果有差別 ,只能認為總的率或構成比有差別4. 單向有序變量(等級資料)的行 × 列表,不能用 X2檢驗比較組間效應,如果作 X2,只能說明個處理組間的效應在構成比上有無差別。表 10-12 中藥和西藥對某病的療效比較藥物 治愈 好轉(zhuǎn) 無效 合計合計 163 102 70 335中藥 78 42 32 152西藥 85 60 38 183小結(jié)計數(shù)資料的統(tǒng)計描述指標 : 率、構成比、相對比計數(shù)資料的統(tǒng)計推斷總體參數(shù)估計: P±uαSp率的假設檢驗: 樣本率與總體率的比較 -- u檢驗兩個大樣本率的比較 -- u檢驗兩個樣本率的比較 -- χ2檢驗配 對設計資 料的兩個率比 較 -- χ2檢驗多個 樣 本率的比 較 -- R×C表的 χ2檢驗假 設檢驗 的基本步 驟 完全相同統(tǒng)計資料處理的基本思路資料的整理 : 統(tǒng)計圖,統(tǒng)計表統(tǒng)計資料的描述 (描述指標)統(tǒng)計學推斷總體參數(shù)的估計(可信區(qū)間)假設檢驗 統(tǒng)計資料類型的判斷例 1. 某研究者欲比較甲乙兩藥治療高血壓的效果 ,進行了隨機對照試驗 .甲乙藥組各選擇了 50名病人 ,甲藥組血壓平均下降了 10.67mmHg,標準差是 3.27mmHg, 乙藥組平均下降了 13.20mmHg,標準差是 4.33mmHg. 問兩藥降壓效果是否不同 ?例 2. 為調(diào)查 2型糖尿病發(fā)病易感因素 ,某研究者進行了一項以醫(yī)院為基礎的病例對照研究 .結(jié)果發(fā)現(xiàn) ,在 200名糖尿病病例中 , 100人有糖尿病遺傳家族史 ;而 200名對照者中只有 50人有糖尿病家族史 .問糖尿病家族史是否在兩組中分布不同 ?例 3. 為比較 A,B,C,D四種藥物治療小細胞肺癌的效果 ,將 160人隨機分配進入四個治療組 .每組 40人 .治療結(jié)果見下表 ,試比較四種藥物治療效果有無差別 ?處理組 有效 無效 合計 . A 藥 15 25 40B 藥 10 30 40C 藥 13 27 40D 藥 8 32 40合計 46 114 160 .例 4. 用 A、 B兩種不同的方法對 58例系統(tǒng)紅斑狼瘡患者血清中的抗體進行測定,資料見下表,問兩種檢測結(jié)果有無差別 ?A 法 + -B 法 合計+ 11 12 23- 2 33 35合計 13 45 58 .例 5. 為研究鉛作業(yè)與工人尿鉛含量的關系 ,隨機抽查了 3種作業(yè)工人的尿鉛結(jié)果,見下表 .問 3種作業(yè)工人的尿鉛含量是否不同 ?鉛 作業(yè)組 調(diào)離鉛作業(yè)組 非鉛作業(yè)組 .0.01 0.11 0.090.16 0.23 0.020.24 0.18 0.050.18 0.14 0.020.28 0.20 0.010.14 0.12 0.10- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 分類 變量 資料 統(tǒng)計分析 ppt 課件
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://kudomayuko.com/p-278841.html