MINITAB培訓-假設檢驗-方差-回歸-DOE-MSA.ppt
《MINITAB培訓-假設檢驗-方差-回歸-DOE-MSA.ppt》由會員分享,可在線閱讀,更多相關《MINITAB培訓-假設檢驗-方差-回歸-DOE-MSA.ppt(147頁珍藏版)》請在裝配圖網上搜索。
,,,,,一、假設檢驗,*************編,SIX SIGMA 培訓,二、方差分析,三、質量工具,四、試驗設計,,假設檢驗,假設檢驗的理解(Hypothesis Test),,對總體參數分布做假設,根據樣本(Sample)觀測值運用統(tǒng)計技術分析方法檢驗這種 假設是否正確,從而選擇接受或拒絕假設的過程。,,,,,假設 : 特定某總體是 , , , ex) 制造部男員工的平均 身高是172 cm.,原假設(Ho, Null Hypothesis) : 肯定 對立假設(H1 or Ha, Alternative Hypothesis) : 否定原假設,某總體(N),Sample,,根據Sample的數據 檢驗已設定的該總體的假設檢驗 → 原假設(Ho)設定 : 制造部男員工身高是172cm → 設定對立假設(H1 or Ha) : 不是172cm(或),,11 -1/22,,假設檢驗,假設檢驗的類別,,11 -2/22,,假設檢驗 Process,Graph 分析,Histogram, Box Plot, 散點圖等,致命因子選定,改善對象的明確化,,假設檢驗,,,Z Test, T Test, F test, ANOVA 等,,Graph 分析,,,Subgroup≥2,相關/回歸 分析,正規(guī)性檢證(Y),Chi-square Test,連續(xù)型 ?,1 Sample T-Test,分散同質性檢證(X),Subgroup =2,ANOVA,2 Sample T,Critical X 選定,,Yes,No,,No,Yes,No,Yes,,,,分析(A),相關分析,Yes,No,,,11 -3/22,,假設檢驗 Process,. 假設檢驗的步驟 a 建立對立假設和原假設 b 選擇顯著性水平(一般為5%) c 選擇檢驗方法 d 計算關于樣本的Data的P值. e 比較P值和顯著性水平導出結論 . P-Value - 在原假設設定為對的假設下,所觀測事件的概率 顯著水平為5%的情況下: P0.05時,接受原假設,拒絕對立假設; P0.05時,接受對立假設,拒絕原假設;,,11 -4/22,,Theme選定,活動范圍 選定,CTQ 明確化,對CTQ的 Gage R&R,工程能力 分析,,,,Define,Measure,假設檢驗 Process,什么時候使用假設檢驗?,Graph 解釋 假設檢驗,實驗計劃 (DOE),檢驗實驗,管理計劃,,Analysis,,Improve,,Control,對影響Y變動的潛在性的候補因子,各個實施假設檢驗 為了確認是否影響Y的因子而使用。 變更某Process以后,為了檢驗變更前后統(tǒng)計性的改變了沒有而使用。,,11 -5/22,,假設檢驗事例,1 Sample Z Test,1-Sample Z應用實例:,,加工一批零件,外園直徑的目標值為5.5mm,過去標準差為0.016,從加工的零件中抽取35個,測得直 徑如下:,11 -6/22,問該批零件外園直徑均值是否偏離目標值?,,假設檢驗事例,1 Sample Z Test,1-Sample Z應用實例:,,1、建立假設: H0:該批零件外園直徑均值μ=5.50; H1:該批零件外園直徑均值μ≠5.50; 2、確定信賴度為95%;則α=0.05; 3、選擇假設檢驗方法1 Sample Z; 應用MINITABL計算P=0.579; StatBasic Statistics1-Sample Z, 4、比較P0.05的大小,判定:接受H0,,11 -7/22,,,,出現對話框后: Variables欄中選外園直徑數值; SIGMA:欄中填0.016(總體σ) TEST MEAN欄中填5.50(目標均值) GRAPHS對話框可填可不填 OPTIONS 對話框: CONFIDENCE LEVEL:95.0(置信度水平) ALTERNATIVE: not equal(對立假設),One-Sample Z: sample實施結果: Test of mu = 5.5 vs mu not = 5.5 The assumed sigma = 0.016 Variable N Mean StDev SE Mean sample 35 5.50143 0.02390 0.00270 Variable 95.0% CI Z P sample ( 5.49613, 5.50673) 0.53 0.597,,,假設檢驗事例,1 Sample T Test,1 Sample T Test實例:,,Height 66.00 72.00 73.50 73.00 69.00 73.00 72.00 74.00 72.00 71.00 74.00 72.00 70.00 67.00 71.00 72.00 69.00 73.00 74.00 66.00,● 確認Height的平均個子是否70.(單,不知道母體的標準偏差.) - 原假設 : 平均個子 = 70 -對立假設 : 平均個子≠ 70,,Test of mu = 70 vs mu not = 70 Variable N Mean StDev SE Mean Height 20 71.175 2.561 0.573 Variable 95.0% CI T P Height (69.976, 72.374) 2.05 0.054,,,◎平均:71.175 ◎標準偏差:2.561 ◎平均的標準偏差:0.573 ◎母平均的95% 置信區(qū)間 :69.976 ~72.374 ◎p-value:0.054 ?p-value比0.05大,接受0假設.即,可以平均個子看作70 70包含在置信區(qū)間里面。,Minitab Menu : Stat / Basic Statistics/ 1 Sample T Test,* 注意 : 在Option 上各 greater than, less than, not equal的含義是什么 ?,,11 -8/22,,,,目標均值,,假設檢驗事例,2 Sample T Test,2 Sample T Test實例:,,例3:A、B兩種不同情況下測得某PCB焊點拉拔力數據如下: A:5.65 5.89 4.37 4.28 5.12 ; B:5.99 5.78 5.26 4.99 4.88;問兩種條件下PCB的焊點拉拔力是否有顯著區(qū)別? H0:A=B;H1:A≠B Minitab Menu : Stat / Basic Statistics/ 2 Sample T Test,11 -9/22,,,,數據,標注,,數據,,假設檢驗事例,2 Sample T Test,實施結果:,,P值比0.05大,接受H0;即2種條件下的PCB板焊點拔取力沒有差異 從平均值看B比A 拔取力大 總體均值的置信區(qū)間:(--1.278,0.642),Two-sample T for A vs B N Mean StDev SE Mean A 5 5.062 0.729 0.33 B 5 5.380 0.487 0.22 Difference = mu A - mu B Estimate for difference: -0.318 95% CI for difference: (-1.278, 0.642) T-Test of difference = 0 (vs not =): T-Value = -0.81 P-Value = 0.448 DF = 6,11 -10/22,,,假設檢驗事例,成對數據的假設檢驗,,●英語分數向上程序運營后,比較程序實施前和實施后的英語分數,檢討向上程序是否實際上很有用 程序實施前/后的分數入以下時,檢討程序是否有利于英語分數向上.(各 10個隨意抽出),Before after 76 81 60 52 85 87 58 70 91 86 75 77 82 90 64 63 79 85 88 83,,Paired T-Test and CI: before, after Paired T for before - after N Mean StDev SE Mean before 10 75.80 11.64 3.68 after 10 77.40 12.18 3.85 Difference 10 -1.60 6.38 2.02 95% CI for mean difference: (-6.16, 2.96) T-Test of mean difference=0(vs not=0):T-Value=-0.79 P-Value=0.448,,,Minitab Menu : Stat / Basic Statistics/ Paired T,Paired T : CI Mean Difference 2 Sample T : CI Difference,Paired T,11 -11/22,,假設檢驗事例,1-Proportion,,◆ DID 事業(yè)部為了確認A 廠家的6sigma的PJT成果,調查了300個sample,出現了15個不良品. A 廠家交貨部品的目標不良率為15% ,能不能看做目標達成了 ?,Minitab Menu : stat /Basic Statistics/1-Proportion,,,Click,Test of p = 0.15 vs p not = 0.15 Sample X N Sample p 95.0% CI P-Value 1 15 300 0.050 (0.028251,0.081127) 0.000,,,▼ 實行結果,11 -12/22,,假設檢驗事例,,2-Proportion,◆ DID事業(yè)部為了比較 A,B兩個line上發(fā)生的不良率,收集了Data.其結果A Line上1000個當中有75個不良, B Line 上1500個當中發(fā)現了120個不良。能不能看作Line間不良率有差異?,Minitab Menu : stat /Basic Statistics/2-Proportion,,Test and CI for Two Proportions Sample X N Sample p 1 75 1000 0.075000 2 120 1500 0.080000 Estimate for p(1) - p(2): -0.005 95% CI for p(1) - p(2): (-0.0263305, 0.0163305) Test for p(1)-p(2)=0(vs not=0): Z=-0.46 P-Value=0.646,,,◎P-value : 0.646(64.6%) ?P-value值大,因此可以說0假設是對的。 即,可以說A ,B兩個line上所發(fā)生的不良率 沒有差異。,11 -13/22,,,,假設檢驗事例,,◆ 需同時檢驗多個樣本均值有無差異時,需要用到方差分析,建立假設: H0:膠水A粘接力均值=膠水B粘接力均值=膠水C的粘接力均值 H1:膠水A粘接力均值≠膠水B粘接力均值≠膠水C的粘接力均值 確定顯著水平:α=0.05 選擇假設檢驗類別:單變量方差分析 Minitab 計算P值。,11 -14/22,例:想了解三種不同膠水對元件粘接力的影響,分別測得不同膠水粘接力如下:,問三種膠水粘接力均值有無差異?,,假設檢驗事例,,,11 -15/22,Stat ANOVA One-way(Unstacked),,,注:Unstacked 指不同條件的數據存儲在不同列的狀態(tài),實施結果:One-way ANOVA: A, B, C Analysis of Variance Source DF SS MS F P Factor 2 0.145 0.073 0.26 0.778 Error 15 4.273 0.285 Total 17 4.419 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+-------- A 6 5.6767 0.5823 (------------*------------) B 6 5.5433 0.5558 (------------*-------------) C 6 5.4583 0.4547 (------------*------------) --------+---------+---------+-------- Pooled StDev = 0.5338 5.25 5.60 5.95,,假設檢驗事例,,2-Proportion,11 -16/22,,,P》0.05,因此接受零假設H0,,A、B、C膠水粘接力均值數據置信區(qū)間有重合部分,,假設檢驗事例,,2VARIANCES,11 -17/22,對兩個總體的分布狀況進行比較,如對兩個車床所加工出來的零件尺寸精度的比較,這時會用到F檢驗。,例:兩臺車床加工一批零件,為了解兩臺車床加工精度方面有無差異,各抽取10個零件測得尺寸A數值如下:車床1:25.3,25.2,25.2,25.5,25.52,25.51,25.54,25.55,25.5,25.52; 車床2: 25.5,25.55,25.56,25.49,25.48,25.53,25.52,25.54,25.5,25.47; 問:兩臺車床加工精度有無差異?,步驟: H0:車床1加工的工件尺寸A的標準差=車床2加工的工件尺寸A的標準差 H1:車床1加工的工件尺寸A的標準差≠車床2加工的工件尺寸A的標準差 確定α=0.05 選擇假設檢驗類別F檢驗法; 例用MINITAB 計算P Minitab StatBasic Statistics2 Variances,,假設檢驗事例,,2-Proportion,11 -18/22,,假設檢驗事例,,2-Proportion,,11 -19/22,Test for Equal Variances Level1 CHE1 Level2 CHE2 ConfLvl 95.0000 Bonferroni confidence intervals for standard deviations Lower Sigma Upper N Factor Levels 4.66E-02 7.13E-02 0.143584 10 CHE1 2.00E-02 3.06E-02 0.061664 10 CHE2 F-Test (normal distribution) Test Statistic: 5.422 P-Value : 0.019 Levene's Test (any continuous distribution) Test Statistic: 0.077 P-Value : 0.785,,接受零假設,兩臺車床加工精度沒有差異,,假設檢驗事例,,2-Proportion,11 -20/22,在需要同時比較多個方差的場合,需進行多樣本方差檢驗,四臺設備同時加工一種工件,為了解4臺設備的精度有無差異,每臺設備抽樣10PCS測得尺寸如下(略),問四臺設備精度是否有差異?,H0:。。。。。。;H1:。。。。。。,MINTAB 工作表數據:,Stat ANOVA Test for Equal Variances,,,假設檢驗事例,,2-Proportion,11 -21/22,Response SIZE Factors EQUIP ConfLvl 95.0000 Bonferroni confidence intervals for standard deviations Lower Sigma Upper N Factor Levels 1.84368 2.94581 6.5147 10 A 3.29134 5.25885 11.6301 10 B 3.13351 5.00666 11.0723 10 C 2.76454 4.41714 9.7686 10 D Bartlett's Test (normal distribution) Test Statistic: 3.055 P-Value : 0.383 Levene's Test (any continuous distribution) Test Statistic: 0.295 P-Value : 0.829,,,,,,假設檢驗事例,,2-Proportion,11 -22/22,根據上圖結果Bartlett檢驗法和Levene檢驗法得出一致結論,P值大于0.05,所以認為四臺車床加工的工件精度沒有顯著差異. 有時會存在Bartlett檢驗法和Levene檢驗法得出的結論不一致的問題,這時可檢驗數據的正態(tài)性,如為正態(tài)分布數據,則以Bartlett檢驗法為結論.如為非正態(tài)分布,則以Levene檢驗法為準.,2.3 統(tǒng)計技術方法,2.3.1 方差分析 2.3.2 回歸分析 2.3.3 試驗設計,2.3.1 方差分析,一、幾個概念 二、單因子方差分析 三、重復數不等的情況,一、幾個概念,在試驗中改變狀態(tài)的因素稱為因子,常用大寫英文字母A、B、C、…等表示。 因子在試驗中所處的狀態(tài)稱為因子的水平。用代表因子的字母加下標表示,記為A1,A2,…,Ak。 試驗中所考察的指標(可以是質量特性也可以是產量特性或其它)用Y表示。Y是一個隨機變量。 單因子試驗: 若試驗中所考察的因子只有一個。,[例2.1-1] 現有甲、乙、丙三個工廠生產同一種零件,為了了解不同工廠的零件的強度有無明顯的差異,現分別從每一個工廠隨機抽取四個零件測定其強度,數據如表所示,試問三個工廠的零件的平均強度是否相同?,三個工廠的零件強度,在這一例子中,考察一個因子: 因子A:工廠 該因子有三個水平:甲、乙、丙 試驗指標是:零件強度,這是一個單因子試驗的問題。每一水平下的試驗結果構成一個總體,現在需要比較三個總體均值是否一致。如果每一個總體的分布都是正態(tài)分布,并且各個總體的方差相等,那么比較各個總體均值是否一致的問題可以用方差分析方法來解決。,二、單因子方差分析,假定因子A有r個水平,在Ai水平下指標服從正態(tài)分布,其均值為 ,方差為 ,i=1,2, …, r。每一水平下的指標全體便構成一個總體,共有r個總體,這時比較各個總體的問題就變成比較各個總體的均值是否相同的問題了,即要檢驗如下假設是否為真:,當 不真時,表示不同水平下的指標的均值有顯著差異,此時稱因子A是顯著的,否則稱因子A不顯著。檢驗這一假設的分析方法便是方差分析。,方差分析的三個基本假定,1. 在水平 下,指標服從正態(tài)分布 ;,2. 在不同水平下,各方差相等;,3. 各數據 相互獨立。,設在一個試驗中只考察一個因子A,它有r個水平,在每一水平下進行m次重復試驗,其結果用 表示,i=1,2, …, r。 常常把數據列成如下表格形式:,單因子試驗數據表,記第i水平下的數據均值為 ,總均值為 。此時共有n=rm個數據,這n個數據不全相同,它們的波動(差異)可以用總離差平方和ST去表示,記第i 水平下的數據和為Ti, ;,引起數據波動(差異)的原因不外如下兩個:,一是由于因子A的水平不同,當假設H0不真時,各個水平下指標的均值不同,這必然會使試驗結果不同,我們可以用組間離差平方和來表示,也稱因子A的離差平方和:,這里乘以m是因為每一水平下進行了m次試驗。,二是由于存在隨機誤差,即使在同一水平下獲得的數據間也有差異,這是除了因子A的水平外的一切原因引起的,我們將它們歸結為隨機誤差,可以用組內離差平方和表示:,Se:也稱為誤差的離差平方和,可以證明有如下平方和分解式:,ST、SA、Se 的自由度分別用 、 、 表示,它們也有分解式: ,其中:,因子或誤差的離差平方和與相應的自由度之比稱為因子或誤差的均方和,并分別記為:,兩者的比記為:,當 時認為在顯著性水平 上因子A是顯著的。其中 是自由度為 的F分布的1-α分位數。,單因子方差分析表,各個離差平方和的計算:,其中 是第i個水平下的數據和;T表示所有n=rm個數據的總和。,進行方差分析的步驟如下:,(1)計算因子A的每一水平下數據的和T1,T2,…,Tr及總和T;,(2)計算各類數據的平方和 ;,(3)依次計算ST,SA,Se;,(4)填寫方差分析表;,(5)對于給定的顯著性水平α,將求得的F值與F分布表中的臨界值 比較,當 時認為因子A是顯著的,否則認為因子A是不顯著的。,對上例的分析,(1)計算各類和:,每一水平下的數據和為:,數據的總和為T=1200,(2)計算各類平方和:,原始數據的平方和為:,每一水平下數據和的平方和為,(3)計算各離差平方和:,ST=121492-12002/12=1492, fT=3×4-1=11 SA=485216/4-12002/12=1304, fA=3-1=2 Se= 1492-1304=188, fe=11-2=9,(4)列方差分析表:,[例2.1-1]的方差分析表,(5) 如果給定 =0.05,從F分布表查得,由于F4.26,所以在 =0.05水平上結論是因子A是顯著的。這表明不同的工廠生產的零件強度有明顯的差異。,當因子A是顯著時,我們還可以給出每一水平下指標均值的估計,以便找出最好的水平。在單因子試驗的場合,第i個水平指標均值的估計為:,,,在本例中,三個工廠生產的零件的平均強度的的估計分別為:,由此可見,乙廠生產的零件的強度的均值最大,如果我們需要強度大的零件,那么購買乙廠的為好;而從工廠來講,甲廠與丙廠應該設法提高零件的強度。,誤差方差的估計:這里方差 的估計是MSe。在本例中: 的估計是20.9。,的估計是,[例2.1-2] 略(見教材P92),三、重復數不等的情況,若在每一水平下重復試驗次數不同,假定在Ai水平下進行 次試驗,那么進行方差分析的步驟仍然同上,只是在計算中有兩個改動:,例2.1-3 某型號化油器原中小喉管的結構使油耗較大,為節(jié)約能源,設想了兩種改進方案以降低油耗。油耗的多少用比油耗進行度量,現在對用各種結構的中小喉管制造的化油器分別測定其比油耗,數據如表所列,試問中小喉管的結構(記為因子A)對平均比油油耗的影響是否顯著。(這里假定每一種結構下的油耗服從等方差的正態(tài)分布),[例2.1-3]的試驗結果,(為簡化計算,這里一切數據均減去220,不影響F比的計算及最后分析因子的顯著性),(1)各水平下的重復試驗次數及數據和分別為:,A1:m1=8,T1=69.5 A2:m2=4,T2=6.0 A3:m3=4,T3=15.4,總的試驗次數n=16,數據的總和為T=90.9,(2)計算各類平方和:,,,(3)計算各離差平方和:,ST=757.41-516.43=240.98, fT=16-1=15 SA=672.07-516.43=155.64, fA=3-1=2 Se= 240.98-155.64=85.34, fe=15-2=13,(4)列方差分析表:,[例2.1-3]方差分析表,(5) 如果給定 =0.05,從F分布表查得,由于F3.81,所以在α=0.05水平上我們的結論是因子A是顯著的。這表明不同的中小喉管結構生產的化油器的平均比油耗有明顯的差異。,我們還可以給出不同結構生產的化油器的平均比油耗的估計:,這里加上220是因為在原數據中減去了220的緣故。,由此可見,從比油耗的角度看,兩種改進結構都比原來的好,特別是改進結構1。,在本例中誤差方差的估計為6.56,標準差的估計為2.56。,2.3.2 回歸分析,例2.2-1 合金的強度y與合金中的碳含量x有關。為了生產出強度滿足顧客需要的合金,在冶煉時應該如何控制碳含量?如果在冶煉過程中通過化驗得到了碳含量,能否預測合金的強度?,這時需要研究兩個變量間的關系。首先是收集數據(xi,yi),i=1,2, …,n?,F從生產中收集到表2.2-1所示的數據。,表2.2-1 數據表,一、散布圖,[例2.2-1]的散布圖,二、相關系數,1.相關系數的定義,在散布圖上 n 個點在一條直線附近,但又不全在一條直線上,稱為兩個變量有線性相關關系,可以用相關系數 r 去描述它們線性關系的密切程度,其中,性質:,表示n個點在一條直線上,這時兩個變量間完全線性相關。,r0表示當x增加時y也增大,稱為正相關,r0表示當x增加時y減小,稱為負相關,r=0表示兩個變量間沒有線性相關關系,但并不排斥兩者間有其它函數關系。,2.相關系數的檢驗,若記兩個變量x和y理論的相關系數為 ,其中x為一般變量,y服從等方差的正態(tài)分布,則,對給定的顯著性水平 ,當 可以認為兩者間存在一定的線性相關關系, 可以從表2.2-2中查出。(其中n為樣本量)。,3.具體計算,求上例的相關系數:,步驟如下:,(1)計算變量x與y的數據和:,Tx= =1.90, Ty= =590.5,(2)計算各變量的平方和與乘積和:,(3)計算Lxx,Lyy,Lxy:,Lxy =95.9250-1.90×590.5/12=2.4292,Lxx =0.3194-1.902/12=0.0186,Lyy =29392.75-590.52/12=335.2292,,(4)計算r:,在 =0.05時, ,由于r0.576,說明兩個變量間有(正)線性相關關系。,四、一元線性回歸方程,1. 一元線性回歸方程的求法:,一元線性回歸方程的表達式為,其中a與b使下列離差平方和達到最?。?通過微分學原理,可知,,,稱這種估計為最小二乘估計。,b 稱為回歸系數;a一般稱為常數項。,? 求一元線性回歸方程的步驟如下:,(1)計算變量x與y的數據和Tx,Ty; (2)計算各變量的平方和與乘積和; (3)計算Lxx,Lxy; (4)求出b與a;,利用前面的數據,可得:,b=2.4392/0.0186=130.6022,a=590.5/12-130.6022 ×1.90/12=28.5297,(5)寫出回歸方程:,畫出的回歸直線一定通過(0,a)與 兩點,上例:,或,2. 回歸方程的顯著性檢驗,有兩種方法:,一是用上述的相關系數;,二是用方差分析方法(為便于推廣到多元線性回歸的場合),將總的離差平方和分解成兩個部分:回歸平方和與離差平方和。,總的離差平方和:,回歸平方和:,離差平方和:,且有ST=SR+SE,其中,它們的自由度分別為:,fT=n-1,fR=1,fE=n-2=fT-fR,計算F比,,對給定的顯著性水平 ,當 時認為回歸方程是顯著的,即回歸方程是有意義的。一般也列成方差分析表。,對上面的例子,作方差分析的步驟如下:,根據前面的計算,(1)計算各類平方和:,ST=Lyy=335.2292, fT=12-1=11 SR=bLxy=130.6022×2.4292=317.2589,fR=1 SE=335.2292-317.2589=17.9703, fE=11-1=10,(2)列方差分析表:,[例2.2-1]的方差分析表,對給定的顯著性水平 =0.05,有,F0.95(1,10)=4.96,由于F4.96,所以在0.05水平上認為回歸方程是顯著的(有意義的)。,3.利用回歸方程進行預測,對給定的 ,y的預測值為,概率為 的y的預測區(qū)間是,其中,當n較大, 與 相差不大,那么可給出近似的預測區(qū)間,此時,進行預測的步驟如下:,(1)對給出的x0求預測值,上例,設x0 =0.16,則,(2)求 的估計,上例有,(3)求,上例n=12,如果求概率為95%的預測區(qū)間,那么t0.975(10)=2.228,所以,(4)寫出預測區(qū)間,上例為(49.43-3.11,49.43+3.11)=(46.32,52.54),由于u0.975=1.96,故概率為0.95的近似的預測區(qū)間為:,∵,∴,所求區(qū)間:,(49.43-2.63,49.43+2.63)=(46.80,52.06),相差較大的原因總n較小。,四、可化為一元線性回歸的曲線回歸,在兩個重復的散布圖上,n個點的散布不一定都在一條直線附近波動,有時可能在某條曲線附近波動,這時以建立曲線回方程為好。,1. 確定曲線回歸方程形式,2. 曲線回歸方程中參數的估計,通過適當的變換,化為一元線性回歸的形式,再利用一元線性回歸中的最小二乘估計方法獲得。,回歸曲線的形式:,(1) ,(a0,b0),(2) ,(b0),(3) ,(b0),(4) ,(b0),3. 曲線回歸方程的比較,常用的比較準則:,(1)要求相關指數R大,其平方也稱為決定系數,它被定義為:,(2)要求剩余標準差s小,它被定義為:,2.3.3 試驗設計,一、試驗設計的基本概念與正交表,(一)試驗設計,多因素試驗遇到的最大困難是試驗次數太多,若十個因素對產品質量有影響,每個因素取兩個不同狀態(tài)進行比較,有210=1024、如果每個因素取三個不同狀態(tài)310=59049個不同的試驗條件,? 選擇部分條件進行試驗,再通過數據分析來尋找好的條件,這便是試驗設計問題。通過少量的試驗獲得較多的信息,達到試驗的目的。,? 利用正交表進行試驗設計的方法就是正交試驗設計。,(二)正交表,,“L”表示正交表,“9”是表的行數,在試驗中表示試驗的條件數,“4”是列數,在試驗中表示可以安排的因子的最多個數,“3”是表的主體只有三個不同數字,在試驗中表示每一因子可以取的水平數。,正交表具有正交性,這是指它有如下兩個特點:,(1)每列中每個數字重復次數相同。,在表L9(34)中,每列有3個不同數字:1,2,3,每一個出現3次。,(2)將任意兩列的同行數字看成一個數對,那 么一切可能數對重復次數相同。,在表L9(34)中,任意兩列有9種可能的數對: (1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)每一對出現一次。,常用的正交表有兩大類,(1) 一類正交表的行數n,列數p,水平數q 間有如下關系:,n=qk, k=2,3,4,…, p=(n-1)/(q-1),如:L4(23),L8(27),L16(215),L32(231)等,可以考察因子間的交互作用。,(2)另一類正交表的行數,列數,水平數之間 不滿足上述的兩個關系,如: L12(211),L18(37),L20(219),L36(313)等,? 這類正交表不能用來考察因子間的交互作用,? 常用正交表見附錄,二、無交互作用的正交設計與數據分析,試驗設計一般有四個步驟:,1. 試驗設計 2. 進行試驗獲得試驗結果 3. 數據分析 4. 驗證試驗,例2.3-1 磁鼓電機是彩色錄像機磁鼓組件的關鍵部件之一,按質量要求其輸出力矩應大于210g.cm。某生產廠過去這項指標的合格率較低,從而希望通過試驗找出好的條件,以提高磁鼓電機的輸出力矩。,(一)試驗的設計,在安排試驗時,一般應考慮如下幾步:,(1)明確試驗目的,(2)明確試驗指標,(3)確定因子與水平,(4)選用合適的正交表,進行表頭設計,列出試驗計劃,在本例中:,試驗目的:提高磁鼓電機的輸出力矩,試驗指標:輸出力矩,確定因子與水平:經分析影響輸出力矩的可能因 子及水平見表2.3-2,表2.3-2 因子水平表,選表:首先根據因子的水平數,找出一類正交表,再根據因子的個數確定具體的表,把因子放到表的列上去,稱為表頭設計把放因子的列中的數字改為因子的真實水平,便成為一張試驗計劃表,每一行便是一個試驗條件。在正交設計中n個試驗條件是一起給出的的,稱為“整體設計”,并且均勻分布在試驗空間中。,試驗計劃與試驗結果,9個試驗點的分布,(二)進行試驗,并記錄試驗結果,在進行試驗時,要注意幾點:,1. 除了所考察的因子外的其它條件,盡可能保持相同,2. 試驗次序最好要隨機化,3. 必要時可以設置區(qū)組因子,(三)數據分析,1. 數據的直觀分析,(1)尋找最好的試驗條件,在A1水平下進行了三次試驗:#1,#2,#3,而在這三次試驗中因子B的三個水平各進行了一次試驗,因子C的三個水平也各進行了一次試驗。,在A2水平下進行了三次試驗:#4,#5,#6,在這三次試驗中因子B與C的三個水平各進行了一次試驗。,在A3水平下進行了三次試驗:#7,#8,#9,在這三次試驗中因子B與C的三個水平各進行了一次試驗。,將全部試驗分成三個組,那么這三組數據間的差異就反映了因子A的三個水平的差異,為此計算各組數據的和與平均:,? T1=y1+y2+y3=160+215+180=555,,=T1/3=185,? T2=y4+y5+y6=168+236+190=594,,=T2/3=198,? T3=y7+y8+y9=157+205+140=502,,=T3/3=167.3,同理,對因子B與C將數據分成三組分別比較,所有計算列在下面的計算表中,例2.3-1直觀分析計算表,(2)各因子對指標影響程度大小的分析 極差的大小反映了因子水平改變時對試驗結果的影響大小。這里因子的極差是指各水平平均值的最大值與最小值之差,譬如對因子A來講:,RA=198-167.3=30.7,其它的結果也列在上表中。從三個因子的極差可知因子B的影響最大,其次是因子A,而因子C的影響最小。,(3)各因子不同水平對指標的影響圖,從圖上可以明顯地看出每一因子的最好水平A2,B2,C3,也可以看出每個因子對指標影響的大小RBRARC。,圖2.3-2 因子各水平對輸出力矩的影響,由于正交表的特點,使試驗條件均勻分布在試驗空間中,因此使數據間具有整齊可比性,上述的直觀分析可以進行。但是極差大到什么程度可以認為水平的差異確實是有影響的呢?,2. 數據的方差分析,要把引起數據波動的原因進行分解,數據的波動可以用離差平方和來表示。,正交表中第j列的離差平方和的計算公式:,其中Tij為第j列第i水平的數據和,T為數據總和,n為正交表的行數,q為該列的水平數,該列表頭是哪個因子,則該Sj即為該因子的離差平方和,譬如SA=S1,正交表總的離差平方和為:,在這里有:,[例2.3-1]的方差分析計算表,? 第4列上沒有放因子,稱為空白列。S4僅反映由誤差造成的數據波動,稱為誤差平方和。,Se=S4,? 利用 可以驗證平方和的計算是否正確。,[例2.3-1]的方差分析表,因子A與B在顯著性0.10與0.05上都是顯著的,而因子C不顯著。,3. 最佳條件的選擇,對顯著因子應該取最好的水平;,對不顯著因子的水平可以任意選取,在實際中通常從降低成本、操作方便等角度加以選擇。,上面的例子中對因子A與B應該選擇A2B2,因子C可以任選,譬如為節(jié)約材料可選擇C1。,4. 貢獻率分析方法,當試驗指標不服從正態(tài)分布時,進行方差分析的依據就不夠充足,此時可通過比較各因子的“貢獻率”來衡量因子作用的大小。由于S因中除因子的效應外,還包含誤差,從而稱S因-f因Ve為因子的純離差平方和,將因子的純離差平方和與ST的比稱為因子的貢獻率。,(四)驗證試驗,對A2B2C1進行三次試驗,結果為:234,240,220,平均值為231.3此結果是滿意的,三、有交互作用的正交設計與數據分析,例2.3-2 為提高某種農藥的收率,需要進行試驗。,(一)試驗的設計,? 明確試驗目的,? 明確試驗指標,? 確定試驗中所考慮的因子與水平,并確定可能存在并要考察的交互作用,? 選用合適的正交表。,在本例中:,試驗目的:提高農藥的收率,試驗指標:收率,確定因子與水平以及所要考察的交互作用:,因子水平表,還要考察因子A與B交互作用,選表:首先根據因子的水平數,找出一類正交表再根據因子的個數及交互作用個數確定具體的表。,把因子放到表的列上去,但是要先放有交互作用的兩個因子,并利用交互作用表,標出交互作用所在列,以便于今后的數據分析。,把放因子的列中的數字改為因子的真實水平,便成為一張試驗計劃表。,L8(27)的交互作用表,試驗計劃,(二)數據分析,1. 數據的方差分析,在二水平正交表中一列的離差平方和有一個簡單的計算公式:,其中T1j、T2j分別是第j列一水平與二水平數據的和,n是正交表的行數,[例2.3-2]的計算表,[例2.3-2]的方差分析表,,,,,,,,,,,,,,,,,,,,其中:,SA=S1,SB=S2,SC=S4,SD=S7,SA×B=S3,Se=S5+S6,fA=fB=fC=fD=fA×B=1,fe=2,A×B的搭配表,2. 最佳條件的選擇,故最佳條件是:A2B1C2,A2B1的搭配為好,C取2水平為好。,(三)避免混雜現象——表頭設計的一個原則,選擇正交表時必須滿足下面一個條件:“所考察的因子與交互作用自由度之和≤n-1”,其中n是正交表的行數。不過在存在交互作用的場合,這一條件滿足時還不一定能用來安排試驗,所以這是一個必要條件。,例2.3-3 給出下列試驗的表頭設計:,(1)A、B、C、D為二水平因子,同時考察交互作用A×B,A×C,(2)A、B、C、D為二水平因子,同時考察交互作用A×B,C×D,(3)A、B、C、D、E為三水平因子,同時考察交互作用A×B,它們分別要用L8(27),L16(215),L27(313),測量系統(tǒng)分析(MSA),測量系統(tǒng)基本要求,準確性 Accuracy,精確性 Precision,測量系統(tǒng)基本要求,+,線性性 (Linearity),偏度(Bias),穩(wěn)定性(Stability),重復性(Repeatability),再現性(Reproducibility),準確性和精確性,,,,準確性描述了測量值和真實值之間的差異 精確性描述了使用同一工具重復測量相同部件時存在的差異,偏倚 (Bias),測量系統(tǒng)誤差的類型,觀測到的平均觀測值 和基準值之間的差異,穩(wěn)定性 (Stability),,測量系統(tǒng)誤差的類型,隨著時間推移 系統(tǒng)測量的準確性,線性 (Linearity),測量系統(tǒng)誤差的類型,部件的大小 如何影響測量系統(tǒng)的 準確性,重復性 (Repeatability),由同一操作者對同一部件用同一測量儀器的多次測量,測量系統(tǒng)誤差的類型,再現性 (Reproducibility),由不同操作者對同一部件用同一測量儀器的測量,測量系統(tǒng)誤差的類型,測量重復性和再現性 Gage R&R (repeatability and reproducibility),適用于所有列入控制計劃的測量系統(tǒng) 計量型 (Variable) 計數型 (Attribute),測量系統(tǒng)分析,測量重復性和再現性可接受標準 低于10% 誤差 -- 測量系統(tǒng)可接受 10% 至 30% 誤差 -- 考慮重要性、量具成本、維修成本可能接受 大于30%的誤差-- 需改,測量系統(tǒng)分析,Minitab中有關MSA部分,,,測量趨勢圖 測量線性和偏倚分析 測量重復性和再現性分析(交叉) 測量重復性和再現性分析(嵌套) 屬性協(xié)議分析,測量重復性和再現性研究,Gage R&R Study可對交叉式數據(crossed)和嵌套式數據(nested)進行精確性分析.,在Minitab如何組織這兩種數據的?,數據組織方式的差異,,,,,,,,,,相同,,,,不同,交叉式數據,嵌套式數據,交叉式數據分析,交叉式數據分析分為均值極差法(Xbar-R)和方差法(ANOVA)分析 均值極差法不考慮操作者與測量對象之間的交互作用 均值極差法將總測量變差分為三類:部件-部件,重復性和再現性 方差法將總測量變差分為四類:部件-部件,重復性,操作者,操作者-部件交互作用,交叉式數據分析-均值極差法,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGEAIAG.MTW 從菜單選擇StatQuality ToolsGage StudyGage R&R Study(Crossed),交叉式數據分析-均值極差法,,,,,包含測量對象名稱或編號的列,包含操作者名稱或編號的數據列,包含測量值的列,,,選擇均值極差法,交叉式數據分析-均值極差法,,過程公差處輸入8,交叉式數據分析-均值極差法,結果分析: 量具分辨率(Number of Distinct Categories)反映了測量系統(tǒng)能夠區(qū)分的過程數據的分組數.當該值大于5時,可接受.當小于2的時候,測量系統(tǒng)將無法區(qū)分部件. VarComp:顯示方差構成來源 %Contribution:顯示每個方差項占總變差的百分比 StdDev:每個方差項的標準偏差 StudyVar:標準偏差*6,用于分析過程變差時使用 %Study Var:每個方差項的百分比,交叉式數據分析-方差法,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGEAIAG.MTW 從菜單選擇StatQuality ToolsGage StudyGage R&R Study(Crossed),交叉式數據分析-方差法,,,,,包含測量對象名稱或編號的列,包含操作者名稱或編號的數據列,包含測量值的列,,,選擇方差法,交叉式數據分析-方差法,,過程公差處輸入8,交叉式數據分析-方差法,結果分析: 量具分辨率(Number of Distinct Categories)反映了測量系統(tǒng)能夠區(qū)分的過程數據的分組數.當該值大于5時,可接受.當小于2的時候,測量系統(tǒng)將無法區(qū)分部件. VarComp:顯示方差構成來源 %Contribution:顯示每個方差項占總變差的百分比 StdDev:每個方差項的標準偏差 StudyVar:標準偏差*6,用于分析過程變差時使用 %Study Var:每個方差項的百分比,嵌套式數據分析,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGENEST.MTW 從菜單選擇StatQuality ToolsGage StudyGage R&R Study(Nested),嵌套式數據分析,,,,,包含測量對象名稱或編號的列,包含操作者名稱或編號的數據列,包含測量值的列,嵌套式數據分析,結果分析: 量具分辨率(Number of Distinct Categories)反映了測量系統(tǒng)能夠區(qū)分的過程數據的分組數.當該值大于5時,可接受.當小于2的時候,測量系統(tǒng)將無法區(qū)分部件. VarComp:顯示方差構成來源 %Contribution:顯示每個方差項占總變差的百分比 StdDev:每個方差項的標準偏差 StudyVar:標準偏差*6,用于分析過程變差時使用 %Study Var:每個方差項的百分比,測量趨勢圖,根據所有測量員和部件號所作的圖形 在圖中平均值的位置畫一條水平參考線 穩(wěn)定的測量過程,趨勢圖上的點將隨機分布在水平參考線兩邊,測量趨勢圖,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGE2.MTW 從菜單選擇StatQuality ToolsGage StudyGage Run Chart,測量趨勢圖,,,,,,,包含測量對象名稱或編號的數據列,包含操作員名稱或編號的數據列,包含測量值的數據列,輸入試驗次數,輸入水平參考線位置,測量線性和偏倚分析,線性性是衡量整個量程范圍內測量精度的參數 偏倚是衡量平均值和真實值之間差異的參數,測量線性和偏倚分析,打開Minitab,從菜單選擇FileOpen Worksheet,打開工作表GAGELIN.MTW 從菜單選擇StatQuality ToolsGage StudyGage Linearity and Bias Study,測量線性和偏倚分析,,,,,包含部件名或編號的數據列,包含測量基準值的數據列,包含測量數據的數據列,指定的過程變差值或者是過程公差,測量線性和偏倚分析,結果說明: %Linearity量具的線性度占總測量過程變差的百分比 %Bias量具偏倚占測量過程總變差的百分比,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- MINITAB 培訓 假設檢驗 方差 回歸 DOE MSA
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://kudomayuko.com/p-1861664.html