管理學第章 回歸分析課件
《管理學第章 回歸分析課件》由會員分享,可在線閱讀,更多相關(guān)《管理學第章 回歸分析課件(185頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、SPSS 16實用教程第第7章章 回歸分析回歸分析回歸分析基本概念回歸分析基本概念7.1一元線性回歸分析一元線性回歸分析7.2多元線性回歸分析多元線性回歸分析7.3非線性回歸分析非線性回歸分析7.4曲曲 線線 估估 計計7.5時間序列的曲線估計時間序列的曲線估計7.6含虛擬自變量的回歸分析含虛擬自變量的回歸分析7.7含虛擬自變量的回歸分析含虛擬自變量的回歸分析7.8 在數(shù)量分析中,經(jīng)常會看到變量與變量之在數(shù)量分析中,經(jīng)常會看到變量與變量之間存在著一定的聯(lián)系。要了解變量之間如何發(fā)間存在著一定的聯(lián)系。要了解變量之間如何發(fā)生相互影響的,就需要利用相關(guān)分析和回歸分生相互影響的,就需要利用相關(guān)分析和回歸
2、分析。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。本章析。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。本章介紹回歸分析基本概念,回歸分析的主要類型:介紹回歸分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析以及邏輯回歸分析等。含虛擬自變量的回歸分析以及邏輯回歸分析等。相關(guān)分析和回歸分析都是研究變量間關(guān)系相關(guān)分析和回歸分析都是研究變量間關(guān)系的統(tǒng)計學課題。在應(yīng)用中,兩種分析方法經(jīng)常的統(tǒng)計學課題。在應(yīng)用中,兩種分析方法經(jīng)常相互結(jié)合和滲透,但它們研究的側(cè)重點
3、和應(yīng)用相互結(jié)合和滲透,但它們研究的側(cè)重點和應(yīng)用面不同。面不同。在回歸分析中,變量在回歸分析中,變量y y稱為因變量,處稱為因變量,處于被解釋的特殊地位;而在相關(guān)分析中,變量于被解釋的特殊地位;而在相關(guān)分析中,變量y y與變量與變量x x處于平等的地位,研究變量處于平等的地位,研究變量y y與變量與變量x x的密切程度和研究變量的密切程度和研究變量x x與變量與變量y y的密切程度是的密切程度是一樣的。一樣的。在回歸分析中,因變量在回歸分析中,因變量y y是隨機變量,是隨機變量,自變量自變量x x可以是隨機變量,也可以是非隨機的可以是隨機變量,也可以是非隨機的確定變量;而在相關(guān)分析中,變量確定變
4、量;而在相關(guān)分析中,變量x x和變量和變量y y都都是隨機變量。是隨機變量。相關(guān)分析是測定變量之間的關(guān)系密切相關(guān)分析是測定變量之間的關(guān)系密切程度,所使用的工具是相關(guān)系數(shù);而回歸分析程度,所使用的工具是相關(guān)系數(shù);而回歸分析則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學表達式來描述變量之間的關(guān)系,通過一定的數(shù)學表達式來描述變量之間的關(guān)系,進而確定一個或者幾個變量的變化對另一個特進而確定一個或者幾個變量的變化對另一個特定變量的影響程度。定變量的影響程度。具體地說,回歸分析主要解決以下幾方面具體地說,回歸分析主要解決以下幾方面的問題。的問題。通過分析大量
5、的樣本數(shù)據(jù),確定變量通過分析大量的樣本數(shù)據(jù),確定變量之間的數(shù)學關(guān)系式。之間的數(shù)學關(guān)系式。對所確定的數(shù)學關(guān)系式的可信程度進對所確定的數(shù)學關(guān)系式的可信程度進行各種統(tǒng)計檢驗,并區(qū)分出對某一特定變量影行各種統(tǒng)計檢驗,并區(qū)分出對某一特定變量影響較為顯著的變量和影響不顯著的變量。響較為顯著的變量和影響不顯著的變量。利用所確定的數(shù)學關(guān)系式,根據(jù)一個利用所確定的數(shù)學關(guān)系式,根據(jù)一個或幾個變量的值來預(yù)測或控制另一個特定變量或幾個變量的值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確度。的取值,并給出這種預(yù)測或控制的精確度。作為處理變量之間關(guān)系的一種統(tǒng)計方法和作為處理變量之間關(guān)系的一種統(tǒng)計方法和技術(shù)
6、,回歸分析的基本思想和方法以及技術(shù),回歸分析的基本思想和方法以及“回歸回歸(RegressionRegression)”名稱的由來都要歸功于英名稱的由來都要歸功于英國統(tǒng)計學家國統(tǒng)計學家F FGaltonGalton(1822182219111911)。)。在實際中,根據(jù)變量的個數(shù)、變量的類型在實際中,根據(jù)變量的個數(shù)、變量的類型以及變量之間的相關(guān)關(guān)系,回歸分析通常分為以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、非線一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析和邏輯
7、回歸分析等類含虛擬自變量的回歸分析和邏輯回歸分析等類型。型。7.2.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式 定義:一元線性回歸分析是在排除其他影定義:一元線性回歸分析是在排除其他影響因素或假定其他影響因素確定的條件下,分響因素或假定其他影響因素確定的條件下,分析某一個因素(自變量)是如何影響另一事物析某一個因素(自變量)是如何影響另一事物(因變量)的過程,所進行的分析是比較理想(因變量)的過程,所進行的分析是比較理想化的。其實,在現(xiàn)實社會生活中,任何一個事化的。其實,在現(xiàn)實社會生活中,任何一個事物(因變量)總是受到其他多種事物(多個自物(因變量)總是受到其他多種事物(多個自變量)
8、的影響。變量)的影響。在實際問題中,由于所要研究的現(xiàn)象的總在實際問題中,由于所要研究的現(xiàn)象的總體單位數(shù)一般是很多的,在許多場合甚至是無體單位數(shù)一般是很多的,在許多場合甚至是無限的,因此無法掌握因變量限的,因此無法掌握因變量y y總體的全部取值。總體的全部取值。也就是說,總體回歸方程事實上是未知的,需也就是說,總體回歸方程事實上是未知的,需要利用樣本的信息對其進行估計。顯然,樣本要利用樣本的信息對其進行估計。顯然,樣本回歸方程的函數(shù)形式應(yīng)與總體回歸方程的函數(shù)回歸方程的函數(shù)形式應(yīng)與總體回歸方程的函數(shù)形式一致。形式一致。通過樣本數(shù)據(jù)建立一個回歸方程后,不能通過樣本數(shù)據(jù)建立一個回歸方程后,不能立即就用
9、于對某個實際問題的預(yù)測。因為,應(yīng)立即就用于對某個實際問題的預(yù)測。因為,應(yīng)用最小二乘法求得的樣本回歸直線作為對總體用最小二乘法求得的樣本回歸直線作為對總體回歸直線的近似,這種近似是否合理,必須對回歸直線的近似,這種近似是否合理,必須對其作各種統(tǒng)計檢驗。一般經(jīng)常作以下的統(tǒng)計檢其作各種統(tǒng)計檢驗。一般經(jīng)常作以下的統(tǒng)計檢驗。驗。(1 1)擬合優(yōu)度檢驗)擬合優(yōu)度檢驗 回歸方程的擬合優(yōu)度檢驗就是要檢驗樣本回歸方程的擬合優(yōu)度檢驗就是要檢驗樣本數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對樣本數(shù)據(jù)的代表程度。而判斷回歸方程對樣本數(shù)據(jù)的代表程度?;貧w方程的擬合優(yōu)度
10、檢驗一般用判定系數(shù)回歸方程的擬合優(yōu)度檢驗一般用判定系數(shù)R2R2實現(xiàn)。該指標是建立在對總離差平方和進行實現(xiàn)。該指標是建立在對總離差平方和進行分解的基礎(chǔ)之上。分解的基礎(chǔ)之上。(2 2)回歸方程的顯著性檢驗()回歸方程的顯著性檢驗(F F檢驗)檢驗)回歸方程的顯著性檢驗是對因變量與所有回歸方程的顯著性檢驗是對因變量與所有自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢驗。驗。回歸方程的顯著性檢驗一般采用回歸方程的顯著性檢驗一般采用F F檢驗,利用檢驗,利用方差分析的方法進行。方差分析的方法進行。(3 3)回歸系數(shù)的顯著性檢驗()回歸系數(shù)的顯著性檢驗(t t檢驗)檢驗)
11、所謂回歸系數(shù)的顯著性檢驗,就是根據(jù)樣所謂回歸系數(shù)的顯著性檢驗,就是根據(jù)樣本估計的結(jié)果對總體回歸系數(shù)的有關(guān)假設(shè)進行本估計的結(jié)果對總體回歸系數(shù)的有關(guān)假設(shè)進行檢驗。檢驗。之所以對回歸系數(shù)進行顯著性檢驗,是因之所以對回歸系數(shù)進行顯著性檢驗,是因為回歸方程的顯著性檢驗只能檢驗所有回歸系為回歸方程的顯著性檢驗只能檢驗所有回歸系數(shù)是否同時與零有顯著性差異,它不能保證回數(shù)是否同時與零有顯著性差異,它不能保證回歸方程中不包含不能較好解釋說明因變量變化歸方程中不包含不能較好解釋說明因變量變化的自變量。因此,可以通過回歸系數(shù)顯著性檢的自變量。因此,可以通過回歸系數(shù)顯著性檢驗對每個回歸系數(shù)進行考察。驗對每個回歸系數(shù)進
12、行考察?;貧w參數(shù)顯著性檢驗的基本步驟?;貧w參數(shù)顯著性檢驗的基本步驟。提出假設(shè)提出假設(shè) 計算回歸系數(shù)的計算回歸系數(shù)的t t統(tǒng)計量值統(tǒng)計量值 根據(jù)給定的顯著水平根據(jù)給定的顯著水平確定臨界值,確定臨界值,或者計算或者計算t t值所對應(yīng)的值所對應(yīng)的p p值值 作出判斷作出判斷 研究問題研究問題 合成纖維的強度與其拉伸倍數(shù)有關(guān),測得合成纖維的強度與其拉伸倍數(shù)有關(guān),測得試驗數(shù)據(jù)如表試驗數(shù)據(jù)如表7-17-1所示。求合成纖維的強度與所示。求合成纖維的強度與拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。7.2.2 SPSS中實現(xiàn)過程中實現(xiàn)過程序序 號號拉拉 伸伸 倍倍 數(shù)數(shù)強度
13、(強度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1 實現(xiàn)步驟實現(xiàn)步驟 (1 1)輸出結(jié)果文件中的第一個表格如下)輸出結(jié)果文件中的第一個表格如下表所示。表所示。7.2.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二個表格如下)輸出的結(jié)果文件中第二個表格如下表所示。表所示。(3 3)輸出的結(jié)果文件中第三個表格如下)輸出的結(jié)果文件中第三個表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個表格如下)輸出的結(jié)果文件中第四個表格如下表所示。表所
14、示。7.3.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式 定義:在上一節(jié)中討論的回歸問題只涉及定義:在上一節(jié)中討論的回歸問題只涉及了一個自變量,但在實際問題中,影響因變量了一個自變量,但在實際問題中,影響因變量的因素往往有多個。例如,商品的需求除了受的因素往往有多個。例如,商品的需求除了受自身價格的影響外,還要受到消費者收入、其自身價格的影響外,還要受到消費者收入、其他商品的價格、消費者偏好等因素的影響;影他商品的價格、消費者偏好等因素的影響;影響水果產(chǎn)量的外界因素有平均氣溫、平均日照響水果產(chǎn)量的外界因素有平均氣溫、平均日照時數(shù)、平均濕度等。時數(shù)、平均濕度等。因此,在許多場合,僅僅考慮
15、單個變量是因此,在許多場合,僅僅考慮單個變量是不夠的,還需要就一個因變量與多個自變量的不夠的,還需要就一個因變量與多個自變量的聯(lián)系來進行考察,才能獲得比較滿意的結(jié)果。聯(lián)系來進行考察,才能獲得比較滿意的結(jié)果。這就產(chǎn)生了測定多因素之間相關(guān)關(guān)系的問題。這就產(chǎn)生了測定多因素之間相關(guān)關(guān)系的問題。研究在線性相關(guān)條件下,兩個或兩個以上研究在線性相關(guān)條件下,兩個或兩個以上自變量對一個因變量的數(shù)量變化關(guān)系,稱為多自變量對一個因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學公元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學公式,稱為多元線性回歸模型。多元線性回歸模式,稱為多元線性回歸模型。多元線性回歸模型
16、是一元線性回歸模型的擴展,其基本原理與型是一元線性回歸模型的擴展,其基本原理與一元線性回歸模型類似,只是在計算上更為復一元線性回歸模型類似,只是在計算上更為復雜,一般需借助計算機來完成。雜,一般需借助計算機來完成。對多元線性回歸,也需要測定方程的擬合對多元線性回歸,也需要測定方程的擬合程度、檢驗回歸方程和回歸系數(shù)的顯著性。程度、檢驗回歸方程和回歸系數(shù)的顯著性。(1 1)擬合優(yōu)度檢驗)擬合優(yōu)度檢驗 測定多元線性回歸的擬合程度,與一元線測定多元線性回歸的擬合程度,與一元線性回歸中的判定系數(shù)類似,使用多重判定系數(shù),性回歸中的判定系數(shù)類似,使用多重判定系數(shù),其定義為其定義為 (2 2)回歸方程的顯著性
17、檢驗()回歸方程的顯著性檢驗(F F檢驗)檢驗)多元線性回歸方程的顯著性檢驗一般采用多元線性回歸方程的顯著性檢驗一般采用F F檢驗,利用方差分析的方法進行。檢驗,利用方差分析的方法進行。(3 3)回歸系數(shù)的顯著性檢驗()回歸系數(shù)的顯著性檢驗(t t檢驗)檢驗)回歸系數(shù)的顯著性檢驗是檢驗各自變量回歸系數(shù)的顯著性檢驗是檢驗各自變量x x1 1,x x2 2,對因變量,對因變量y y的影響是否顯著,從而找出的影響是否顯著,從而找出哪些自變量對哪些自變量對y y的影響是重要的,哪些是不重的影響是重要的,哪些是不重要的。要的。與一元線性回歸一樣,要檢驗解釋變量對與一元線性回歸一樣,要檢驗解釋變量對因變量
18、因變量y y的線性作用是否顯著,要使用的線性作用是否顯著,要使用t t檢驗。檢驗。研究問題研究問題 用多元回歸分析來分析用多元回歸分析來分析3636個員工多個心個員工多個心理變量值(理變量值(z1z1z8z8)對員工滿意度)對員工滿意度mymy的預(yù)測的預(yù)測效果,測得試驗數(shù)據(jù)如表效果,測得試驗數(shù)據(jù)如表7-27-2所示。所示。7.3.2 SPSS中實現(xiàn)過程中實現(xiàn)過程z1z2z3z4z5z6z7Z8滿滿 意意 度度66.0064.0062.0050.0058.0056.001.081.0025.0055.0050.0059.0059.0053.0051.001.001.1122.0050.0047.
19、0049.0045.0046.0046.001.311.2020.0055.0059.0050.0054.0052.0069.001.001.0020.0055.0059.0048.0056.0047.0050.001.001.0024.0062.0054.0068.0046.0046.0051.001.081.0023.0060.0060.0056.0053.0052.0051.001.081.0021.0052.0052.0069.0058.0057.0062.001.001.0023.0056.0055.0057.0039.0044.0046.001.691.0015.0050.0050
20、.0068.0046.0045.0056.001.081.1425.0058.0054.0060.0059.0052.0051.001.001.0025.0053.0052.0055.0057.0065.0064.001.081.0022.0052.0056.0053.0057.0063.0051.001.461.4320.0056.0065.0052.0051.0062.0047.001.001.0022.0050.0063.0059.0053.0055.0048.001.001.0020.0063.0057.0060.0066.0051.0056.001.001.0026.0056.004
21、6.0058.0050.0045.0052.002.231.2921.0047.0050.0057.0049.0050.0048.002.081.1420.0053.0066.0053.0059.0055.0045.001.001.0025.00z1z2z3z4z5z6z7z8滿滿 意意 度度61.0055.0058.0061.0058.0061.001.151.1423.0059.0064.0060.0052.0054.0056.001.081.0026.0055.0060.0072.0060.0055.0067.001.081.0026.0056.0052.0068.0040.0051.0
22、055.001.851.7130.0059.0051.0061.0056.0052.0056.001.001.0025.0060.0053.0062.0055.0047.0063.001.311.1427.0052.0051.0057.0045.0055.0059.001.231.1420.0056.0057.0057.0052.0059.0055.001.001.1426.0068.0058.0071.0068.0053.0061.001.001.0030.0060.0053.0061.0060.0056.0051.001.001.0027.0064.0056.0074.0050.0059.
23、0057.001.851.1418.0067.0053.0060.0053.0053.0051.001.001.0024.0056.0056.0067.0067.0056.0052.001.001.0024.0053.0046.0049.0043.0050.0048.001.311.1419.0053.0057.0065.0052.0067.0059.001.771.4317.0060.0040.0071.0057.0056.0058.001.081.0024.0054.0045.0044.0049.0042.0046.001.001.0023.00 實現(xiàn)步驟實現(xiàn)步驟 (1 1)輸出結(jié)果文件中
24、的第一個表格如下)輸出結(jié)果文件中的第一個表格如下表所示。表所示。7.3.3 結(jié)果和討論結(jié)果和討論 2 2)輸出的結(jié)果文件中第二個表格如下表)輸出的結(jié)果文件中第二個表格如下表所示。所示。(3 3)輸出的結(jié)果文件中第三個表格如下)輸出的結(jié)果文件中第三個表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個表格如下)輸出的結(jié)果文件中第四個表格如下表所示。表所示。(5 5)輸出的結(jié)果文件中第五個表格如下)輸出的結(jié)果文件中第五個表格如下表所示。表所示。(6 6)輸出的結(jié)果文件中第六個表格為回)輸出的結(jié)果文件中第六個表格為回歸系數(shù)分析,如下表所示歸系數(shù)分析,如下表所示 (7 7)輸出的結(jié)果文件中第七個表
25、格如下)輸出的結(jié)果文件中第七個表格如下表所示。表所示。(8 8)輸出的結(jié)果文件中第八部分為圖形,)輸出的結(jié)果文件中第八部分為圖形,為回歸因變量和每個自變量之間的關(guān)系點圖。為回歸因變量和每個自變量之間的關(guān)系點圖。圖圖7-87-8為自變量為自變量z1z1和和mymy之間的關(guān)系點圖。之間的關(guān)系點圖。7.4.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式 定義:研究在非線性相關(guān)條件下,自變量定義:研究在非線性相關(guān)條件下,自變量對因變量的數(shù)量變化關(guān)系,稱為非線性回歸分對因變量的數(shù)量變化關(guān)系,稱為非線性回歸分析。析。在實際問題中,變量之間的相關(guān)關(guān)系往往在實際問題中,變量之間的相關(guān)關(guān)系往往不是線性的,
26、而是非線性的,因而不能用線性不是線性的,而是非線性的,因而不能用線性回歸方程來描述它們之間的相關(guān)關(guān)系,而要采回歸方程來描述它們之間的相關(guān)關(guān)系,而要采用適當?shù)姆蔷€性回歸分析。用適當?shù)姆蔷€性回歸分析。非線性回歸問題大多數(shù)可以化為線性回歸非線性回歸問題大多數(shù)可以化為線性回歸問題來求解,也就是通過對非線性回歸模型進問題來求解,也就是通過對非線性回歸模型進行適當?shù)淖兞孔儞Q,使其化為線性模型來求解。行適當?shù)淖兞孔儞Q,使其化為線性模型來求解。一般步驟為:一般步驟為:根據(jù)經(jīng)驗或者繪制散點圖,選擇適當根據(jù)經(jīng)驗或者繪制散點圖,選擇適當?shù)姆蔷€性回歸方程;的非線性回歸方程;通過變量置換,把非線性回歸方程化為通過變量置
27、換,把非線性回歸方程化為線性回歸;線性回歸;用線性回歸分析中采用的方法來確定各用線性回歸分析中采用的方法來確定各回歸系數(shù)的值;回歸系數(shù)的值;對各系數(shù)進行顯著性檢驗。對各系數(shù)進行顯著性檢驗。計算公式如下。計算公式如下。在本節(jié)中介紹幾種常見的非線性回歸模型,在本節(jié)中介紹幾種常見的非線性回歸模型,并分別給出其線性化方法及圖形。并分別給出其線性化方法及圖形。研究問題研究問題 研究民用汽車總量與國內(nèi)生產(chǎn)總值的關(guān)系。研究民用汽車總量與國內(nèi)生產(chǎn)總值的關(guān)系。數(shù)據(jù)如表數(shù)據(jù)如表7-37-3所示。(資料來源:所示。(資料來源:中國統(tǒng)計中國統(tǒng)計年鑒年鑒20072007,中國統(tǒng)計出版社,中國統(tǒng)計出版社,20072007
28、年)年)7.4.2 SPSS中實現(xiàn)過程中實現(xiàn)過程 實現(xiàn)步驟實現(xiàn)步驟7.4.3 結(jié)果和討論結(jié)果和討論 (1 1)第一部分輸出相關(guān)統(tǒng)計量和參數(shù)的)第一部分輸出相關(guān)統(tǒng)計量和參數(shù)的值,如下表所示。值,如下表所示。(2 2)第二部分輸出的是觀察值和)第二部分輸出的是觀察值和CubicCubic,PowerPower兩種曲線預(yù)測值的對比圖,如圖兩種曲線預(yù)測值的對比圖,如圖7-127-12所所示。示。7.5.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式 定義:在一元回歸分析中,一般首先繪制定義:在一元回歸分析中,一般首先繪制自變量和因變量間的散點圖,然后通過數(shù)據(jù)在自變量和因變量間的散點圖,然后通過數(shù)
29、據(jù)在散點圖中的分布特點選擇所要進行回歸分析的散點圖中的分布特點選擇所要進行回歸分析的類型,是使用線性回歸分析還是某種非線性的類型,是使用線性回歸分析還是某種非線性的回歸分析?;貧w分析。然而,在實際問題中,用戶往往不能確定然而,在實際問題中,用戶往往不能確定究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這時可以采用曲線估計的方法,其步驟如下:時可以采用曲線估計的方法,其步驟如下:首先根據(jù)實際問題本身特點,同時選首先根據(jù)實際問題本身特點,同時選擇幾種模型;擇幾種模型;然后然后SPSSSPSS自動完成模型的參數(shù)估計,自動完成模型的參數(shù)估計,并顯示并顯示R2R2、F F
30、檢驗值、相伴概率值等統(tǒng)計量;檢驗值、相伴概率值等統(tǒng)計量;最后,選擇具有最后,選擇具有R2R2統(tǒng)計量值最大的模統(tǒng)計量值最大的模型作為此問題的回歸模型,并作一些預(yù)測。型作為此問題的回歸模型,并作一些預(yù)測。研究問題研究問題 試用試用SPSSSPSS對國內(nèi)生產(chǎn)總值和社會消費品對國內(nèi)生產(chǎn)總值和社會消費品零售總額之間的關(guān)系進行曲線回歸分析。數(shù)據(jù)零售總額之間的關(guān)系進行曲線回歸分析。數(shù)據(jù)如表如表7-47-4所示。(資料來源:所示。(資料來源:中國統(tǒng)計年鑒中國統(tǒng)計年鑒20072007,中國統(tǒng)計出版社,中國統(tǒng)計出版社,20072007年)年)7.5.2 SPSS中實現(xiàn)過程中實現(xiàn)過程年年 份份國內(nèi)生產(chǎn)總值(億元)國
31、內(nèi)生產(chǎn)總值(億元)社會消費品零售總額(億元)社會消費品零售總額(億元)19783645.21558.619794062.61800.019804545.62140.019814891.62350.019825323.42570.019835962.72849.419847208.13376.419859016.04305.0198610275.24950.0198712058.65820.0198815042.87440.0198916992.38101.4199018667.88300.1199121781.59415.6199226923.510993.7199335333.912462.
32、1199448197.916264.7199560793.720620.0199671176.624774.1199778973.027298.9199884402.329152.5199989677.131134.7200099214.634152.62001109655.237595.22002120332.748135.92003135822.852516.32004159878.359501.02005183867.967176.62006210871.076410.0 實現(xiàn)步驟實現(xiàn)步驟 (1 1)SPSSSPSS輸出結(jié)果文件中的第一部分如輸出結(jié)果文件中的第一部分如下表所示。下表所示。
33、7.5.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二部分如圖)輸出的結(jié)果文件中第二部分如圖7-7-1515所示。所示。(3 3)由于進行曲線估計時所選的曲線模)由于進行曲線估計時所選的曲線模型種類較多,所以使得輸出的觀察值與在各種型種類較多,所以使得輸出的觀察值與在各種函數(shù)模型條件下預(yù)測值的對比圖比較復雜,不函數(shù)模型條件下預(yù)測值的對比圖比較復雜,不易分辨出究竟易分辨出究竟LinearLinear,QuadraticQuadratic,CubicCubic及及PowerPower這這4 4種曲線究竟哪種的對樣本觀察值的種曲線究竟哪種的對樣本觀察值的擬合優(yōu)度更符合實際。擬合優(yōu)度更符合實
34、際。(4 4)重新回到圖)重新回到圖7-137-13所示對話框,在所示對話框,在“ModelModel”框內(nèi)只選中框內(nèi)只選中“QuadraticQuadratic”和和“CubicCubic”這兩種擬合優(yōu)度更高的曲線模型進行估計。得這兩種擬合優(yōu)度更高的曲線模型進行估計。得出它們與觀察值的對比圖,如圖出它們與觀察值的對比圖,如圖7-177-17所示。所示。(5 5)如果在圖)如果在圖7-137-13所示對話框中選中了所示對話框中選中了“Display ANOVA tableDisplay ANOVA table”項,作回歸方程顯項,作回歸方程顯著性檢驗,將輸出相應(yīng)的方差分析表,以著性檢驗,將輸出
35、相應(yīng)的方差分析表,以CubicCubic模型為例(如下表所示),其結(jié)果是:模型為例(如下表所示),其結(jié)果是:回歸方程顯著有意義,并且回歸方程顯著有意義,并且x,x2,x3x,x2,x3三個自變?nèi)齻€自變量的系數(shù)顯著不為零。量的系數(shù)顯著不為零。(6 6)由于在圖)由于在圖7-137-13所示對話框中選了所示對話框中選了“SaveSave”項,且在圖項,且在圖7-147-14所示的所示的“Save Save VariablesVariables”框中選擇了框中選擇了“Predicted valuesPredicted values”,“ResidualsResiduals”和和“Prediction
36、 intervalsPrediction intervals”3 3個選項,因此在個選項,因此在SPSSSPSS數(shù)據(jù)編輯窗口中就增了數(shù)據(jù)編輯窗口中就增了fit_1fit_1,err_1err_1,lcl_1lcl_1,ucl_1ucl_1等等4444個變量的個變量的值,如圖值,如圖7-187-18所示。所示。7.6.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式 定義:時間序列的曲線估計是分析社會和定義:時間序列的曲線估計是分析社會和經(jīng)濟現(xiàn)象中經(jīng)常用到的一種曲線估計。通常把經(jīng)濟現(xiàn)象中經(jīng)常用到的一種曲線估計。通常把時間設(shè)為自變量時間設(shè)為自變量x x,代表具體的經(jīng)濟或社會現(xiàn),代表具體的經(jīng)濟或
37、社會現(xiàn)象的變量設(shè)為因變量象的變量設(shè)為因變量y y,研究變量,研究變量x x與與y y之間關(guān)之間關(guān)系的方法就是時間序列曲線估計。其具體步驟系的方法就是時間序列曲線估計。其具體步驟與一般的曲線估計基本類似。與一般的曲線估計基本類似。計算公式:計算公式:SPSSSPSS中時間序列的曲線估計中時間序列的曲線估計模型與上一節(jié)所介紹相同。模型與上一節(jié)所介紹相同。研究問題研究問題 試用試用SPSSSPSS對對1978197820062006年間社會消費品年間社會消費品零售總額之間的關(guān)系進行曲線回歸分析。數(shù)據(jù)零售總額之間的關(guān)系進行曲線回歸分析。數(shù)據(jù)如表如表7-57-5所示。(資料來源:所示。(資料來源:中國統(tǒng)
38、計年鑒中國統(tǒng)計年鑒20072007,中國統(tǒng)計出版社,中國統(tǒng)計出版社,20072007年)年)7.6.2 SPSS中實現(xiàn)過程中實現(xiàn)過程序序 號號年年 份份社會消費品零售總額(億元)社會消費品零售總額(億元)119781558.6219791800.0319802140.0419812350.0519822570.0619832849.4719843376.4819854305.0919864950.01019875820.01119887440.01219898101.41319908300.11419919415.615199210993.716199314270.417199418622.9
39、18199523613.819199628360.220199731252.921199833378.122199935647.923200039105.724200143055.425200248135.926200352516.327200459501.028200567176.629200676410.0 實現(xiàn)步驟實現(xiàn)步驟 (1 1)第一部分輸出相關(guān)統(tǒng)計量和參數(shù)的)第一部分輸出相關(guān)統(tǒng)計量和參數(shù)的值如下表所示。值如下表所示。7.6.3 結(jié)果和討論結(jié)果和討論 (2 2)第二部分輸出的是觀察值)第二部分輸出的是觀察值LinearLinear,CubicCubic,PowerPower和和Exp
40、onential 4Exponential 4種曲線預(yù)測值種曲線預(yù)測值的對比圖,如圖的對比圖,如圖7-217-21所示。所示。(3 3)由于在圖)由于在圖7-197-19所示所示“Curve Curve EstimationEstimation”對話框(三)中選了對話框(三)中選了“SaveSave”項,項,且在圖且在圖7-207-20的的“Save VariablesSave Variables”框中選擇了框中選擇了“Predicted valuesPredicted values”選項和選項和“Predict Predict CasesCases”框中選擇了框中選擇了“Predict th
41、roughPredict through”項,項,并且在并且在“ObservationObservation”框中鍵入了框中鍵入了“3131”,因,因此在此在SPSSSPSS數(shù)據(jù)編輯窗口中就新增了數(shù)據(jù)編輯窗口中就新增了fit_1fit_1,fit_2fit_2,fit_3fit_3和和fit_4fit_4等等4 4個變量的預(yù)測值,個變量的預(yù)測值,同時在窗口下方還新增了兩個個案,它們分別同時在窗口下方還新增了兩個個案,它們分別代表對代表對20072007年和年和20082008年的預(yù)測值。如圖年的預(yù)測值。如圖7-227-22所示。所示。7.7.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式
42、 定義:前面幾節(jié)所討論的回歸模型中,因定義:前面幾節(jié)所討論的回歸模型中,因變量和自變量都是可以直接用數(shù)字計量的,即變量和自變量都是可以直接用數(shù)字計量的,即可以獲得其實際觀測值(如收入、支出、產(chǎn)量、可以獲得其實際觀測值(如收入、支出、產(chǎn)量、國內(nèi)生產(chǎn)總值等),這類變量稱作數(shù)量變量、國內(nèi)生產(chǎn)總值等),這類變量稱作數(shù)量變量、定量變量或數(shù)量因素。然而,在實際問題的研定量變量或數(shù)量因素。然而,在實際問題的研究中,經(jīng)常會碰到一些非數(shù)量型的變量,如性究中,經(jīng)常會碰到一些非數(shù)量型的變量,如性別、民族、職業(yè)、文化程度、地區(qū)、正常年份別、民族、職業(yè)、文化程度、地區(qū)、正常年份與干旱年份、改革前與改革后等定性變量。與干
43、旱年份、改革前與改革后等定性變量。在建立一個實際問題的回歸方程時,經(jīng)常在建立一個實際問題的回歸方程時,經(jīng)常需要考慮這些定性變量。例如,建立糧食產(chǎn)量需要考慮這些定性變量。例如,建立糧食產(chǎn)量預(yù)測方程就應(yīng)考慮到正常年份與受災(zāi)年份的不預(yù)測方程就應(yīng)考慮到正常年份與受災(zāi)年份的不同影響;建立空調(diào)的銷售模型時,除了要考慮同影響;建立空調(diào)的銷售模型時,除了要考慮居民收入和商品價格這兩個量的因素之外,還居民收入和商品價格這兩個量的因素之外,還必須將必須將“季節(jié)季節(jié)”這個質(zhì)的因素,作為一個重要這個質(zhì)的因素,作為一個重要解釋變量。解釋變量。由于受到質(zhì)的因素影響,回歸模型的參數(shù)由于受到質(zhì)的因素影響,回歸模型的參數(shù)不再是
44、固定不變的。例如,在空調(diào)銷售模型中,不再是固定不變的。例如,在空調(diào)銷售模型中,收入、價格與空調(diào)銷售額的關(guān)系是隨著季節(jié)變收入、價格與空調(diào)銷售額的關(guān)系是隨著季節(jié)變化而改變的,也就是說,在不同的季節(jié)回歸?;淖兊?,也就是說,在不同的季節(jié)回歸模型的參數(shù)也會有所不同。再如,我國居民的消型的參數(shù)也會有所不同。再如,我國居民的消費行為在改革開放前后大不相同,因此消費函費行為在改革開放前后大不相同,因此消費函數(shù)的參數(shù)也會發(fā)生變化。顯然,如果忽略質(zhì)的數(shù)的參數(shù)也會發(fā)生變化。顯然,如果忽略質(zhì)的因素,仍把模型中的參數(shù)看作是固定不變的,因素,仍把模型中的參數(shù)看作是固定不變的,得到的參數(shù)估計量就不能正確描述經(jīng)濟變量之得
45、到的參數(shù)估計量就不能正確描述經(jīng)濟變量之間的關(guān)系。間的關(guān)系。在回歸分析中,對一些自變量是定性變量在回歸分析中,對一些自變量是定性變量的先作數(shù)量化處理,處理的方法是引進只取的先作數(shù)量化處理,處理的方法是引進只取“0 0”和和“1 1”兩個值的兩個值的0 01 1型虛擬自變量。當某型虛擬自變量。當某一屬性出現(xiàn)時,虛擬變量取值為一屬性出現(xiàn)時,虛擬變量取值為“1 1”,否則,否則取值為取值為“0 0”。例如,令。例如,令“1 1”表示改革開放以表示改革開放以后的時期,后的時期,“0 0”則表示改革開放以前的時期。則表示改革開放以前的時期。再如,用再如,用“l(fā) l”表示某人是男性,表示某人是男性,“0 0
46、”則表示則表示某人是女性。虛擬變量也稱為啞變量。需要指某人是女性。虛擬變量也稱為啞變量。需要指出的是,雖然虛擬變量取某一數(shù)值,但這一數(shù)出的是,雖然虛擬變量取某一數(shù)值,但這一數(shù)值沒有任何數(shù)量大小的意義,它僅僅用來說明值沒有任何數(shù)量大小的意義,它僅僅用來說明觀察單位的性質(zhì)和屬性。觀察單位的性質(zhì)和屬性。如果在回歸模型中需要引入多個如果在回歸模型中需要引入多個0 01 1型虛型虛擬變量擬變量D D時,虛擬變量的個數(shù)應(yīng)按下列原則來時,虛擬變量的個數(shù)應(yīng)按下列原則來確定:對于包含一個具有確定:對于包含一個具有k k種特征或狀態(tài)的質(zhì)種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項,因素的回歸模型,如果回
47、歸模型不帶常數(shù)項,則中需引入則中需引入k k個個0 01 1型虛擬變量型虛擬變量D D;如果有常數(shù);如果有常數(shù)項,則只需引入項,則只需引入k k1 1個個0 01 1型虛擬變量型虛擬變量D D。當。當k=2k=2時,只需要引入一個時,只需要引入一個0 01 1型虛擬變量型虛擬變量D D。計算公式如下。計算公式如下。下面以自變量所含定性變量是一個還是多下面以自變量所含定性變量是一個還是多個來分別說明如何構(gòu)造含虛擬自變量的回歸模個來分別說明如何構(gòu)造含虛擬自變量的回歸模型。型。(1 1)自變量中只含一個定性變量,且這)自變量中只含一個定性變量,且這個定性變量只有兩種特征的簡單情況時。個定性變量只有兩
48、種特征的簡單情況時。(2 2)自變量中含多個定性變量時。)自變量中含多個定性變量時。研究問題研究問題 研究采取某項保險革新措施的速度研究采取某項保險革新措施的速度y y與保與保險公司的規(guī)模險公司的規(guī)模x1x1及其類型及其類型d d之間的關(guān)系,數(shù)據(jù)之間的關(guān)系,數(shù)據(jù)如表如表7-67-6所示。所示。7.7.2 SPSS中實現(xiàn)過程中實現(xiàn)過程iyx1d11715102269203211750430310522104060277071221008191200942900101623801128164112152721131129511438681153185116212241172016611813305
49、11930124120142461 實現(xiàn)步驟實現(xiàn)步驟 (1 1)第一部分輸出結(jié)果文件中的第一個)第一部分輸出結(jié)果文件中的第一個表格如下表所示。表格如下表所示。7.7.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二個表格如下)輸出的結(jié)果文件中第二個表格如下表所示。表所示。(3 3)輸出的結(jié)果文件中第三個表格如下)輸出的結(jié)果文件中第三個表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個表格如下)輸出的結(jié)果文件中第四個表格如下表所示。表所示。7.8.1 統(tǒng)計學上的定義和計算公式統(tǒng)計學上的定義和計算公式 定義:邏輯回歸分析是對定性變量的回歸定義:邏輯回歸分析是對定性變量的回歸分析。分析
50、??捎糜谔幚矶ㄐ砸蜃兞康慕y(tǒng)計分析方法有:可用于處理定性因變量的統(tǒng)計分析方法有:判別分析(判別分析(Discriminant analysisDiscriminant analysis)、)、ProbitProbit分析、分析、LogisticLogistic回歸分析和對數(shù)線性回歸分析和對數(shù)線性模型等。在社會科學中,應(yīng)用最多的是模型等。在社會科學中,應(yīng)用最多的是LogisticLogistic回歸分析?;貧w分析。LogisticLogistic回歸分析根據(jù)回歸分析根據(jù)因變量取值類別不同,又可以分為因變量取值類別不同,又可以分為Binary Binary LogisticLogistic回歸分析和
51、回歸分析和Multinomi-nal Multinomi-nal LogisticLogistic回歸分析。回歸分析。Binary Logistic Binary Logistic回歸模型中因變量只能回歸模型中因變量只能取兩個值取兩個值1 1和和0 0(虛擬因變量),而(虛擬因變量),而Multinomial LogisticMultinomial Logistic回歸模型中因變量可回歸模型中因變量可以取多個值。本節(jié)將只討論以取多個值。本節(jié)將只討論Binary LogisticBinary Logistic回歸,并簡稱回歸,并簡稱LogisticLogistic回歸(與回歸(與7.57.5節(jié)曲
52、線估節(jié)曲線估計中介紹的計中介紹的LogisticLogistic曲線模型相區(qū)別)。曲線模型相區(qū)別)。LogisticLogistic函數(shù)的形式為函數(shù)的形式為 與任何概率一樣,似然的取值范圍在與任何概率一樣,似然的取值范圍在0,10,1之間。之間。2LL2LL的計算公式為的計算公式為1-2對數(shù)似然值(對數(shù)似然值(-2 log likelihood,-2LL)Logistic Logistic回歸的擬合優(yōu)度統(tǒng)計量計算公回歸的擬合優(yōu)度統(tǒng)計量計算公式為式為 在實際問題中,通常采用如下分類表在實際問題中,通常采用如下分類表(Classification TableClassification Table
53、)反映擬合效果。)反映擬合效果。2擬合優(yōu)度(擬合優(yōu)度(Goodness of Fit)統(tǒng)計量)統(tǒng)計量Predicted(預(yù)測值)01Percent Correct(正確分類比例)Observed(觀測值)0n00n01f01n10n11f1Overall(總計)ffClassification Table for YClassification Table for Y3Cox和和Snell的的R 2(Cox&Snells R-Square)4Nagelkerke的的R 2(N agelkerkes R-Square)5偽偽R 2(Psedo-R-square)偽偽R R2 2與線性回歸模型的與
54、線性回歸模型的R R2 2相對應(yīng),其意義相對應(yīng),其意義相似,但它小于相似,但它小于1 1。6Hosmer和和Lemeshow的擬合優(yōu)度檢驗的擬合優(yōu)度檢驗統(tǒng)計量(統(tǒng)計量(Hosmer and Lemeshows Goodness of Fit Test Statistic)與一般擬合優(yōu)度檢驗不同,與一般擬合優(yōu)度檢驗不同,HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗通常把樣本數(shù)據(jù)根的擬合優(yōu)度檢驗通常把樣本數(shù)據(jù)根據(jù)預(yù)測概率分為據(jù)預(yù)測概率分為1010組,然后根據(jù)觀測頻數(shù)和期組,然后根據(jù)觀測頻數(shù)和期望頻數(shù)構(gòu)造卡方統(tǒng)計量(即望頻數(shù)構(gòu)造卡方統(tǒng)計量(即HosmerHosmer和和
55、LemeshowLemeshow的擬合優(yōu)度檢驗統(tǒng)計量,簡稱的擬合優(yōu)度檢驗統(tǒng)計量,簡稱H-LH-L擬擬合優(yōu)度檢驗統(tǒng)計量),最后根據(jù)自由度為合優(yōu)度檢驗統(tǒng)計量),最后根據(jù)自由度為8 8的的卡方分布計算其值并對卡方分布計算其值并對LogisticLogistic模型進行檢模型進行檢驗。驗。如果該如果該p p值小于給定的顯著性水平(如值小于給定的顯著性水平(如=0.05=0.05),則拒絕因變量的觀測值與模型預(yù)測),則拒絕因變量的觀測值與模型預(yù)測值不存在差異的零假設(shè),表明模型的預(yù)測值與值不存在差異的零假設(shè),表明模型的預(yù)測值與觀測值存在顯著差異。如果值大于,我們沒有觀測值存在顯著差異。如果值大于,我們沒有
56、充分的理由拒絕零假設(shè),表明在可接受的水平充分的理由拒絕零假設(shè),表明在可接受的水平上模型的估計擬合了數(shù)據(jù)。上模型的估計擬合了數(shù)據(jù)。7Wald統(tǒng)計量統(tǒng)計量 Wald Wald統(tǒng)計量用于判斷一個變量是否應(yīng)該統(tǒng)計量用于判斷一個變量是否應(yīng)該包含在模型中,其檢驗步驟如下。包含在模型中,其檢驗步驟如下。(1 1)提出假設(shè)。)提出假設(shè)。(2 2)構(gòu)造)構(gòu)造WaldWald統(tǒng)計量。統(tǒng)計量。(3 3)作出統(tǒng)計判斷。)作出統(tǒng)計判斷。研究問題研究問題 在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會調(diào)查中,因變量具的社會調(diào)查中,因變量y=1y=1表示居民主要乘表示居民主要乘坐公共汽車上
57、下班;坐公共汽車上下班;y y=0=0表示主要騎自行車表示主要騎自行車上下班;自變量上下班;自變量x1x1表示被調(diào)查者的年齡;表示被調(diào)查者的年齡;x2x2表表示被調(diào)查者的月收入;示被調(diào)查者的月收入;x3x3表示被調(diào)查者的性別表示被調(diào)查者的性別(x3=1x3=1為男性,為男性,x3=0 x3=0為女性)。為女性)。試建立試建立y y與自變量間的與自變量間的LogisticLogistic回歸,數(shù)據(jù)如回歸,數(shù)據(jù)如表表7-77-7所示。所示。7.8.2 SPSS中實現(xiàn)過程中實現(xiàn)過程序號序號x1(年齡)(年齡)x2(月收入:元)(月收入:元)x3(性別)(性別)y1188500022112000032
58、38500142395001528120001631850007361500018421000019469500110481200001155180001125621000113581800011418850101520100010162512001017271300101828150010193095011203210001021331800102233100010233812001024411500102545180011264810001027521500112856180011 實現(xiàn)步驟實現(xiàn)步驟 (1 1)第一部分輸出結(jié)果有兩個表格,第)第一部分輸出結(jié)果有兩個表格,第一個表格說明所有個
59、案(一個表格說明所有個案(2828個)都被選入作為個)都被選入作為回歸分析的個案?;貧w分析的個案。7.8.3 結(jié)果和討論結(jié)果和討論 第二個表格說明初始的因變量值(第二個表格說明初始的因變量值(0 0,1 1)已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的0 0、1 1數(shù)值。數(shù)值。(2 2)第二部分()第二部分(Block 0Block 0)輸出結(jié)果有)輸出結(jié)果有4 4個表格。個表格。(3 3)Omnibus Tests of Model Omnibus Tests of Model CoefficientsCoefficients表格列出了模型系數(shù)的表格列出了模型系數(shù)的Omnib
60、us Omnibus TestsTests結(jié)果。結(jié)果。(4 4)Model SummaryModel Summary表給出了表給出了-2-2 對數(shù)似對數(shù)似然值、然值、CoxCox和和SnellSnell的的R2R2以及以及NagelkerkeNagelkerke的的R2R2檢驗統(tǒng)計結(jié)果。檢驗統(tǒng)計結(jié)果。(5 5)Hosmer and Lemeshow TestHosmer and Lemeshow Test表格以表格以及及Contingency Table for Hosmer and Contingency Table for Hosmer and Lemeshow TestLemeshow
61、Test表格給出了表格給出了HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗統(tǒng)計量。的擬合優(yōu)度檢驗統(tǒng)計量。(6 6)Classification TableClassification Table分類表說明分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看第一次迭代結(jié)果的擬合效果,從該表格可以看出對于出對于y=0y=0,有,有86.7%86.7%的準確性;對于的準確性;對于y=1y=1,有,有76.9%76.9%準確性,因此對于所有個案總共有準確性,因此對于所有個案總共有82.1%82.1%的準確性。的準確性。(7 7)Variables in the Equatio
62、nVariables in the Equation表格表格列出了列出了Step 1Step 1中各個變量對應(yīng)的系數(shù),以及中各個變量對應(yīng)的系數(shù),以及該變量對應(yīng)的該變量對應(yīng)的Wald Wald 統(tǒng)計量值和它對應(yīng)的相伴統(tǒng)計量值和它對應(yīng)的相伴概率。從該表格中可以看出概率。從該表格中可以看出x3x3相伴概率最小,相伴概率最小,WaldWald統(tǒng)計量最大,可見該變量在模型中很重要。統(tǒng)計量最大,可見該變量在模型中很重要。(8 8)Correlation MatrixCorrelation Matrix表格列出了常表格列出了常數(shù)數(shù)ConstantConstant、系數(shù)之間的相關(guān)矩陣。常數(shù)與、系數(shù)之間的相關(guān)矩
63、陣。常數(shù)與x2x2之間的相關(guān)性最大,之間的相關(guān)性最大,x1x1和和x3x3之間的相關(guān)性之間的相關(guān)性最小。最小。(9 9)圖)圖7-267-26所示是觀測值和預(yù)測概率分所示是觀測值和預(yù)測概率分布圖。該圖以布圖。該圖以0 0和和1 1為符號,每四個符號代表一為符號,每四個符號代表一個個案。橫坐標是個案屬于個個案。橫坐標是個案屬于1 1的錄屬度,這里的錄屬度,這里稱為預(yù)測概率(稱為預(yù)測概率(Predicted ProbabilityPredicted Probability)。)。縱坐標是個案分布頻數(shù),反映個案的分布??v坐標是個案分布頻數(shù),反映個案的分布。(1010)邏輯回歸的最后一個輸出表格是)邏
64、輯回歸的最后一個輸出表格是Casewise ListCasewise List,列出了殘差大于,列出了殘差大于2 2的個案。的個案?;貧w分析是研究變量與變量之間聯(lián)系的最回歸分析是研究變量與變量之間聯(lián)系的最為廣泛的模型。在實際中,根據(jù)變量的個數(shù)、為廣泛的模型。在實際中,根據(jù)變量的個數(shù)、類型,以及變量之間的相關(guān)關(guān)系,回歸分析通類型,以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、常分為一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析和邏輯回歸分估計、含虛擬自變量的回歸分析和邏輯回歸分析等。析等。
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024《增值稅法》全文學習解讀(規(guī)范增值稅的征收和繳納保護納稅人的合法權(quán)益)
- 2024《文物保護法》全文解讀學習(加強對文物的保護促進科學研究工作)
- 銷售技巧培訓課件:接近客戶的套路總結(jié)
- 20種成交的銷售話術(shù)和技巧
- 銷售技巧:接近客戶的8種套路
- 銷售套路總結(jié)
- 房產(chǎn)銷售中的常見問題及解決方法
- 銷售技巧:值得默念的成交話術(shù)
- 銷售資料:讓人舒服的35種說話方式
- 汽車銷售績效管理規(guī)范
- 銷售技巧培訓課件:絕對成交的銷售話術(shù)
- 頂尖銷售技巧總結(jié)
- 銷售技巧:電話營銷十大定律
- 銷售逼單最好的二十三種技巧
- 銷售最常遇到的10大麻煩