管理學(xué)第章 回歸分析課件
《管理學(xué)第章 回歸分析課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《管理學(xué)第章 回歸分析課件(185頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、SPSS 16實(shí)用教程第第7章章 回歸分析回歸分析回歸分析基本概念回歸分析基本概念7.1一元線性回歸分析一元線性回歸分析7.2多元線性回歸分析多元線性回歸分析7.3非線性回歸分析非線性回歸分析7.4曲曲 線線 估估 計(jì)計(jì)7.5時(shí)間序列的曲線估計(jì)時(shí)間序列的曲線估計(jì)7.6含虛擬自變量的回歸分析含虛擬自變量的回歸分析7.7含虛擬自變量的回歸分析含虛擬自變量的回歸分析7.8 在數(shù)量分析中,經(jīng)常會(huì)看到變量與變量之在數(shù)量分析中,經(jīng)常會(huì)看到變量與變量之間存在著一定的聯(lián)系。要了解變量之間如何發(fā)間存在著一定的聯(lián)系。要了解變量之間如何發(fā)生相互影響的,就需要利用相關(guān)分析和回歸分生相互影響的,就需要利用相關(guān)分析和回歸
2、分析。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。本章析。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。本章介紹回歸分析基本概念,回歸分析的主要類型:介紹回歸分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析以及邏輯回歸分析等。含虛擬自變量的回歸分析以及邏輯回歸分析等。相關(guān)分析和回歸分析都是研究變量間關(guān)系相關(guān)分析和回歸分析都是研究變量間關(guān)系的統(tǒng)計(jì)學(xué)課題。在應(yīng)用中,兩種分析方法經(jīng)常的統(tǒng)計(jì)學(xué)課題。在應(yīng)用中,兩種分析方法經(jīng)常相互結(jié)合和滲透,但它們研究的側(cè)重點(diǎn)
3、和應(yīng)用相互結(jié)合和滲透,但它們研究的側(cè)重點(diǎn)和應(yīng)用面不同。面不同。在回歸分析中,變量在回歸分析中,變量y y稱為因變量,處稱為因變量,處于被解釋的特殊地位;而在相關(guān)分析中,變量于被解釋的特殊地位;而在相關(guān)分析中,變量y y與變量與變量x x處于平等的地位,研究變量處于平等的地位,研究變量y y與變量與變量x x的密切程度和研究變量的密切程度和研究變量x x與變量與變量y y的密切程度是的密切程度是一樣的。一樣的。在回歸分析中,因變量在回歸分析中,因變量y y是隨機(jī)變量,是隨機(jī)變量,自變量自變量x x可以是隨機(jī)變量,也可以是非隨機(jī)的可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量;而在相關(guān)分析中,變量確定變
4、量;而在相關(guān)分析中,變量x x和變量和變量y y都都是隨機(jī)變量。是隨機(jī)變量。相關(guān)分析是測(cè)定變量之間的關(guān)系密切相關(guān)分析是測(cè)定變量之間的關(guān)系密切程度,所使用的工具是相關(guān)系數(shù);而回歸分析程度,所使用的工具是相關(guān)系數(shù);而回歸分析則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述變量之間的關(guān)系,通過一定的數(shù)學(xué)表達(dá)式來描述變量之間的關(guān)系,進(jìn)而確定一個(gè)或者幾個(gè)變量的變化對(duì)另一個(gè)特進(jìn)而確定一個(gè)或者幾個(gè)變量的變化對(duì)另一個(gè)特定變量的影響程度。定變量的影響程度。具體地說,回歸分析主要解決以下幾方面具體地說,回歸分析主要解決以下幾方面的問題。的問題。通過分析大量
5、的樣本數(shù)據(jù),確定變量通過分析大量的樣本數(shù)據(jù),確定變量之間的數(shù)學(xué)關(guān)系式。之間的數(shù)學(xué)關(guān)系式。對(duì)所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)對(duì)所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并區(qū)分出對(duì)某一特定變量影行各種統(tǒng)計(jì)檢驗(yàn),并區(qū)分出對(duì)某一特定變量影響較為顯著的變量和影響不顯著的變量。響較為顯著的變量和影響不顯著的變量。利用所確定的數(shù)學(xué)關(guān)系式,根據(jù)一個(gè)利用所確定的數(shù)學(xué)關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的值來預(yù)測(cè)或控制另一個(gè)特定變量或幾個(gè)變量的值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確度。的取值,并給出這種預(yù)測(cè)或控制的精確度。作為處理變量之間關(guān)系的一種統(tǒng)計(jì)方法和作為處理變量之間關(guān)系的一種統(tǒng)計(jì)方法和技術(shù)
6、,回歸分析的基本思想和方法以及技術(shù),回歸分析的基本思想和方法以及“回歸回歸(RegressionRegression)”名稱的由來都要?dú)w功于英名稱的由來都要?dú)w功于英國(guó)統(tǒng)計(jì)學(xué)家國(guó)統(tǒng)計(jì)學(xué)家F FGaltonGalton(1822182219111911)。)。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、變量的類型在實(shí)際中,根據(jù)變量的個(gè)數(shù)、變量的類型以及變量之間的相關(guān)關(guān)系,回歸分析通常分為以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、非線一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析和邏輯
7、回歸分析等類含虛擬自變量的回歸分析和邏輯回歸分析等類型。型。7.2.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:一元線性回歸分析是在排除其他影定義:一元線性回歸分析是在排除其他影響因素或假定其他影響因素確定的條件下,分響因素或假定其他影響因素確定的條件下,分析某一個(gè)因素(自變量)是如何影響另一事物析某一個(gè)因素(自變量)是如何影響另一事物(因變量)的過程,所進(jìn)行的分析是比較理想(因變量)的過程,所進(jìn)行的分析是比較理想化的。其實(shí),在現(xiàn)實(shí)社會(huì)生活中,任何一個(gè)事化的。其實(shí),在現(xiàn)實(shí)社會(huì)生活中,任何一個(gè)事物(因變量)總是受到其他多種事物(多個(gè)自物(因變量)總是受到其他多種事物(多個(gè)自變量)
8、的影響。變量)的影響。在實(shí)際問題中,由于所要研究的現(xiàn)象的總在實(shí)際問題中,由于所要研究的現(xiàn)象的總體單位數(shù)一般是很多的,在許多場(chǎng)合甚至是無體單位數(shù)一般是很多的,在許多場(chǎng)合甚至是無限的,因此無法掌握因變量限的,因此無法掌握因變量y y總體的全部取值??傮w的全部取值。也就是說,總體回歸方程事實(shí)上是未知的,需也就是說,總體回歸方程事實(shí)上是未知的,需要利用樣本的信息對(duì)其進(jìn)行估計(jì)。顯然,樣本要利用樣本的信息對(duì)其進(jìn)行估計(jì)。顯然,樣本回歸方程的函數(shù)形式應(yīng)與總體回歸方程的函數(shù)回歸方程的函數(shù)形式應(yīng)與總體回歸方程的函數(shù)形式一致。形式一致。通過樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能通過樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能立即就用
9、于對(duì)某個(gè)實(shí)際問題的預(yù)測(cè)。因?yàn)椋瑧?yīng)立即就用于對(duì)某個(gè)實(shí)際問題的預(yù)測(cè)。因?yàn)椋瑧?yīng)用最小二乘法求得的樣本回歸直線作為對(duì)總體用最小二乘法求得的樣本回歸直線作為對(duì)總體回歸直線的近似,這種近似是否合理,必須對(duì)回歸直線的近似,這種近似是否合理,必須對(duì)其作各種統(tǒng)計(jì)檢驗(yàn)。一般經(jīng)常作以下的統(tǒng)計(jì)檢其作各種統(tǒng)計(jì)檢驗(yàn)。一般經(jīng)常作以下的統(tǒng)計(jì)檢驗(yàn)。驗(yàn)。(1 1)擬合優(yōu)度檢驗(yàn))擬合優(yōu)度檢驗(yàn) 回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對(duì)樣本數(shù)據(jù)的代表程度。而判斷回歸方程對(duì)樣本數(shù)據(jù)的代表程度?;貧w方程的擬合優(yōu)度
10、檢驗(yàn)一般用判定系數(shù)回歸方程的擬合優(yōu)度檢驗(yàn)一般用判定系數(shù)R2R2實(shí)現(xiàn)。該指標(biāo)是建立在對(duì)總離差平方和進(jìn)行實(shí)現(xiàn)。該指標(biāo)是建立在對(duì)總離差平方和進(jìn)行分解的基礎(chǔ)之上。分解的基礎(chǔ)之上。(2 2)回歸方程的顯著性檢驗(yàn)()回歸方程的顯著性檢驗(yàn)(F F檢驗(yàn))檢驗(yàn))回歸方程的顯著性檢驗(yàn)是對(duì)因變量與所有回歸方程的顯著性檢驗(yàn)是對(duì)因變量與所有自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢驗(yàn)。驗(yàn)?;貧w方程的顯著性檢驗(yàn)一般采用回歸方程的顯著性檢驗(yàn)一般采用F F檢驗(yàn),利用檢驗(yàn),利用方差分析的方法進(jìn)行。方差分析的方法進(jìn)行。(3 3)回歸系數(shù)的顯著性檢驗(yàn)()回歸系數(shù)的顯著性檢驗(yàn)(t t檢驗(yàn))檢驗(yàn))
11、所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣本估計(jì)的結(jié)果對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行本估計(jì)的結(jié)果對(duì)總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn)。檢驗(yàn)。之所以對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),是因之所以對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),是因?yàn)榛貧w方程的顯著性檢驗(yàn)只能檢驗(yàn)所有回歸系為回歸方程的顯著性檢驗(yàn)只能檢驗(yàn)所有回歸系數(shù)是否同時(shí)與零有顯著性差異,它不能保證回?cái)?shù)是否同時(shí)與零有顯著性差異,它不能保證回歸方程中不包含不能較好解釋說明因變量變化歸方程中不包含不能較好解釋說明因變量變化的自變量。因此,可以通過回歸系數(shù)顯著性檢的自變量。因此,可以通過回歸系數(shù)顯著性檢驗(yàn)對(duì)每個(gè)回歸系數(shù)進(jìn)行考察。驗(yàn)對(duì)每個(gè)回歸系數(shù)進(jìn)
12、行考察?;貧w參數(shù)顯著性檢驗(yàn)的基本步驟。回歸參數(shù)顯著性檢驗(yàn)的基本步驟。提出假設(shè)提出假設(shè) 計(jì)算回歸系數(shù)的計(jì)算回歸系數(shù)的t t統(tǒng)計(jì)量值統(tǒng)計(jì)量值 根據(jù)給定的顯著水平根據(jù)給定的顯著水平確定臨界值,確定臨界值,或者計(jì)算或者計(jì)算t t值所對(duì)應(yīng)的值所對(duì)應(yīng)的p p值值 作出判斷作出判斷 研究問題研究問題 合成纖維的強(qiáng)度與其拉伸倍數(shù)有關(guān),測(cè)得合成纖維的強(qiáng)度與其拉伸倍數(shù)有關(guān),測(cè)得試驗(yàn)數(shù)據(jù)如表試驗(yàn)數(shù)據(jù)如表7-17-1所示。求合成纖維的強(qiáng)度與所示。求合成纖維的強(qiáng)度與拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。7.2.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程序序 號(hào)號(hào)拉拉 伸伸 倍倍 數(shù)數(shù)強(qiáng)度
13、(強(qiáng)度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)輸出結(jié)果文件中的第一個(gè)表格如下)輸出結(jié)果文件中的第一個(gè)表格如下表所示。表所示。7.2.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二個(gè)表格如下)輸出的結(jié)果文件中第二個(gè)表格如下表所示。表所示。(3 3)輸出的結(jié)果文件中第三個(gè)表格如下)輸出的結(jié)果文件中第三個(gè)表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個(gè)表格如下)輸出的結(jié)果文件中第四個(gè)表格如下表所示。表所
14、示。7.3.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:在上一節(jié)中討論的回歸問題只涉及定義:在上一節(jié)中討論的回歸問題只涉及了一個(gè)自變量,但在實(shí)際問題中,影響因變量了一個(gè)自變量,但在實(shí)際問題中,影響因變量的因素往往有多個(gè)。例如,商品的需求除了受的因素往往有多個(gè)。例如,商品的需求除了受自身價(jià)格的影響外,還要受到消費(fèi)者收入、其自身價(jià)格的影響外,還要受到消費(fèi)者收入、其他商品的價(jià)格、消費(fèi)者偏好等因素的影響;影他商品的價(jià)格、消費(fèi)者偏好等因素的影響;影響水果產(chǎn)量的外界因素有平均氣溫、平均日照響水果產(chǎn)量的外界因素有平均氣溫、平均日照時(shí)數(shù)、平均濕度等。時(shí)數(shù)、平均濕度等。因此,在許多場(chǎng)合,僅僅考慮
15、單個(gè)變量是因此,在許多場(chǎng)合,僅僅考慮單個(gè)變量是不夠的,還需要就一個(gè)因變量與多個(gè)自變量的不夠的,還需要就一個(gè)因變量與多個(gè)自變量的聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。這就產(chǎn)生了測(cè)定多因素之間相關(guān)關(guān)系的問題。這就產(chǎn)生了測(cè)定多因素之間相關(guān)關(guān)系的問題。研究在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上研究在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱為多自變量對(duì)一個(gè)因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公式,稱為多元線性回歸模型。多元線性回歸模式,稱為多元線性回歸模型。多元線性回歸模型
16、是一元線性回歸模型的擴(kuò)展,其基本原理與型是一元線性回歸模型的擴(kuò)展,其基本原理與一元線性回歸模型類似,只是在計(jì)算上更為復(fù)一元線性回歸模型類似,只是在計(jì)算上更為復(fù)雜,一般需借助計(jì)算機(jī)來完成。雜,一般需借助計(jì)算機(jī)來完成。對(duì)多元線性回歸,也需要測(cè)定方程的擬合對(duì)多元線性回歸,也需要測(cè)定方程的擬合程度、檢驗(yàn)回歸方程和回歸系數(shù)的顯著性。程度、檢驗(yàn)回歸方程和回歸系數(shù)的顯著性。(1 1)擬合優(yōu)度檢驗(yàn))擬合優(yōu)度檢驗(yàn) 測(cè)定多元線性回歸的擬合程度,與一元線測(cè)定多元線性回歸的擬合程度,與一元線性回歸中的判定系數(shù)類似,使用多重判定系數(shù),性回歸中的判定系數(shù)類似,使用多重判定系數(shù),其定義為其定義為 (2 2)回歸方程的顯著性
17、檢驗(yàn)()回歸方程的顯著性檢驗(yàn)(F F檢驗(yàn))檢驗(yàn))多元線性回歸方程的顯著性檢驗(yàn)一般采用多元線性回歸方程的顯著性檢驗(yàn)一般采用F F檢驗(yàn),利用方差分析的方法進(jìn)行。檢驗(yàn),利用方差分析的方法進(jìn)行。(3 3)回歸系數(shù)的顯著性檢驗(yàn)()回歸系數(shù)的顯著性檢驗(yàn)(t t檢驗(yàn))檢驗(yàn))回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)各自變量回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)各自變量x x1 1,x x2 2,對(duì)因變量,對(duì)因變量y y的影響是否顯著,從而找出的影響是否顯著,從而找出哪些自變量對(duì)哪些自變量對(duì)y y的影響是重要的,哪些是不重的影響是重要的,哪些是不重要的。要的。與一元線性回歸一樣,要檢驗(yàn)解釋變量對(duì)與一元線性回歸一樣,要檢驗(yàn)解釋變量對(duì)因變量
18、因變量y y的線性作用是否顯著,要使用的線性作用是否顯著,要使用t t檢驗(yàn)。檢驗(yàn)。研究問題研究問題 用多元回歸分析來分析用多元回歸分析來分析3636個(gè)員工多個(gè)心個(gè)員工多個(gè)心理變量值(理變量值(z1z1z8z8)對(duì)員工滿意度)對(duì)員工滿意度mymy的預(yù)測(cè)的預(yù)測(cè)效果,測(cè)得試驗(yàn)數(shù)據(jù)如表效果,測(cè)得試驗(yàn)數(shù)據(jù)如表7-27-2所示。所示。7.3.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程z1z2z3z4z5z6z7Z8滿滿 意意 度度66.0064.0062.0050.0058.0056.001.081.0025.0055.0050.0059.0059.0053.0051.001.001.1122.0050.0047.
19、0049.0045.0046.0046.001.311.2020.0055.0059.0050.0054.0052.0069.001.001.0020.0055.0059.0048.0056.0047.0050.001.001.0024.0062.0054.0068.0046.0046.0051.001.081.0023.0060.0060.0056.0053.0052.0051.001.081.0021.0052.0052.0069.0058.0057.0062.001.001.0023.0056.0055.0057.0039.0044.0046.001.691.0015.0050.0050
20、.0068.0046.0045.0056.001.081.1425.0058.0054.0060.0059.0052.0051.001.001.0025.0053.0052.0055.0057.0065.0064.001.081.0022.0052.0056.0053.0057.0063.0051.001.461.4320.0056.0065.0052.0051.0062.0047.001.001.0022.0050.0063.0059.0053.0055.0048.001.001.0020.0063.0057.0060.0066.0051.0056.001.001.0026.0056.004
21、6.0058.0050.0045.0052.002.231.2921.0047.0050.0057.0049.0050.0048.002.081.1420.0053.0066.0053.0059.0055.0045.001.001.0025.00z1z2z3z4z5z6z7z8滿滿 意意 度度61.0055.0058.0061.0058.0061.001.151.1423.0059.0064.0060.0052.0054.0056.001.081.0026.0055.0060.0072.0060.0055.0067.001.081.0026.0056.0052.0068.0040.0051.0
22、055.001.851.7130.0059.0051.0061.0056.0052.0056.001.001.0025.0060.0053.0062.0055.0047.0063.001.311.1427.0052.0051.0057.0045.0055.0059.001.231.1420.0056.0057.0057.0052.0059.0055.001.001.1426.0068.0058.0071.0068.0053.0061.001.001.0030.0060.0053.0061.0060.0056.0051.001.001.0027.0064.0056.0074.0050.0059.
23、0057.001.851.1418.0067.0053.0060.0053.0053.0051.001.001.0024.0056.0056.0067.0067.0056.0052.001.001.0024.0053.0046.0049.0043.0050.0048.001.311.1419.0053.0057.0065.0052.0067.0059.001.771.4317.0060.0040.0071.0057.0056.0058.001.081.0024.0054.0045.0044.0049.0042.0046.001.001.0023.00 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)輸出結(jié)果文件中
24、的第一個(gè)表格如下)輸出結(jié)果文件中的第一個(gè)表格如下表所示。表所示。7.3.3 結(jié)果和討論結(jié)果和討論 2 2)輸出的結(jié)果文件中第二個(gè)表格如下表)輸出的結(jié)果文件中第二個(gè)表格如下表所示。所示。(3 3)輸出的結(jié)果文件中第三個(gè)表格如下)輸出的結(jié)果文件中第三個(gè)表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個(gè)表格如下)輸出的結(jié)果文件中第四個(gè)表格如下表所示。表所示。(5 5)輸出的結(jié)果文件中第五個(gè)表格如下)輸出的結(jié)果文件中第五個(gè)表格如下表所示。表所示。(6 6)輸出的結(jié)果文件中第六個(gè)表格為回)輸出的結(jié)果文件中第六個(gè)表格為回歸系數(shù)分析,如下表所示歸系數(shù)分析,如下表所示 (7 7)輸出的結(jié)果文件中第七個(gè)表
25、格如下)輸出的結(jié)果文件中第七個(gè)表格如下表所示。表所示。(8 8)輸出的結(jié)果文件中第八部分為圖形,)輸出的結(jié)果文件中第八部分為圖形,為回歸因變量和每個(gè)自變量之間的關(guān)系點(diǎn)圖。為回歸因變量和每個(gè)自變量之間的關(guān)系點(diǎn)圖。圖圖7-87-8為自變量為自變量z1z1和和mymy之間的關(guān)系點(diǎn)圖。之間的關(guān)系點(diǎn)圖。7.4.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:研究在非線性相關(guān)條件下,自變量定義:研究在非線性相關(guān)條件下,自變量對(duì)因變量的數(shù)量變化關(guān)系,稱為非線性回歸分對(duì)因變量的數(shù)量變化關(guān)系,稱為非線性回歸分析。析。在實(shí)際問題中,變量之間的相關(guān)關(guān)系往往在實(shí)際問題中,變量之間的相關(guān)關(guān)系往往不是線性的,
26、而是非線性的,因而不能用線性不是線性的,而是非線性的,因而不能用線性回歸方程來描述它們之間的相關(guān)關(guān)系,而要采回歸方程來描述它們之間的相關(guān)關(guān)系,而要采用適當(dāng)?shù)姆蔷€性回歸分析。用適當(dāng)?shù)姆蔷€性回歸分析。非線性回歸問題大多數(shù)可以化為線性回歸非線性回歸問題大多數(shù)可以化為線性回歸問題來求解,也就是通過對(duì)非線性回歸模型進(jìn)問題來求解,也就是通過對(duì)非線性回歸模型進(jìn)行適當(dāng)?shù)淖兞孔儞Q,使其化為線性模型來求解。行適當(dāng)?shù)淖兞孔儞Q,使其化為線性模型來求解。一般步驟為:一般步驟為:根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)?shù)姆蔷€性回歸方程;的非線性回歸方程;通過變量置換,把非線性回歸方程化為通過變量置
27、換,把非線性回歸方程化為線性回歸;線性回歸;用線性回歸分析中采用的方法來確定各用線性回歸分析中采用的方法來確定各回歸系數(shù)的值;回歸系數(shù)的值;對(duì)各系數(shù)進(jìn)行顯著性檢驗(yàn)。對(duì)各系數(shù)進(jìn)行顯著性檢驗(yàn)。計(jì)算公式如下。計(jì)算公式如下。在本節(jié)中介紹幾種常見的非線性回歸模型,在本節(jié)中介紹幾種常見的非線性回歸模型,并分別給出其線性化方法及圖形。并分別給出其線性化方法及圖形。研究問題研究問題 研究民用汽車總量與國(guó)內(nèi)生產(chǎn)總值的關(guān)系。研究民用汽車總量與國(guó)內(nèi)生產(chǎn)總值的關(guān)系。數(shù)據(jù)如表數(shù)據(jù)如表7-37-3所示。(資料來源:所示。(資料來源:中國(guó)統(tǒng)計(jì)中國(guó)統(tǒng)計(jì)年鑒年鑒20072007,中國(guó)統(tǒng)計(jì)出版社,中國(guó)統(tǒng)計(jì)出版社,20072007
28、年)年)7.4.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟7.4.3 結(jié)果和討論結(jié)果和討論 (1 1)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的值,如下表所示。值,如下表所示。(2 2)第二部分輸出的是觀察值和)第二部分輸出的是觀察值和CubicCubic,PowerPower兩種曲線預(yù)測(cè)值的對(duì)比圖,如圖兩種曲線預(yù)測(cè)值的對(duì)比圖,如圖7-127-12所所示。示。7.5.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:在一元回歸分析中,一般首先繪制定義:在一元回歸分析中,一般首先繪制自變量和因變量間的散點(diǎn)圖,然后通過數(shù)據(jù)在自變量和因變量間的散點(diǎn)圖,然后通過數(shù)
29、據(jù)在散點(diǎn)圖中的分布特點(diǎn)選擇所要進(jìn)行回歸分析的散點(diǎn)圖中的分布特點(diǎn)選擇所要進(jìn)行回歸分析的類型,是使用線性回歸分析還是某種非線性的類型,是使用線性回歸分析還是某種非線性的回歸分析。回歸分析。然而,在實(shí)際問題中,用戶往往不能確定然而,在實(shí)際問題中,用戶往往不能確定究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這時(shí)可以采用曲線估計(jì)的方法,其步驟如下:時(shí)可以采用曲線估計(jì)的方法,其步驟如下:首先根據(jù)實(shí)際問題本身特點(diǎn),同時(shí)選首先根據(jù)實(shí)際問題本身特點(diǎn),同時(shí)選擇幾種模型;擇幾種模型;然后然后SPSSSPSS自動(dòng)完成模型的參數(shù)估計(jì),自動(dòng)完成模型的參數(shù)估計(jì),并顯示并顯示R2R2、F F
30、檢驗(yàn)值、相伴概率值等統(tǒng)計(jì)量;檢驗(yàn)值、相伴概率值等統(tǒng)計(jì)量;最后,選擇具有最后,選擇具有R2R2統(tǒng)計(jì)量值最大的模統(tǒng)計(jì)量值最大的模型作為此問題的回歸模型,并作一些預(yù)測(cè)。型作為此問題的回歸模型,并作一些預(yù)測(cè)。研究問題研究問題 試用試用SPSSSPSS對(duì)國(guó)內(nèi)生產(chǎn)總值和社會(huì)消費(fèi)品對(duì)國(guó)內(nèi)生產(chǎn)總值和社會(huì)消費(fèi)品零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)如表如表7-47-4所示。(資料來源:所示。(資料來源:中國(guó)統(tǒng)計(jì)年鑒中國(guó)統(tǒng)計(jì)年鑒20072007,中國(guó)統(tǒng)計(jì)出版社,中國(guó)統(tǒng)計(jì)出版社,20072007年)年)7.5.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程年年 份份國(guó)內(nèi)生產(chǎn)總值(億元)國(guó)
31、內(nèi)生產(chǎn)總值(億元)社會(huì)消費(fèi)品零售總額(億元)社會(huì)消費(fèi)品零售總額(億元)19783645.21558.619794062.61800.019804545.62140.019814891.62350.019825323.42570.019835962.72849.419847208.13376.419859016.04305.0198610275.24950.0198712058.65820.0198815042.87440.0198916992.38101.4199018667.88300.1199121781.59415.6199226923.510993.7199335333.912462.
32、1199448197.916264.7199560793.720620.0199671176.624774.1199778973.027298.9199884402.329152.5199989677.131134.7200099214.634152.62001109655.237595.22002120332.748135.92003135822.852516.32004159878.359501.02005183867.967176.62006210871.076410.0 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)SPSSSPSS輸出結(jié)果文件中的第一部分如輸出結(jié)果文件中的第一部分如下表所示。下表所示。
33、7.5.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二部分如圖)輸出的結(jié)果文件中第二部分如圖7-7-1515所示。所示。(3 3)由于進(jìn)行曲線估計(jì)時(shí)所選的曲線模)由于進(jìn)行曲線估計(jì)時(shí)所選的曲線模型種類較多,所以使得輸出的觀察值與在各種型種類較多,所以使得輸出的觀察值與在各種函數(shù)模型條件下預(yù)測(cè)值的對(duì)比圖比較復(fù)雜,不函數(shù)模型條件下預(yù)測(cè)值的對(duì)比圖比較復(fù)雜,不易分辨出究竟易分辨出究竟LinearLinear,QuadraticQuadratic,CubicCubic及及PowerPower這這4 4種曲線究竟哪種的對(duì)樣本觀察值的種曲線究竟哪種的對(duì)樣本觀察值的擬合優(yōu)度更符合實(shí)際。擬合優(yōu)度更符合實(shí)
34、際。(4 4)重新回到圖)重新回到圖7-137-13所示對(duì)話框,在所示對(duì)話框,在“ModelModel”框內(nèi)只選中框內(nèi)只選中“QuadraticQuadratic”和和“CubicCubic”這兩種擬合優(yōu)度更高的曲線模型進(jìn)行估計(jì)。得這兩種擬合優(yōu)度更高的曲線模型進(jìn)行估計(jì)。得出它們與觀察值的對(duì)比圖,如圖出它們與觀察值的對(duì)比圖,如圖7-177-17所示。所示。(5 5)如果在圖)如果在圖7-137-13所示對(duì)話框中選中了所示對(duì)話框中選中了“Display ANOVA tableDisplay ANOVA table”項(xiàng),作回歸方程顯項(xiàng),作回歸方程顯著性檢驗(yàn),將輸出相應(yīng)的方差分析表,以著性檢驗(yàn),將輸出
35、相應(yīng)的方差分析表,以CubicCubic模型為例(如下表所示),其結(jié)果是:模型為例(如下表所示),其結(jié)果是:回歸方程顯著有意義,并且回歸方程顯著有意義,并且x,x2,x3x,x2,x3三個(gè)自變?nèi)齻€(gè)自變量的系數(shù)顯著不為零。量的系數(shù)顯著不為零。(6 6)由于在圖)由于在圖7-137-13所示對(duì)話框中選了所示對(duì)話框中選了“SaveSave”項(xiàng),且在圖項(xiàng),且在圖7-147-14所示的所示的“Save Save VariablesVariables”框中選擇了框中選擇了“Predicted valuesPredicted values”,“ResidualsResiduals”和和“Prediction
36、 intervalsPrediction intervals”3 3個(gè)選項(xiàng),因此在個(gè)選項(xiàng),因此在SPSSSPSS數(shù)據(jù)編輯窗口中就增了數(shù)據(jù)編輯窗口中就增了fit_1fit_1,err_1err_1,lcl_1lcl_1,ucl_1ucl_1等等4444個(gè)變量的個(gè)變量的值,如圖值,如圖7-187-18所示。所示。7.6.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:時(shí)間序列的曲線估計(jì)是分析社會(huì)和定義:時(shí)間序列的曲線估計(jì)是分析社會(huì)和經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計(jì)。通常把經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計(jì)。通常把時(shí)間設(shè)為自變量時(shí)間設(shè)為自變量x x,代表具體的經(jīng)濟(jì)或社會(huì)現(xiàn),代表具體的經(jīng)濟(jì)或
37、社會(huì)現(xiàn)象的變量設(shè)為因變量象的變量設(shè)為因變量y y,研究變量,研究變量x x與與y y之間關(guān)之間關(guān)系的方法就是時(shí)間序列曲線估計(jì)。其具體步驟系的方法就是時(shí)間序列曲線估計(jì)。其具體步驟與一般的曲線估計(jì)基本類似。與一般的曲線估計(jì)基本類似。計(jì)算公式:計(jì)算公式:SPSSSPSS中時(shí)間序列的曲線估計(jì)中時(shí)間序列的曲線估計(jì)模型與上一節(jié)所介紹相同。模型與上一節(jié)所介紹相同。研究問題研究問題 試用試用SPSSSPSS對(duì)對(duì)1978197820062006年間社會(huì)消費(fèi)品年間社會(huì)消費(fèi)品零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)如表如表7-57-5所示。(資料來源:所示。(資料來源:中國(guó)統(tǒng)
38、計(jì)年鑒中國(guó)統(tǒng)計(jì)年鑒20072007,中國(guó)統(tǒng)計(jì)出版社,中國(guó)統(tǒng)計(jì)出版社,20072007年)年)7.6.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程序序 號(hào)號(hào)年年 份份社會(huì)消費(fèi)品零售總額(億元)社會(huì)消費(fèi)品零售總額(億元)119781558.6219791800.0319802140.0419812350.0519822570.0619832849.4719843376.4819854305.0919864950.01019875820.01119887440.01219898101.41319908300.11419919415.615199210993.716199314270.417199418622.9
39、18199523613.819199628360.220199731252.921199833378.122199935647.923200039105.724200143055.425200248135.926200352516.327200459501.028200567176.629200676410.0 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的值如下表所示。值如下表所示。7.6.3 結(jié)果和討論結(jié)果和討論 (2 2)第二部分輸出的是觀察值)第二部分輸出的是觀察值LinearLinear,CubicCubic,PowerPower和和Exp
40、onential 4Exponential 4種曲線預(yù)測(cè)值種曲線預(yù)測(cè)值的對(duì)比圖,如圖的對(duì)比圖,如圖7-217-21所示。所示。(3 3)由于在圖)由于在圖7-197-19所示所示“Curve Curve EstimationEstimation”對(duì)話框(三)中選了對(duì)話框(三)中選了“SaveSave”項(xiàng),項(xiàng),且在圖且在圖7-207-20的的“Save VariablesSave Variables”框中選擇了框中選擇了“Predicted valuesPredicted values”選項(xiàng)和選項(xiàng)和“Predict Predict CasesCases”框中選擇了框中選擇了“Predict th
41、roughPredict through”項(xiàng),項(xiàng),并且在并且在“ObservationObservation”框中鍵入了框中鍵入了“3131”,因,因此在此在SPSSSPSS數(shù)據(jù)編輯窗口中就新增了數(shù)據(jù)編輯窗口中就新增了fit_1fit_1,fit_2fit_2,fit_3fit_3和和fit_4fit_4等等4 4個(gè)變量的預(yù)測(cè)值,個(gè)變量的預(yù)測(cè)值,同時(shí)在窗口下方還新增了兩個(gè)個(gè)案,它們分別同時(shí)在窗口下方還新增了兩個(gè)個(gè)案,它們分別代表對(duì)代表對(duì)20072007年和年和20082008年的預(yù)測(cè)值。如圖年的預(yù)測(cè)值。如圖7-227-22所示。所示。7.7.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式
42、 定義:前面幾節(jié)所討論的回歸模型中,因定義:前面幾節(jié)所討論的回歸模型中,因變量和自變量都是可以直接用數(shù)字計(jì)量的,即變量和自變量都是可以直接用數(shù)字計(jì)量的,即可以獲得其實(shí)際觀測(cè)值(如收入、支出、產(chǎn)量、可以獲得其實(shí)際觀測(cè)值(如收入、支出、產(chǎn)量、國(guó)內(nèi)生產(chǎn)總值等),這類變量稱作數(shù)量變量、國(guó)內(nèi)生產(chǎn)總值等),這類變量稱作數(shù)量變量、定量變量或數(shù)量因素。然而,在實(shí)際問題的研定量變量或數(shù)量因素。然而,在實(shí)際問題的研究中,經(jīng)常會(huì)碰到一些非數(shù)量型的變量,如性究中,經(jīng)常會(huì)碰到一些非數(shù)量型的變量,如性別、民族、職業(yè)、文化程度、地區(qū)、正常年份別、民族、職業(yè)、文化程度、地區(qū)、正常年份與干旱年份、改革前與改革后等定性變量。與干
43、旱年份、改革前與改革后等定性變量。在建立一個(gè)實(shí)際問題的回歸方程時(shí),經(jīng)常在建立一個(gè)實(shí)際問題的回歸方程時(shí),經(jīng)常需要考慮這些定性變量。例如,建立糧食產(chǎn)量需要考慮這些定性變量。例如,建立糧食產(chǎn)量預(yù)測(cè)方程就應(yīng)考慮到正常年份與受災(zāi)年份的不預(yù)測(cè)方程就應(yīng)考慮到正常年份與受災(zāi)年份的不同影響;建立空調(diào)的銷售模型時(shí),除了要考慮同影響;建立空調(diào)的銷售模型時(shí),除了要考慮居民收入和商品價(jià)格這兩個(gè)量的因素之外,還居民收入和商品價(jià)格這兩個(gè)量的因素之外,還必須將必須將“季節(jié)季節(jié)”這個(gè)質(zhì)的因素,作為一個(gè)重要這個(gè)質(zhì)的因素,作為一個(gè)重要解釋變量。解釋變量。由于受到質(zhì)的因素影響,回歸模型的參數(shù)由于受到質(zhì)的因素影響,回歸模型的參數(shù)不再是
44、固定不變的。例如,在空調(diào)銷售模型中,不再是固定不變的。例如,在空調(diào)銷售模型中,收入、價(jià)格與空調(diào)銷售額的關(guān)系是隨著季節(jié)變收入、價(jià)格與空調(diào)銷售額的關(guān)系是隨著季節(jié)變化而改變的,也就是說,在不同的季節(jié)回歸?;淖兊模簿褪钦f,在不同的季節(jié)回歸模型的參數(shù)也會(huì)有所不同。再如,我國(guó)居民的消型的參數(shù)也會(huì)有所不同。再如,我國(guó)居民的消費(fèi)行為在改革開放前后大不相同,因此消費(fèi)函費(fèi)行為在改革開放前后大不相同,因此消費(fèi)函數(shù)的參數(shù)也會(huì)發(fā)生變化。顯然,如果忽略質(zhì)的數(shù)的參數(shù)也會(huì)發(fā)生變化。顯然,如果忽略質(zhì)的因素,仍把模型中的參數(shù)看作是固定不變的,因素,仍把模型中的參數(shù)看作是固定不變的,得到的參數(shù)估計(jì)量就不能正確描述經(jīng)濟(jì)變量之得
45、到的參數(shù)估計(jì)量就不能正確描述經(jīng)濟(jì)變量之間的關(guān)系。間的關(guān)系。在回歸分析中,對(duì)一些自變量是定性變量在回歸分析中,對(duì)一些自變量是定性變量的先作數(shù)量化處理,處理的方法是引進(jìn)只取的先作數(shù)量化處理,處理的方法是引進(jìn)只取“0 0”和和“1 1”兩個(gè)值的兩個(gè)值的0 01 1型虛擬自變量。當(dāng)某型虛擬自變量。當(dāng)某一屬性出現(xiàn)時(shí),虛擬變量取值為一屬性出現(xiàn)時(shí),虛擬變量取值為“1 1”,否則,否則取值為取值為“0 0”。例如,令。例如,令“1 1”表示改革開放以表示改革開放以后的時(shí)期,后的時(shí)期,“0 0”則表示改革開放以前的時(shí)期。則表示改革開放以前的時(shí)期。再如,用再如,用“l(fā) l”表示某人是男性,表示某人是男性,“0 0
46、”則表示則表示某人是女性。虛擬變量也稱為啞變量。需要指某人是女性。虛擬變量也稱為啞變量。需要指出的是,雖然虛擬變量取某一數(shù)值,但這一數(shù)出的是,雖然虛擬變量取某一數(shù)值,但這一數(shù)值沒有任何數(shù)量大小的意義,它僅僅用來說明值沒有任何數(shù)量大小的意義,它僅僅用來說明觀察單位的性質(zhì)和屬性。觀察單位的性質(zhì)和屬性。如果在回歸模型中需要引入多個(gè)如果在回歸模型中需要引入多個(gè)0 01 1型虛型虛擬變量擬變量D D時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來確定:對(duì)于包含一個(gè)具有確定:對(duì)于包含一個(gè)具有k k種特征或狀態(tài)的質(zhì)種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項(xiàng),因素的回歸模型,如果回
47、歸模型不帶常數(shù)項(xiàng),則中需引入則中需引入k k個(gè)個(gè)0 01 1型虛擬變量型虛擬變量D D;如果有常數(shù);如果有常數(shù)項(xiàng),則只需引入項(xiàng),則只需引入k k1 1個(gè)個(gè)0 01 1型虛擬變量型虛擬變量D D。當(dāng)。當(dāng)k=2k=2時(shí),只需要引入一個(gè)時(shí),只需要引入一個(gè)0 01 1型虛擬變量型虛擬變量D D。計(jì)算公式如下。計(jì)算公式如下。下面以自變量所含定性變量是一個(gè)還是多下面以自變量所含定性變量是一個(gè)還是多個(gè)來分別說明如何構(gòu)造含虛擬自變量的回歸模個(gè)來分別說明如何構(gòu)造含虛擬自變量的回歸模型。型。(1 1)自變量中只含一個(gè)定性變量,且這)自變量中只含一個(gè)定性變量,且這個(gè)定性變量只有兩種特征的簡(jiǎn)單情況時(shí)。個(gè)定性變量只有兩
48、種特征的簡(jiǎn)單情況時(shí)。(2 2)自變量中含多個(gè)定性變量時(shí)。)自變量中含多個(gè)定性變量時(shí)。研究問題研究問題 研究采取某項(xiàng)保險(xiǎn)革新措施的速度研究采取某項(xiàng)保險(xiǎn)革新措施的速度y y與保與保險(xiǎn)公司的規(guī)模險(xiǎn)公司的規(guī)模x1x1及其類型及其類型d d之間的關(guān)系,數(shù)據(jù)之間的關(guān)系,數(shù)據(jù)如表如表7-67-6所示。所示。7.7.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程iyx1d11715102269203211750430310522104060277071221008191200942900101623801128164112152721131129511438681153185116212241172016611813305
49、11930124120142461 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)第一部分輸出結(jié)果文件中的第一個(gè))第一部分輸出結(jié)果文件中的第一個(gè)表格如下表所示。表格如下表所示。7.7.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二個(gè)表格如下)輸出的結(jié)果文件中第二個(gè)表格如下表所示。表所示。(3 3)輸出的結(jié)果文件中第三個(gè)表格如下)輸出的結(jié)果文件中第三個(gè)表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個(gè)表格如下)輸出的結(jié)果文件中第四個(gè)表格如下表所示。表所示。7.8.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:邏輯回歸分析是對(duì)定性變量的回歸定義:邏輯回歸分析是對(duì)定性變量的回歸分析。分析
50、??捎糜谔幚矶ㄐ砸蜃兞康慕y(tǒng)計(jì)分析方法有:可用于處理定性因變量的統(tǒng)計(jì)分析方法有:判別分析(判別分析(Discriminant analysisDiscriminant analysis)、)、ProbitProbit分析、分析、LogisticLogistic回歸分析和對(duì)數(shù)線性回歸分析和對(duì)數(shù)線性模型等。在社會(huì)科學(xué)中,應(yīng)用最多的是模型等。在社會(huì)科學(xué)中,應(yīng)用最多的是LogisticLogistic回歸分析?;貧w分析。LogisticLogistic回歸分析根據(jù)回歸分析根據(jù)因變量取值類別不同,又可以分為因變量取值類別不同,又可以分為Binary Binary LogisticLogistic回歸分析和
51、回歸分析和Multinomi-nal Multinomi-nal LogisticLogistic回歸分析。回歸分析。Binary Logistic Binary Logistic回歸模型中因變量只能回歸模型中因變量只能取兩個(gè)值取兩個(gè)值1 1和和0 0(虛擬因變量),而(虛擬因變量),而Multinomial LogisticMultinomial Logistic回歸模型中因變量可回歸模型中因變量可以取多個(gè)值。本節(jié)將只討論以取多個(gè)值。本節(jié)將只討論Binary LogisticBinary Logistic回歸,并簡(jiǎn)稱回歸,并簡(jiǎn)稱LogisticLogistic回歸(與回歸(與7.57.5節(jié)曲
52、線估節(jié)曲線估計(jì)中介紹的計(jì)中介紹的LogisticLogistic曲線模型相區(qū)別)。曲線模型相區(qū)別)。LogisticLogistic函數(shù)的形式為函數(shù)的形式為 與任何概率一樣,似然的取值范圍在與任何概率一樣,似然的取值范圍在0,10,1之間。之間。2LL2LL的計(jì)算公式為的計(jì)算公式為1-2對(duì)數(shù)似然值(對(duì)數(shù)似然值(-2 log likelihood,-2LL)Logistic Logistic回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公式為式為 在實(shí)際問題中,通常采用如下分類表在實(shí)際問題中,通常采用如下分類表(Classification TableClassification Table
53、)反映擬合效果。)反映擬合效果。2擬合優(yōu)度(擬合優(yōu)度(Goodness of Fit)統(tǒng)計(jì)量)統(tǒng)計(jì)量Predicted(預(yù)測(cè)值)01Percent Correct(正確分類比例)Observed(觀測(cè)值)0n00n01f01n10n11f1Overall(總計(jì))ffClassification Table for YClassification Table for Y3Cox和和Snell的的R 2(Cox&Snells R-Square)4Nagelkerke的的R 2(N agelkerkes R-Square)5偽偽R 2(Psedo-R-square)偽偽R R2 2與線性回歸模型的與
54、線性回歸模型的R R2 2相對(duì)應(yīng),其意義相對(duì)應(yīng),其意義相似,但它小于相似,但它小于1 1。6Hosmer和和Lemeshow的擬合優(yōu)度檢驗(yàn)的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量(統(tǒng)計(jì)量(Hosmer and Lemeshows Goodness of Fit Test Statistic)與一般擬合優(yōu)度檢驗(yàn)不同,與一般擬合優(yōu)度檢驗(yàn)不同,HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗(yàn)通常把樣本數(shù)據(jù)根的擬合優(yōu)度檢驗(yàn)通常把樣本數(shù)據(jù)根據(jù)預(yù)測(cè)概率分為據(jù)預(yù)測(cè)概率分為1010組,然后根據(jù)觀測(cè)頻數(shù)和期組,然后根據(jù)觀測(cè)頻數(shù)和期望頻數(shù)構(gòu)造卡方統(tǒng)計(jì)量(即望頻數(shù)構(gòu)造卡方統(tǒng)計(jì)量(即HosmerHosmer和和
55、LemeshowLemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量,簡(jiǎn)稱的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量,簡(jiǎn)稱H-LH-L擬擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量),最后根據(jù)自由度為合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量),最后根據(jù)自由度為8 8的的卡方分布計(jì)算其值并對(duì)卡方分布計(jì)算其值并對(duì)LogisticLogistic模型進(jìn)行檢模型進(jìn)行檢驗(yàn)。驗(yàn)。如果該如果該p p值小于給定的顯著性水平(如值小于給定的顯著性水平(如=0.05=0.05),則拒絕因變量的觀測(cè)值與模型預(yù)測(cè)),則拒絕因變量的觀測(cè)值與模型預(yù)測(cè)值不存在差異的零假設(shè),表明模型的預(yù)測(cè)值與值不存在差異的零假設(shè),表明模型的預(yù)測(cè)值與觀測(cè)值存在顯著差異。如果值大于,我們沒有觀測(cè)值存在顯著差異。如果值大于,我們沒有
56、充分的理由拒絕零假設(shè),表明在可接受的水平充分的理由拒絕零假設(shè),表明在可接受的水平上模型的估計(jì)擬合了數(shù)據(jù)。上模型的估計(jì)擬合了數(shù)據(jù)。7Wald統(tǒng)計(jì)量統(tǒng)計(jì)量 Wald Wald統(tǒng)計(jì)量用于判斷一個(gè)變量是否應(yīng)該統(tǒng)計(jì)量用于判斷一個(gè)變量是否應(yīng)該包含在模型中,其檢驗(yàn)步驟如下。包含在模型中,其檢驗(yàn)步驟如下。(1 1)提出假設(shè)。)提出假設(shè)。(2 2)構(gòu)造)構(gòu)造WaldWald統(tǒng)計(jì)量。統(tǒng)計(jì)量。(3 3)作出統(tǒng)計(jì)判斷。)作出統(tǒng)計(jì)判斷。研究問題研究問題 在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會(huì)調(diào)查中,因變量具的社會(huì)調(diào)查中,因變量y=1y=1表示居民主要乘表示居民主要乘坐公共汽車上
57、下班;坐公共汽車上下班;y y=0=0表示主要騎自行車表示主要騎自行車上下班;自變量上下班;自變量x1x1表示被調(diào)查者的年齡;表示被調(diào)查者的年齡;x2x2表表示被調(diào)查者的月收入;示被調(diào)查者的月收入;x3x3表示被調(diào)查者的性別表示被調(diào)查者的性別(x3=1x3=1為男性,為男性,x3=0 x3=0為女性)。為女性)。試建立試建立y y與自變量間的與自變量間的LogisticLogistic回歸,數(shù)據(jù)如回歸,數(shù)據(jù)如表表7-77-7所示。所示。7.8.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程序號(hào)序號(hào)x1(年齡)(年齡)x2(月收入:元)(月收入:元)x3(性別)(性別)y1188500022112000032
58、38500142395001528120001631850007361500018421000019469500110481200001155180001125621000113581800011418850101520100010162512001017271300101828150010193095011203210001021331800102233100010233812001024411500102545180011264810001027521500112856180011 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)第一部分輸出結(jié)果有兩個(gè)表格,第)第一部分輸出結(jié)果有兩個(gè)表格,第一個(gè)表格說明所有個(gè)
59、案(一個(gè)表格說明所有個(gè)案(2828個(gè))都被選入作為個(gè))都被選入作為回歸分析的個(gè)案。回歸分析的個(gè)案。7.8.3 結(jié)果和討論結(jié)果和討論 第二個(gè)表格說明初始的因變量值(第二個(gè)表格說明初始的因變量值(0 0,1 1)已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的0 0、1 1數(shù)值。數(shù)值。(2 2)第二部分()第二部分(Block 0Block 0)輸出結(jié)果有)輸出結(jié)果有4 4個(gè)表格。個(gè)表格。(3 3)Omnibus Tests of Model Omnibus Tests of Model CoefficientsCoefficients表格列出了模型系數(shù)的表格列出了模型系數(shù)的Omnib
60、us Omnibus TestsTests結(jié)果。結(jié)果。(4 4)Model SummaryModel Summary表給出了表給出了-2-2 對(duì)數(shù)似對(duì)數(shù)似然值、然值、CoxCox和和SnellSnell的的R2R2以及以及NagelkerkeNagelkerke的的R2R2檢驗(yàn)統(tǒng)計(jì)結(jié)果。檢驗(yàn)統(tǒng)計(jì)結(jié)果。(5 5)Hosmer and Lemeshow TestHosmer and Lemeshow Test表格以表格以及及Contingency Table for Hosmer and Contingency Table for Hosmer and Lemeshow TestLemeshow
61、Test表格給出了表格給出了HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量。的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量。(6 6)Classification TableClassification Table分類表說明分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看第一次迭代結(jié)果的擬合效果,從該表格可以看出對(duì)于出對(duì)于y=0y=0,有,有86.7%86.7%的準(zhǔn)確性;對(duì)于的準(zhǔn)確性;對(duì)于y=1y=1,有,有76.9%76.9%準(zhǔn)確性,因此對(duì)于所有個(gè)案總共有準(zhǔn)確性,因此對(duì)于所有個(gè)案總共有82.1%82.1%的準(zhǔn)確性。的準(zhǔn)確性。(7 7)Variables in the Equatio
62、nVariables in the Equation表格表格列出了列出了Step 1Step 1中各個(gè)變量對(duì)應(yīng)的系數(shù),以及中各個(gè)變量對(duì)應(yīng)的系數(shù),以及該變量對(duì)應(yīng)的該變量對(duì)應(yīng)的Wald Wald 統(tǒng)計(jì)量值和它對(duì)應(yīng)的相伴統(tǒng)計(jì)量值和它對(duì)應(yīng)的相伴概率。從該表格中可以看出概率。從該表格中可以看出x3x3相伴概率最小,相伴概率最小,WaldWald統(tǒng)計(jì)量最大,可見該變量在模型中很重要。統(tǒng)計(jì)量最大,可見該變量在模型中很重要。(8 8)Correlation MatrixCorrelation Matrix表格列出了常表格列出了常數(shù)數(shù)ConstantConstant、系數(shù)之間的相關(guān)矩陣。常數(shù)與、系數(shù)之間的相關(guān)矩
63、陣。常數(shù)與x2x2之間的相關(guān)性最大,之間的相關(guān)性最大,x1x1和和x3x3之間的相關(guān)性之間的相關(guān)性最小。最小。(9 9)圖)圖7-267-26所示是觀測(cè)值和預(yù)測(cè)概率分所示是觀測(cè)值和預(yù)測(cè)概率分布圖。該圖以布圖。該圖以0 0和和1 1為符號(hào),每四個(gè)符號(hào)代表一為符號(hào),每四個(gè)符號(hào)代表一個(gè)個(gè)案。橫坐標(biāo)是個(gè)案屬于個(gè)個(gè)案。橫坐標(biāo)是個(gè)案屬于1 1的錄屬度,這里的錄屬度,這里稱為預(yù)測(cè)概率(稱為預(yù)測(cè)概率(Predicted ProbabilityPredicted Probability)。)??v坐標(biāo)是個(gè)案分布頻數(shù),反映個(gè)案的分布??v坐標(biāo)是個(gè)案分布頻數(shù),反映個(gè)案的分布。(1010)邏輯回歸的最后一個(gè)輸出表格是)邏
64、輯回歸的最后一個(gè)輸出表格是Casewise ListCasewise List,列出了殘差大于,列出了殘差大于2 2的個(gè)案。的個(gè)案?;貧w分析是研究變量與變量之間聯(lián)系的最回歸分析是研究變量與變量之間聯(lián)系的最為廣泛的模型。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、為廣泛的模型。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、類型,以及變量之間的相關(guān)關(guān)系,回歸分析通類型,以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、常分為一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析和邏輯回歸分估計(jì)、含虛擬自變量的回歸分析和邏輯回歸分析等。析等。
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。