《MBA統(tǒng)計學(xué)數(shù)據(jù)的描述培訓(xùn)課程》由會員分享,可在線閱讀,更多相關(guān)《MBA統(tǒng)計學(xué)數(shù)據(jù)的描述培訓(xùn)課程(39頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,單擊此處編輯母版標題樣式,統(tǒng)計學(xué),從數(shù)據(jù)到結(jié)論,第三章數(shù)據(jù)的描述,在對數(shù)據(jù)進行深入加工之前,總應(yīng)該對數(shù)據(jù)有所印象。,可以借助于圖形和簡單的運算,來了解數(shù)據(jù)的一些特征。,由于數(shù)據(jù)是從總體中產(chǎn)生的,其特征也反映了總體的特征。對數(shù)據(jù)的描述也是對其總體的一個近似的描述。,3.1 如何用圖來表示數(shù)據(jù)?,3.1.1 定量變量的圖表示:1.直方圖,對于一個定量變量,比如某個地區(qū)(地區(qū)1)測量了163個高三男生的身高,(S3height1.txt),。,用圖形來表示這個數(shù)據(jù),使人們能夠看出這個數(shù)據(jù)的大體分布或“形狀”的一個辦法是畫,直方圖(his
2、togram),。,圖3.1就是利用這個數(shù)據(jù)由SPSS軟件所畫的直方圖。,該圖的橫坐標是身高區(qū)間,這里每一格代表5cm的身高范圍(格子寬度因不同的數(shù)據(jù)性質(zhì)或要求而定,這里的格子寬度為5cm),而縱坐標為各種身高區(qū)間的身高的頻數(shù)。,直方圖,3.1.1 定量變量的圖表示:2.盒型圖,簡單一些的是,盒形圖(boxplot,又稱箱圖、箱線圖、盒子圖),。,圖3.2的左邊一個是根據(jù)地區(qū)1高三男生的身高數(shù)據(jù)所繪的盒形圖;其右邊的圖代表另一個地區(qū)(地區(qū)2)的高三學(xué)生的身高,(height.txt,height.sav,第三章例.xls),。,盒型圖,盒子的中間橫線是數(shù)據(jù)的中位數(shù)(median),封閉盒子的上
3、下兩橫線(邊)為上下四分位數(shù)(點);按照SPSS的默認選項,如果所有樣本中的數(shù)目都在離四分位點1.5倍盒子長度之內(nèi),則線的端點為最大和最小值,否則線長就是1.5倍的盒子長度(盒子長度稱為四分位間距),在其外面的度量單獨點出,3.1.1 定量變量的圖表示:3.莖葉圖,在直方圖和盒形圖中,很難恢復(fù)數(shù)據(jù)的原貌。而另一種圖:,莖葉圖(stem-and-leaf plots),可以恢復(fù)數(shù)據(jù),以地區(qū)1高三男生身高為例(圖3.3),莖葉圖既展示了分布形狀又有原始數(shù)據(jù)。它象一片帶有莖的葉子。莖為較大位數(shù)的數(shù)字,葉為較小位數(shù)的數(shù)字。,莖葉圖,其中莖葉圖中莖的單位為10cm,而葉子單位為1cm。比如,由于第一行莖
4、為150cm,因此葉子中的九個數(shù)字001223344代表九個數(shù)目150、150、151、152、152、153、153、154、154cm等。每行左邊有一個頻數(shù)(比如第一行有9個數(shù)目,第二行有17個等等);可以看出最長的一行為從165cm到169cm的一段(有35個數(shù))。,3.1.1,定,定,量,量變,量,量的,圖,圖表,示,示:4.,散,散點,圖,圖,數(shù)據(jù),會,會有,兩,兩個,變,變量,,,,如,美,美國,男,男士,和,和女,士,士初,婚,婚年,限,限數(shù),據(jù),據(jù)(marriage.txt,),)。,該數(shù),據(jù),據(jù)描,述,述了,自,自1900年,到,到1998年,男,男女,第,第一,次,次婚,姻
5、,姻延,續(xù),續(xù)的,時,時間,。,。,這里,年,年份,是,是一,個,個變,量,量,,婚,婚姻,延,延續(xù),時,時間,是,是第,二,二個,變,變量,。,。由,于,于不,可,可能,將,將所,有,有人,的,的婚,姻,姻年,限,限都,給,給出,來,來,,所,所以,每,每年,就,就取,了,了一,個,個中,間,間的,值,值(,中,中位,數(shù),數(shù)),作,作為,代,代表,。,。,散點,圖,圖,3.1.2,定,定,性,性變,量,量的,圖,圖表,示,示:,餅,餅圖,定性,變,變量,(,(或,屬,屬性,變,變量,,,,分,類,類變,量,量),不,不能,點,點出,直,直方,圖,圖、,散,散點,圖,圖或,莖,莖葉,圖,圖,,
6、但,但可,以,以描,繪,繪出,它,它們,各,各類,的,的比,例,例。,下面,用,用SPSS繪,的,的圖3.5(餅,圖,圖,piechart)表示,了,了說,世,世界,各,各種,主,主要,語,語言,人,人數(shù),的,的比,例,例(language.txt).,餅圖,3.1.2,定,定,性,性變,量,量的,圖,圖表,示,示:,條,條形,圖,圖,而用,同,同樣,數(shù),數(shù)據(jù),畫,畫的,圖,圖3.6,稱,稱為條形,圖,圖(barchart)。,從每,一,一條,可,可以,看,看出,講,講各,種,種語,言,言的,實,實際,人,人數(shù),,,,而,且,且分,別,別給,出,出了,每,每個,語,語種,中,中母,語,語和,日
7、,日常,使,使用,的,的人,數(shù),數(shù)(,在,在圖,中,中并,排,排放,置,置),。,。條,形,形圖,顯,顯示,比,比例,不,不如,餅,餅圖,直,直觀,。,。,條形,圖,圖,3.2,如,如,何,何用,少,少量,數(shù),數(shù)字,來,來概,括,括數(shù),據(jù),據(jù)?,大量,的,的數(shù),字,字既,繁,繁瑣,又,又不,直,直觀,;,;需,要,要對,數(shù),數(shù)據(jù),做,做人,們,們時,間,間和,耐,耐心,所,所允,許,許的,簡,簡化,我們,可,可以,用,用,“,“平,均,均”,,,,“,差,差距,”,”或,百,百分,比,比等,來,來概,括,括大,量,量數(shù),字,字。,由于,定,定性,變,變量,主,主要,是,是計,數(shù),數(shù),,比,比較
8、,簡,簡單,,,,常,用,用的,概,概括,就,就是,比,比例,或,或百,分,分比,。,。下,面,面主,要,要介,紹,紹關(guān),于,于定,量,量變,量,量的,數(shù),數(shù)字,描,描述,。,。,3.2,如,如,何,何用,少,少量,數(shù),數(shù)字,來,來概,括,括數(shù),據(jù),據(jù)?,可用,少,少量,所,所謂,匯,匯總,統(tǒng),統(tǒng)計,量,量或概括,統(tǒng),統(tǒng)計,量,量(summarystatistic)來描,述,述定,量,量變,量,量的,數(shù),數(shù)據(jù),。,。,這些,數(shù),數(shù)字,是,是從,樣,樣本,數(shù),數(shù)據(jù),得,得來,的,的,,因,因而,也,也是,樣,樣本,的,的函,數(shù),數(shù),,任何,樣,樣本,的,的函,數(shù),數(shù),,只,只要,不,不包,含,含
9、總,體,體的,未,未知,參,參數(shù),,,,都,稱,稱為統(tǒng)計,量,量(statistic)。,樣本,的,的隨,機,機性,決,決定,統(tǒng),統(tǒng)計,量,量的,隨,隨機,性,性(,統(tǒng),統(tǒng)計,量,量也,是,是隨,機,機變,量,量),3.2,如,如,何,何用,少,少量,數(shù),數(shù)字,來,來概,括,括數(shù),據(jù),據(jù)?,概括,統(tǒng),統(tǒng)計,量,量經(jīng),常,常對,應(yīng),應(yīng)于,總,總體,的,的無,法,法觀,測,測到,的,的某,些,些參,數(shù),數(shù)。,這時,,,,統(tǒng),計,計量,可,可作,為,為這,些,些參,數(shù),數(shù)的,估,估計,。,。一,些,些統(tǒng),計,計量,還,還可,以,以用,來,來檢,驗,驗樣,本,本和,假,假設(shè),的,的總,體,體是,否,否
10、一,致,致。,3.2,如,如,何,何用,少,少量,數(shù),數(shù)字,來,來概,括,括數(shù),據(jù),據(jù)?,注:一些,統(tǒng),統(tǒng)計,量,量前,面,面有,時,時加,上,上“,樣,樣本,”,”二,字,字,,以,以區(qū),別,別于,總,總體,的,的同,名,名參,數(shù),數(shù)。,如,如“,樣,樣本,均,均值,”,”和,“,“樣,本,本標,準,準差,”,”,,以,以區(qū),別,別于,總,總體,均,均值,和,和總,體,體標,準,準差,;,;但,在,在不,會,會混,淆,淆時,可,可以,只,只說,“,“均,值,值”,和,和“,標,標準,差,差”,。,。,3.2.1,數(shù),數(shù),據(jù),據(jù)的,“,“位,置,置”,數(shù)據(jù),有,有位,置,置嗎,?,?,這里,三
11、,三個,數(shù),數(shù)據(jù),的,的位,置,置一,樣,樣嗎,?,?,3.2.1,數(shù),數(shù),據(jù),據(jù)的,“,“位,置,置”,“位,置,置”,一,一般,是,是關(guān),于,于數(shù),據(jù),據(jù)中,某,某變,量,量觀,測,測值,的,的“,中,中心,位,位置,”,”或,者,者數(shù),據(jù),據(jù)分,布,布的,中,中心,(,(center或centertendency),。,。,和這,種,種“,位,位置,”,”有,關(guān),關(guān)的,統(tǒng),統(tǒng)計,量,量就,稱,稱為位置,統(tǒng),統(tǒng)計,量,量(locationstatistic)。,位置,統(tǒng),統(tǒng)計,量,量當,然,然不,一,一定,都,都是,描,描述,“,“中,心,心”,了,了,,比,比如,后,后面,要,要講,的,
12、的k,百,百分,位,位數(shù),(,(或k,分,分位,數(shù),數(shù)),。,。,3.2.1,數(shù),數(shù),據(jù),據(jù)的,“,“位,置,置”,最常,用,用的,位,位置,統(tǒng),統(tǒng)計,量,量就,是,是小,學(xué),學(xué)時,所,所學(xué),到,到的,算,算術(shù),平,平均,數(shù),數(shù),,它,它在,統(tǒng),統(tǒng)計,中,中叫,做,做均,值,值(mean);,嚴,嚴格,地,地說,叫,叫做,樣,樣本,均,均值(samplemean),,以,以區(qū),別,別于,總,總體,均,均值,。,。,如果,記,記樣,本,本中,的,的觀,測,測值,為,為,x,1,x,n,,則,樣,樣本,均,均值,定,定義,為,為,(樣,本,本),中,中位,數(shù),數(shù)(median),是,是數(shù),據(jù),據(jù)按
13、,照,照大,小,小排,列,列之,后,后位,于,于中,間,間的,那,那個,數(shù),數(shù)(,如,如果,樣,樣本,量,量為,奇,奇數(shù)),,或,或者,中,中間,兩,兩個,數(shù),數(shù)目,的,的平,均,均(,如,如果,樣,樣本,量,量為,偶,偶數(shù))。,由于,中,中位,數(shù),數(shù)不,易,易被,極,極端,值,值影,響,響,,所,所以,中,中位,數(shù),數(shù)比,均,均值,穩(wěn),穩(wěn)健(robust),。,。,3.2.1,數(shù),數(shù),據(jù),據(jù)的,“,“位,置,置”,上下,四,四分,位,位數(shù)(或,分,分別,稱,稱為第一,四,四分,位,位數(shù),和,和第,三,三四,分,分位,數(shù),數(shù),firstquantile,thirdquantile,),)則分,
14、別,別位,于,于(,按,按大,小,小排,列,列的,),)數(shù),據(jù),據(jù)的,上,上下,四,四分,之,之一,的,的地,方,方。,3.2.1,數(shù),數(shù),據(jù),據(jù)的,“,“位,置,置”,3.2.1,數(shù),數(shù),據(jù),據(jù)的,“,“位,置,置”,一般,地,地還,稱,稱上,四,四分,位,位數(shù),為,為75,百,百分,位,位數(shù),(,(75pecentile,有75,的,觀,觀測,值,值小,于,于它,),),,下,下四,分,分位,數(shù),數(shù)為25,百,百分,位,位數(shù)(有25,的,觀,觀測,值,值小,于,于它,),)。,一般,地,地,k百,分,分位,數(shù),數(shù)(k-pecentile)意,味,味著,有,有k,的,觀,觀測,值,值小,于,
15、于它,。,。,如果,令,令,a,=k%,則k,百,百分,位,位數(shù),也,也稱,為,為,a,分位,數(shù),數(shù)(,a,-quantile),。,。,樣本,中,中出,現(xiàn),現(xiàn)最,多,多的,數(shù),數(shù)目,,,,稱,為,為眾數(shù)(mode),3.2.2,數(shù),數(shù),據(jù),據(jù)的,“,“尺,度,度”,這兩,個,個數(shù),據(jù),據(jù)“,胖,胖瘦,”,”一,樣,樣嗎,?,?,3.2.2,數(shù),數(shù),據(jù),據(jù)的,“,“尺,度,度”,數(shù)據(jù),中,中數(shù),目,目的,分,分散,程,程度,由,由尺度,統(tǒng),統(tǒng)計,量,量(scalestatistic)來描,述,述。,尺度,統(tǒng),統(tǒng)計,量,量是,描,描述,數(shù),數(shù)據(jù),散,散布,,,,即,描,描述,集,集中,與,與分,
16、散,散程,度,度或,變,變化,(,(spread或variability),的,的度,量,量。,3.2.2,數(shù),數(shù),據(jù),據(jù)的,“,“尺,度,度”,從前,面,面兩,個,個高,三,三男,生,生身,高,高數(shù),據(jù),據(jù)的,盒,盒形,圖,圖。,左,左邊,的,的數(shù),據(jù),據(jù)平,均,均要,高,高些,,,,但,右,右邊,的,的數(shù),據(jù),據(jù)散,布,布范,圍,圍要,小,小得,多,多。,統(tǒng)計中有,許,許多尺度,統(tǒng),統(tǒng)計量。,一,一般來說,,,,數(shù)據(jù)越,分,分散,尺,度,度統(tǒng)計量,的,的值越大,。,。,3.2.2 數(shù),據(jù),據(jù)的“尺,度,度”,極差(range);就是極,大,大值和極,小,小值之間,的,的差。,前面兩個,高,高三男生,身,身高數(shù)據(jù),的,的極差分,別,別為50cm和32cm。,盒形圖盒,子,子的長度,為,為兩個四,分,分位數(shù)之,差,差,稱為四分位數(shù),極,極差或四,分,分位間距(interquantile range);它描述,了,了中間半,數(shù),數(shù)觀測值,的,的散布情,況,況。極差,和,和四分位,極,極差實際,上,上各自只,依,依賴于兩,個,個值,信,息,息量太少,。,。,3.2.2 數(shù),據(jù),據(jù)的“尺,度