唐靜榮
引言:現(xiàn)今統(tǒng)計(jì)軟件眾多,R軟件、SPSS、Stata和Weka等均擁有大量用戶。本文通過對(duì)比統(tǒng)計(jì)軟件中R和SPSS,細(xì)致分析他們各自的特點(diǎn)、功能、適用對(duì)象,為用戶對(duì)統(tǒng)計(jì)軟件的選擇提供幫助。
相對(duì)于SPSS,R軟件起步較晚。SPSS是最早出現(xiàn)的統(tǒng)計(jì)分析軟件,也是最早采用圖形菜單驅(qū)動(dòng)界面的統(tǒng)計(jì)軟件;R軟件誕生于1980年左右,采用編程語言,擁有簡潔的命令窗口。SPSS操作容易,受到初學(xué)者的歡迎,通過交互界面,點(diǎn)擊菜單即可完成對(duì)數(shù)據(jù)的分析;
R軟件要求用戶使用R語言,通過輸入正確的命令來完成操作。相對(duì)于SPSS,R軟件具有很強(qiáng)的靈活性,自定義的輸入形式和開放的源代碼讓R軟件風(fēng)靡全球。
Wilcoxon符號(hào)秩檢驗(yàn)屬于兩樣本非參數(shù)檢驗(yàn)的一種,SPSS和R軟件均可實(shí)現(xiàn)其操作。下面分析R軟件、SPSS用于Wilcoxon符號(hào)秩檢驗(yàn)的不同。
案例:改制前后某廠八個(gè)車間競爭性的比較:
車間 1 2 3 4 5 6 7 8
改制前 37 72 57 44 43 64 55 65
改制后 40 73 59 43 51 67 61 74
問:改制前后競爭性有無顯著差異。
(一)SPSS操作步驟:
1、建立變量2、輸入數(shù)據(jù)3、分析-分參數(shù)檢驗(yàn)-舊對(duì)話框-2個(gè)相關(guān)樣本4、選擇檢驗(yàn)變量5、選擇Wilcoxon檢驗(yàn)方法6、確定。結(jié)果如下:
秩
N 秩均值 秩和
改制后 - 改制前 負(fù)秩 1a 1.50 1.50
正秩 7b 4.93 34.50
結(jié) 0c
總數(shù) 8
a. 改制后 < 改制前
b. 改制后 > 改制前
c. 改制后 = 改制前
檢驗(yàn)統(tǒng)計(jì)量b
改制后 - 改制前
Z -2.316a
漸近顯著性(雙側(cè)) .021
a. 基于負(fù)秩。
b. Wilcoxon 帶符號(hào)秩檢驗(yàn)
改制后—改制前:負(fù)秩個(gè)數(shù)為1,正秩個(gè)數(shù)為7;負(fù)秩的平均值和秩和均為1.5,正秩的平均值和秩和分別為4.93、34.5。Z統(tǒng)計(jì)量為-2.316,雙側(cè)檢驗(yàn)的P值為0.021。選擇5%的顯著性水平,α=0.05,0.021<0.05拒絕原假設(shè),認(rèn)為八個(gè)車間改制前后有顯著差異。
(二)R軟件操作步驟
R軟件可以選擇左邊、右邊、雙邊檢驗(yàn)以配合不同的檢驗(yàn)類型,本題為配合SPSS選擇了雙邊檢驗(yàn),雙邊檢驗(yàn)在命令中可以省略。SPSS在舊對(duì)話框選項(xiàng)中選擇2個(gè)相關(guān)樣本檢驗(yàn),R軟件的命令形式為paierd=true。Wilcoxon符號(hào)秩檢驗(yàn)在R軟件中可以用于檢驗(yàn)兩獨(dú)立樣本的情況,選擇更具有多樣性。
SPSS擁有中英雙界面,輸出結(jié)果也有中英兩種格式,用戶可以自由選擇。SPSS操作簡便,用戶只要具備基本的統(tǒng)計(jì)知識(shí)即可用SPSS分析數(shù)據(jù)。便捷的菜單欄可以提供多種數(shù)據(jù)分析方式,用戶無需花費(fèi)大量時(shí)間記憶繁多的命令和過程。SPSS能夠進(jìn)行數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、圖形制作、報(bào)表等功能,提供了簡單的描述統(tǒng)計(jì)及復(fù)雜的多因素分析方法,比如主成分分析、因子分析、聚類分析、參數(shù)檢驗(yàn)、非參數(shù)檢驗(yàn)等;能夠讀取多種數(shù)據(jù)格式,比如*.dbf、*.xls等,可以輸出*.txt及html格式的文件。SPSS是制圖方面的強(qiáng)手,由于缺少穩(wěn)健和調(diào)查的方法,處理前沿的統(tǒng)計(jì)過程是其弱項(xiàng)。
同樣是統(tǒng)計(jì)分析軟件的R軟件,有著區(qū)別于SPSS的獨(dú)特之處。它擁有極簡的界面,數(shù)據(jù)處理過程完全依賴R語言,只有輸入正確的命令,R軟件才能運(yùn)算。所以R軟件更適合高級(jí)用戶,R軟件用戶需掌握大量的編程語言,否則無法運(yùn)行R軟件更不能領(lǐng)會(huì)R軟件的魅力。R軟件功能強(qiáng)大,擁有連貫完整的統(tǒng)計(jì)分析工具,數(shù)組運(yùn)算工具,數(shù)據(jù)存儲(chǔ)和處理系統(tǒng),并可實(shí)現(xiàn)用戶的自定義功能。它有成千(3500+)的擴(kuò)展包,涉及金融、聚類、預(yù)測、最優(yōu)化、高性能計(jì)算、自然語言處理等供用戶使用。此外,R軟件是一款免費(fèi)的自由軟件,它有WINDOWS、LINUX、MacOS和UNIX版本,都是可以免費(fèi)下載和使用的。因此,R軟件使得部分用戶成為開發(fā)者,用戶可以自己編寫包進(jìn)行使用和發(fā)布。
用戶對(duì)于SPSS和R軟件的使用,可以根據(jù)其需求及能力。當(dāng)然,SPSS和R軟件的結(jié)合使用能將數(shù)據(jù)處理的更加完美。
參考文獻(xiàn)
[1]薛留根 《應(yīng)用非參數(shù)統(tǒng)計(jì)》 科學(xué)出版社 2013.
[2]何曉群 《多元統(tǒng)計(jì)分析》 中國人民大學(xué)出版社 2012.