王二院, 李 俠
(中國人民公安大學公安管理學院, 北京 100038)
T檢驗在公安決策中的應用
王二院, 李 俠
(中國人民公安大學公安管理學院, 北京 100038)
隨著大數據時代的到來,警務工作的數字化趨勢進一步加強,應用統(tǒng)計技術完善傳統(tǒng)的警務定性判斷成為警務改革的重要環(huán)節(jié)。論述3種T檢驗技術在公安決策中的應用:(1)單樣本T檢驗,比較單一樣本均值與已知數值的差異性;(2)兩個獨立樣本T檢驗,比較兩個獨立樣本均值的差異性;(3)兩個配對樣本T檢驗,比較兩個配對樣本均值的差異性。
T檢驗; 單樣本; 獨立樣本; 配對樣本; 公安決策
T檢驗是用t分布理論來推論差異發(fā)生的概率,從而比較兩個平均數的差異是否顯著。它與Z檢驗、卡方檢驗并列。T檢驗是戈斯特為了觀測釀酒質量而發(fā)明的。戈斯特于1908年在《Biometrika》期刊上公布T檢驗,但因其老板認為其為商業(yè)機密而被迫使用筆名student。
2016年9月19日作者利用中國知網檢索“T檢驗”篇名關鍵詞,2013年以來的全部文獻共有97篇。其中最近一篇論文為“應用t分布統(tǒng)計量和t檢驗統(tǒng)計量介紹假設檢驗原理”(秦國友; 趙耐青;中國衛(wèi)生統(tǒng)計, Chinese Journal of Health Statistics, 2016年04期)。檢索“公安T檢驗”篇名關鍵詞,2013年以來的全部文獻共有23篇,但缺乏T檢驗的內容。檢索“警察T檢驗”篇名關鍵詞,2013年以來的全部文獻共有4篇,同樣缺乏T檢驗的內容。
1.1 基本概念
T檢驗就是利用假設檢驗的思想,對平均數的差異進行檢驗。鑒于T檢驗技術的主要理論基礎是T檢驗,本文認為公安T檢驗技術是T檢驗在公安實踐中的具體應用。當然,方差已知時用Z檢驗法和多個總體T檢驗的F檢驗是T檢驗技術的另外兩種情形。
T檢驗技術可以檢驗定性警務分析的結論,增強警務工作的可信度,指明警務工作的方向。本文研究的T檢驗技術包括3種:①單樣本T檢驗;②兩個獨立樣本T檢驗;③兩個配對樣本T檢驗。
T檢驗的一般步驟是:建立假設;計算統(tǒng)計量;查標準值;作出判斷。
1.2T檢驗的軟件操作過程
在“IBM SPSS Statistics 21”(后文簡稱為SPSS)環(huán)境下T檢驗的操作過程基本包括3個步驟。
(1)建立數據文件。
(2)打開對話框。選擇菜單欄中的【Analyze(分析)】→【Compare Means(比較均值)】,打開“T檢驗”主對話框,如圖1所示。
圖1 “T檢驗”主對話框
根據實踐需要分別選擇以下4種模塊實現T檢驗過程:(a)One-SampleTTest;(b)Independent-SampleTTest;(c)Paired-SampleTTest;(d)One-Way ANOVA。
(3)結果分析。統(tǒng)計軟件會直接給出P值,其檢驗判斷規(guī)則如下(雙側檢驗):
如果概率P值小于或等于顯著性水平α,則拒絕零假設H0;
如果概率P值大于顯著性水平α,則接受零假設H0;
如果將以上理論應用于公安實踐則可以將公安定性決策分析升華為公安定量決策分析。
2.1 問題描述
2016年5月13日國家統(tǒng)計局發(fā)布《2015年全國平均工資統(tǒng)計》,數據顯示,2015年全國城鎮(zhèn)非私營單位就業(yè)人員年平均工資62 029元;年平均工資最高行業(yè)是金融業(yè)114 777元;年平均工資最低行業(yè)是農林牧漁業(yè)31 947元。
某市公安局從全局民警中隨機抽取了30人,核算其2015年工資,數據如表1。請問某市公安局民警的工資與全國金融業(yè)、農林牧漁業(yè)的年平均工資有無顯著差異。
2.2 理論分析
單樣本T檢驗是比較某一樣本的平均數與某一確定總體均值是否有統(tǒng)計學意義上的差異。例如,前文“2.1”某市公安局30名民警平均工資與城鎮(zhèn)非私營單位就業(yè)人員年平均工資是否有顯著性差異?可以運用單樣本T檢驗來解決這個問題。
2.3 軟件操作
首先解決某市公安局民警的工資與全國的年平均工資有無顯著差異的問題,后兩個問題可類推。進行如下假設檢驗:H0:μ=62 029;H1:μ≠62 029。
(1)打開對話框。根據表1建立數據文件“1.sav”,選擇菜單欄中的【Analyze】→【Compare Means】→【One-Sample T Test】命令,彈出【One-Sam-ple T Test】對話框。
表1 某市公安局30名民警2015年工資
(2)選擇檢驗變量和樣本檢驗值。
(3)設置顯著性水平。
圖2 “單樣本T檢驗”主對話框
(4)結束操作。單擊【OK】按鈕,完成操作。此時,軟件輸出結果出現在結果瀏覽窗口中。
表2 One-Sample Statistics
表3 One-Sample Test
2.4 公安決策
(1)描述性統(tǒng)計量表
表2呈現了單個樣本的描述性統(tǒng)計量的值,包括參與統(tǒng)計的單個樣本的個案數(N)、均值、標準差和均值的標準誤。
(2)單樣本T檢驗結果報表
表3呈現了單樣本T檢驗的結果,包括T值、自由度(df)、檢驗的概率(Sig.)、均值差值,以及差分的95%置信區(qū)間。如表3所示,本案例T檢驗的T值為-24.855,自由度df=29,雙側T檢驗的概率Sig.(雙側)=0.000。由于顯著性水平為0.05,而0.000<0.05,因此拒絕零假設,即某市公安局民警的工資與全國的年平均工資相比有顯著差異, 且顯著偏低。
(3)某市公安局民警的工資與金融業(yè)、農林牧漁業(yè)的年平均工資有無顯著差異。
(4)某市公安局民警的工資與金融業(yè)的年平均工資有無顯著差異。
參照前述2.3步驟,結論如下:因為t=-144.100, Sig. (2-tailed)=0.000,所以某市公安局民警的工資與金融業(yè)的年平均工資有顯著差異,且顯著偏低。
(5)某市公安局民警的工資與農林牧漁業(yè)的年平均工資有無顯著差異。
參照前述2.3步驟,結論如下:因為t=43.150, Sig. (2-tailed)=0.000,所以某市公安局民警的工資與農林牧漁業(yè)的年平均工資有顯著差異,且顯著偏高。
3.1 問題描述
隨機抽選30名行人對十字路口的交通管理水平進行評分,滿分10分。甲組30人對交警張三負責的十字路口A進行評分;乙組30人對交警李四負責的十字路口B進行評分;兩個小組評分結果如表4所示。請問十字路口A和十字路口B的管理水平有無顯著差異。
3.2 理論分析
本例要檢驗兩個樣本的均值是否有顯著性差異。兩獨立樣本T檢驗就是用來檢驗兩個獨立樣本的均值之間是否顯著差異,即檢驗兩樣本所代表的總體的均值是否相同。兩個樣本平均數差異檢驗要考慮兩個樣本所代表的總體是否正態(tài)分布,總體方差是否已知,還要考慮兩個總體的方差是否齊性,兩個樣本是獨立樣本還是相關樣本,兩個樣本的容量是否相同等問題。根據具體的條件還可以運用如下檢驗:Cochran-Cox-test、非參數檢驗、Z′檢驗。
表4 十字路口A和十字路口B的管理水平評分
3.3 軟件操作
在SPSS中進行兩獨立樣本T檢驗的操作過程如下。
設十字路口A和十字路口B的管理水平評分均值分別為μ1,μ2建立如下假設檢驗:
H0:μ1=μ2H1:μ1≠μ2。
圖3 獨立樣本T檢驗主對話框
(1)打開對話框。根據表4建立數據文件“4.sav”,選擇菜單欄中的【Analyze】 →【Compare Means】→【Independent-Sample T Test】命令,彈出【Independent-Sample T Test】對話框。這里變量sco表示兩個交警的得分;變量x是不同交警的標志變量,1表示交警張三,2表示交警李四。
(2)選擇檢驗變量和分組變量。
(3)定義組別名稱。(4)完成操作。單擊【OK】按鈕,完成操作。此時,軟件輸出結果出現在結果瀏覽窗口中。
表5 Group Statistics
表6 Independent Samples Test
3.4 公安決策
(1)描述性統(tǒng)計量表
表5分別呈現了分組變量的簡單描述性統(tǒng)計量,包括參與檢驗數據的個案數(N)、均值、標準差和均值的標準誤。
(2)獨立樣本T檢驗結果報表
表6呈現的是對兩獨立樣本進行T檢驗的結果,包括方差齊性檢驗的F值和概率,T檢驗的t值、自由度(df)和檢驗的概率,均值的差值,標準誤差值和差分的95%置信區(qū)間。
表6中“Levene’s Test for Equality of Variances”下呈現的是檢驗方差齊性的F值(17.246)和顯著性概率p(0.000)。因為P<0.05,拒絕F檢驗的零假設,即兩總體的方差有顯著性差異。所以以下皆參照“Equal variances not assumed”所對應的一行數據。
兩獨立樣本T檢驗的值為t=-1.651,自由度df=45.045,雙側檢驗顯著性概率P=0.106>0.05,因此接受兩獨立樣本T檢驗的零假設,即兩個樣本所代表的總體的平均數相同,十字路口A和十字路口B的管理水平沒有顯著性差異。
4.1 問題描述
為加強人口管理,某市公安分局對下轄的20個派出所分別進行調研,收集了相應的常住人口和流動人口數據(單位:人),
如表7所示。試檢驗派出所常住人口和流動人口數是否存在顯著差異。
表7 派出所常住人口和流動人口數據
4.2 理論分析
兩配對樣本T檢驗的目的是利用來自兩個總體的配對樣本,推斷兩個總體的均值是否存在顯著差異。進行配對樣本檢驗要滿足3個要求:(1)兩組樣本的樣本容量要相同;(2)兩組樣本的觀察值一一對應;(3)總體服從正態(tài)分布。對兩配對樣本進行平均數差異檢驗,需要考慮數據的各種條件,從而選擇合適的檢驗方法。
4.3 軟件操作
數據類型屬于配對樣本的類型,故利用配對樣本T檢驗來分析。
圖4 配對樣本T檢驗主對話框
(1)打開對話框。根據表7建立數據文件
“7.sav”,選擇【Analyze】 →【Compare Means】→【Paired-Sample T Test】命令,彈出【Paired-Sample T Test】對話框。
(2)選擇配對變量。
(3)完成操作。單擊【OK】按鈕,完成操作。此時,軟件輸出結果出現在結果瀏覽窗口中。
表8 Paired Samples Statistics
表9 Paired Samples Correlations
表10 Paired Samples Test
4.4 公安決策
(1)描述性統(tǒng)計量表
表8呈現了兩配對樣本的相關描述性統(tǒng)計量,包括:均值、樣本容量(N)、標準差和均值的標準誤。
(2)相關性檢驗結果報表
表9顯示相關系數為0.804,顯著性概率p<0.05,因此在95%的置信水平上差異顯著,即常住人口和 流動人口人數顯著相關,符合用配對樣本T檢驗的前提條件。
(3) 配對樣本T檢驗結果報表
表10呈現的是配對樣本T檢驗的結果,包括兩配對樣本差分的均值、標準差、均值的標準95%的置信區(qū)間,還有T檢驗的t值、自由度(df)和顯著性概率(Sig.)。配對樣本T檢驗的t值為-0.752,自由度(df)為19,顯著性概率p=0.461>0.05,因此在95%的置信水平上差異不顯著,即各派出所常住人口和流動人口人數無顯著差異。
在公安實踐中應用T檢驗技術時應注意以下5點:
(1)注意適用條件
可以通過觀察數據的分布或進行正態(tài)性檢驗估計數據的正態(tài)假設。方差齊性的假設可進行F檢驗,或進行更有效的Levene檢驗。由于公安實際數據很難獲得,本文所有公安數據僅有參考價值,請讀者關注數據處理方法即可。
(2)選取檢驗區(qū)間
單側檢驗的界值小于雙側檢驗的界值,因此更容易拒絕,犯第Ⅰ錯誤的可能性大。T檢驗中的P值是接受兩均值存在差異這個假設可能犯錯的概率。
(3)區(qū)分判別規(guī)則
當一個統(tǒng)計量的值落在臨界域內,這個統(tǒng)計量是統(tǒng)計上顯著的,拒絕零假設。反之是統(tǒng)計上不顯著的,不拒絕零假設。
(4)結合公安實際
P越小,不是說明實際差別越大,而是說越有理由拒絕零假設,越有理由說明兩者有差異;然而差別有無統(tǒng)計學意義和有無公安實踐上的實際意義并不完全相同。
(5)慎用方差分析
進行兩組以上T檢驗,需要用方差分析進行比較,方差分析被認為是T檢驗的推廣,但原始數據必須滿足復雜的條件。
[1] CLEVELAND M,FAVO C M,FRECKA T J,et al. Trends in the International Fight Against Bribery and Corruption[J]. Journal of Business Ethics,2009:199-244.
[2] WOO H,WON S,CHANG K Y,et al. Comparison of muscle activity between two adult groups according to the number of Shaker exercise[J]. Journal of Oral Rehabilitation,2014,41(6):409-415.
[3] 梁鐵成.警察心理健康狀況之調查[J].中國健康心理學雜志,2007(11).
[4] 王飛,鄒舒.刑警與監(jiān)管民警的個性心理特質比較研究[J].四川警官高等專科學校學報,2007(4).
[5] 王璐,王沁,等.SPSS統(tǒng)計分析基礎、應用與實戰(zhàn)精粹[M].北京:化學工業(yè)出版社,2012:74-99.
[6] 賈俊平.統(tǒng)計學[M].北京:清華大學出版社,2006:264-297.
[7] 張文彤,鐘云飛.IBM SPSS數據分析與挖掘實戰(zhàn)案例精粹[M]. 北京:清華大學出版社, 2013:102-116.
[8] 佚名. 去年各行業(yè)年平均工資出爐. http:∥edu.gmw.cn/newspaper/2016-05/15/content_112453410.htm.
(責任編輯 陳小明)
王二院(1972—),男,安徽宿州人,副教授,碩士研究生導師。研究方向為公安管理學。
D035.39