蘇祝捷
(廣西師范學院 體育學院,廣西 南寧 530023)
學術期刊體育論文存在的統(tǒng)計學問題
蘇祝捷
(廣西師范學院 體育學院,廣西 南寧 530023)
體育統(tǒng)計不僅是進行體育科學研究必須掌握的一種重要方法,也是體育實踐中數(shù)據分析的重要工具。隨著科學的發(fā)展,體育統(tǒng)計在體育科學研究中的地位也日益得到強化。通過對體育科研論文常規(guī)統(tǒng)計出現(xiàn)的問題進行分析,并提出正確的建議。
體育統(tǒng)計;常見問題;體育科研
統(tǒng)計學(statistics)主要通過利用概率論建立數(shù)學模型,收集所觀察系統(tǒng)的數(shù)據,進行量化的分析、總結,并進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用在工商業(yè)及政府的情報決策中。在體育學的相關研究中,無論是社會體育、學校體育、競技體育還是運動人體科學等領域的科研工作者,越加頻繁地將統(tǒng)計學應用到研究當中,以期使研究結果更具真實性和說服力。
然而,筆者通過中國知網(CNKI)隨機下載國內學術刊物中,涉及體育學相關內容并運用常規(guī)統(tǒng)計方法的論文100篇,分析發(fā)現(xiàn)在學術刊物的體育論文中統(tǒng)計學的應用還存在很多問題。由此可以看出一些體育工作者對統(tǒng)計學的認識有偏差,對一些定義的理解不準確,對一些研究方法的適用條件不清楚,導致了體育統(tǒng)計的誤用或運用不當,使得研究結論與實際相去甚遠。這不僅影響了研究的最后結果和論文的質量,更影響了研究的科學性、可靠性。
為此,本文對體育論文的常見統(tǒng)計學問題進行分析,并提出正確、合理的建議,以期引起有關人員的注意,并供體育科研工作者參考和使用,從而提高體育論文的科學性和嚴謹性。
表1 實驗對象成績測試對照表
表1是原作者進行背越式跳高教學實驗前后的跳高成績。先不管其選擇x±s對定量數(shù)據進行描述是否正確,但是根據目前世界男子跳高紀錄2.45m和女子跳高紀錄2.09m的實際情況來看,該表中出現(xiàn)的標準差均大于3,這個數(shù)據是嚴重錯誤的,因為目前還沒有任何一個人進行背越式跳高跳過3m的。在數(shù)據缺乏真實性的情況下,無論采用多么科學,多么合理的分析方法都是沒有意義的。另說明:表1的原始數(shù)據通過各種方式在期刊數(shù)據進行檢索,均未找到,因此其真實性也有待驗證。
再如《分析跳高比賽的少年運動員的技術特征》一文中,對少年運動員成績的構成及百分比進行男女比較時的數(shù)據資料見表2。從表2中我們可以看出少年跳高運動員成績構成的6個指標中,其中男女運動員5個指標的標準差都是分別相等。但是在現(xiàn)實中,對同一組學生的某一個指標進行兩次測試,兩次成績的標準差都很難出現(xiàn)完全等同的情況,更何況是對不同性別不同組別的運動員進行的測試。這種數(shù)據的高度吻合性,使其數(shù)據來源的真實性值得懷疑。
表2 少年運動員成績的構成及百分比
科學研究的本質是探求真理,而真理必須以真實的資料為基礎。因此,數(shù)據的真實性就成為問題的核心。要保證數(shù)據的真實性,就要求體育科研工作者有誠信,有一絲不茍之嚴謹態(tài)度。一般情況下,影響數(shù)據真實性的因素主要有三個方面:一為誠實的錯誤,是由于技術局限性或其他客觀因素的制約,導致本來嚴謹?shù)难芯拷Y果,卻在后來的研究中未能得到證實。二為疏忽性錯誤,是由于研究工作者工作作風不嚴謹或設計時不科學、不周密導致的。比如在進行教學方法實驗時,實驗組和對照組受試者的條件沒有可比性,對照組的處理措施選擇不當?shù)?,導致的實驗結果錯誤。三為科研中的不正行為,是指一些人為了達到所需要的結果,進行編制數(shù)據或其他形式的欺騙,這種情況屬于個人道德品質問題。但這三種錯誤,除了第一種因研究者自身或所處的環(huán)境無法避免,后兩種錯誤都是可以避免的。
2.1.1 現(xiàn)象分析
原文作者想比較某市3個少數(shù)民族初中男生50m跑成績的差異性,采用了獨立樣本t檢驗,結果如表3。
表3 某市各少數(shù)民族初中男生50m跑成績(s)
一般情況下,t檢驗主要有樣本均數(shù)與總體均數(shù)的單樣本均數(shù)的t檢驗和兩樣本均數(shù)的差異顯著性檢驗,以及配對實驗數(shù)據的差異顯著性檢驗三種。進行獨立樣本t檢驗時,除了要求樣本量不能過大,還要滿足數(shù)據資料呈正態(tài)分布或近似于正態(tài)分布以及檢驗樣本的方差齊性。但從本例的研究設計看,并沒有說明樣本的方差是否齊性,同時只考慮了民族這一因素,且是兩個樣本組以上均數(shù)的差異性檢驗,應采用單因素方差分析,而不是獨立樣本的t檢驗,t檢驗只對2個樣本以下的檢驗。如果在進行方差分析時,若P≤a,差異顯著,可進行均數(shù)的多重比較。當然在此案例中為了充分利用數(shù)據,還可以考慮不同年齡之間的差異性分析。
2.1.2 建議
x2檢驗常用于對兩個或兩個以上樣本率之間差別的顯著性差異檢驗,檢驗方法比較靈活,也是假設檢驗中重要的方法之一。一是兩樣本率的x2檢驗,例如在體育教學或訓練的研究中,對新舊教學方法或不同訓練手段的效果進行比較,有關這一類型的研究結果可采用x2檢驗方法進行處理。在對樣本率進行x2檢驗時,常采用表格方式來處理,這種表格稱為RC聯(lián)表,R和C分別表示格子的行列數(shù)。二是多個率的x2檢驗,在進行多個樣本率的檢驗時,當?shù)玫絇<0.05,則要拒絕原假設,說明被比較的幾個樣本率之間差別有顯著性。這是就各個率之間總的差別來說的,但不能據此作出任何兩組間差別都有顯著性的結論。若比較兩個樣本率之間的差異,需另作檢驗。
2.2.1 現(xiàn)象分析
如表1中的數(shù)據,實驗對象n比較小,而且x<s,是嚴重的偏態(tài)分布,但還用來描述是不對的。
2.2.2 建議
x±s僅用于描述呈正態(tài)分布數(shù)據資料的集中和離散趨勢,對于不呈正態(tài)分布的數(shù)據資料,一般用中位數(shù)(Md)或眾數(shù)(M0)來描述其集中趨勢,用四分位差(Q)來描述其離散趨勢。而表1中的樣本是很小的,而且數(shù)據呈偏態(tài)分布,甚至嚴重偏態(tài),根本無法描述其分布狀態(tài)和用x±s來進行數(shù)據描述。但是,一般情況下,計量資料呈偏態(tài)分布,可通過對數(shù)轉換、平方根變換等轉換方法,使其偏態(tài)分布資料接近正態(tài),然后做進一步的分析。
原文作者是想通過表4中的數(shù)據來反映影響不同體育人口類型大學生參加體育鍛煉因素的差異性。
在這一案例中,作者雖然作了統(tǒng)計處理,但未交待用的是哪一種統(tǒng)計方法進行的分析,比如t檢驗、x2檢驗等,僅告知P值與0.001、0.01、0.05的關系,也沒有其他統(tǒng)計量的具體值,讀者根本無法知道作者選擇的分析方法是否正確,結果是否準確,因此呈現(xiàn)的信息是不完善的。直接根據計算結果P<0.05或P<0.01就輕易做出結論,是欠嚴謹?shù)?,缺乏科學性。
表4 影響體育人口參與體育鍛煉的主要因素(%)
研究者應將所采用的統(tǒng)計方法交待清楚,比如是運用的獨立樣本t檢驗、相關樣本t檢驗還是方差分析、x2檢驗等。因為使用不正確的統(tǒng)計方法會得出錯誤的結論,作者很有必要在論文中告知讀者你選用的統(tǒng)計方法。嚴格地說,還應寫明精確的相應統(tǒng)計量值,而不應籠統(tǒng)地以P>0.05或P<0.05代替或只一句“經統(tǒng)計學處理”后,就寫出結論。提供相關的數(shù)值,以便讀者判定結論的正確與否。此外,最好也交待一下所使用的計算工具與統(tǒng)計軟件名稱。
原作者對表5的文字描述為:“結果顯示,除了‘改善自己的健康狀況’和‘為了散心解悶消遣娛樂’兩項原因之外,體育人口與非體育人口均有顯著性的差異。無論是物質形態(tài)方面還是精神意識方面,體育人口均高于非體育人口?!笨梢钥闯霰砀裰械臄?shù)據并沒有反映出作者的意圖。同時表4的標題與表中的縱條目不相匹配,“內容”應改為“原因”;標題表述不清,建議修改為:“不同類型體育人口的大學生參加體育鍛煉的原因比較”;表中出現(xiàn)嚴重的錯誤,在表的中部突然多出“n=235,n=1322,n=123”這些數(shù)據;在“準體育人口”這一列數(shù)據下方出現(xiàn)了“***、*、**、ns”符號,先不管標注是否錯誤,這些符號在表后的注釋為“***P<0.001,**P<0.01,*P< 0.05,ns=不具有顯著性”,而原作者并沒有對數(shù)據所表現(xiàn)出來的差異性進行描述,造成數(shù)據的冗贅或者浪費。雖有“體育人口與非體育人口均有顯著性的差異”這樣的描述,但是表格中并沒有相應的數(shù)據支撐??梢娮髡卟]有重視表格的設計,導致描述和數(shù)據不合。附加說明,本研究只是去發(fā)現(xiàn)期刊文獻中統(tǒng)計圖表存在的問題,從而進行分析,關于原文中數(shù)據的真實性不在研究范圍之內,需進一步考察和研究。
表5 參加體育鍛煉的原因
統(tǒng)計圖表是表達數(shù)據資料的重要工具,也是表述統(tǒng)計數(shù)量關系的主要方式。合理的統(tǒng)計圖表可以使復雜的資料簡明清晰,便于有關指標的對照比較和揭示事物之間的相互關系及發(fā)展趨勢。因此在設計圖表時要講究科學性、合理性。但有些作者在運用圖表時,設計不夠規(guī)范,常出現(xiàn)一些錯誤,嚴重影響了數(shù)據描述的準確性。一般情況下,圖表的標題應確切、概括地說明圖表的內容,表的標目文字要簡潔,組合規(guī)范、有序,內容簡明扼要能夠突出主題,線條不可過多,一般用三線格,表格的左上角盡可能不出現(xiàn)斜線等,圖的縱橫坐標要符合數(shù)學原則,圖的類型要根據數(shù)據資料的性質進行選擇。
體育科研論文中出現(xiàn)統(tǒng)計問題不僅是一種現(xiàn)象,更多的卻是反映了我們的科研工作者對統(tǒng)計學的重視程度不夠。導致對各種統(tǒng)計方法內涵不甚了解,不能夠正確分析數(shù)據資料的性質,其中簡單移植、套用教材或文獻中的統(tǒng)計方法是體育統(tǒng)計運用出現(xiàn)問題的主要原因。當然,也有部分人為了私利,捏造虛假數(shù)據。
但是要提高科研質量,防止誤用統(tǒng)計方法,除了受制于一些外在的因素,更重要的是科研工作者自身要不斷提高統(tǒng)計學水平,在保證數(shù)據質量的前提下,結合研究目的、數(shù)據結構特征、樣本大小和各種檢驗統(tǒng)計量的適合條件、適用范圍來選擇恰當?shù)慕y(tǒng)計分析方法,從而客觀、合理地對統(tǒng)計結果進行描述和解釋。
[1]丁英俊,薛留成,夏健松.體育院系田徑課程多元化教學手段的整合與改革實驗研究[J].河南大學學報(社會科學版),1998,38(4):73-76.
[2]付降河,馬文慧,趙書祥.體育科研論文中常規(guī)統(tǒng)計方法使用情況的調查研究[J].北京體育大學學報,2010,33(3):41.
[3]陳元方,邱仁宗.生物醫(yī)學研究倫理學[M].北京:中國協(xié)和醫(yī)科大學出版社,2003.09:72.
[4]劉容娟.定量資料的統(tǒng)計分析[J].湖北成人教育學院學報,2008,14(4):53-54.
[5]敖運忠,楊麗玲.江西省體育科研論文中體育統(tǒng)計應用情況調查與分析[J].上海體育學院學報,2002,26(5):77-79.
[6]韓捷,成龍.不同類型體育人口的大學生健康行為比較研究[J].搏擊,2010,2(8):34-35.
[7]王凈凈.醫(yī)學科研論文中的統(tǒng)計問題[J].中國醫(yī)師雜志,2001,3(1):6-8.
[8]李健,祁國鷹,王錫群.從體育統(tǒng)計誤用透視高校體育統(tǒng)計教育[J].體育科技,2009,30(1):79-81.
[9]從湖平.體育統(tǒng)計學[M].北京:高等教育出版社,2010.
[10]謝曉丹.體育統(tǒng)計中提高樣本數(shù)據收集水平的問題探討[J].科技創(chuàng)新導報,2008(4):160.
Statistics problems in sports papers in ordinary journals
SU Zhu-jie
(Sport Dept.,Guangxi Normal Inst.,Nanning 530023,China)
With the development of science,the sports statistics has become more and more important in the sports scientific researches.The paper analyses the statistics problems in the papers about sport in the ordinary journals.
sports statistics;common problem;sports scientific research
G80-32
A
1672-268X(2011)06-049-03
(2011-08-18收稿)