国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

醫(yī)學論文中成組t檢驗P值錯誤及其原因分析

2018-12-25 03:45:18相丹風周英智
中國科技期刊研究 2018年12期
關鍵詞:成組醫(yī)學論文均數(shù)

■相丹風 高 永 周英智

1)《醫(yī)學綜述》雜志社,北京市通州區(qū)北苑通典銘居F座806室 1011002)濱州醫(yī)學院《中國醫(yī)院統(tǒng)計》編輯部,山東省煙臺市萊山區(qū)觀海路346號 2640033)山東大學科技期刊社,山東省濟南市山大南路27號 250100

P值是醫(yī)學論文重要的統(tǒng)計學內(nèi)容,是最終準確推斷結(jié)論的重要依據(jù),如果P值出現(xiàn)錯誤,就會嚴重影響對結(jié)果的正確判斷,甚至得出與事實相反的結(jié)論。美國統(tǒng)計學會理事會于2016年發(fā)表了P值聲明[1],引起了學者們對P值更高度的重視。t檢驗是最常用的統(tǒng)計方法之一[2-3],編輯同仁對醫(yī)學論文中t檢驗的應用情況進行了大量調(diào)查,發(fā)現(xiàn)其中存在很多問題,例如對不符合正態(tài)分布或方差不齊的2組資料進行成組t檢驗[4-5],使用t檢驗處理多組間或重復測量設計的資料等[2,6-7]。高永等[8]研制了基于 Excel 的統(tǒng)計分析系統(tǒng),對于完全隨機設計的2個樣本均數(shù)的比較,可以輸入論文中樣本例數(shù)、均數(shù)、標準差,系統(tǒng)根據(jù)方差齊性檢驗結(jié)果自動選擇t或t′檢驗,并且給出具體的t(或t′)值和P值。筆者在工作中利用該系統(tǒng)檢驗來稿的數(shù)據(jù)時,發(fā)現(xiàn)t檢驗中P值錯誤較多。查閱相關文獻,發(fā)現(xiàn)有關t檢驗P值判斷錯誤的系統(tǒng)調(diào)查報道較少。所以,本研究以成組t檢驗(又稱獨立樣本t檢驗)為例,利用該系統(tǒng)調(diào)查公開發(fā)表的醫(yī)學論文中出現(xiàn)P值錯誤的情況,并分析導致P值錯誤的原因,以期引起編輯同仁對統(tǒng)計學結(jié)果錯誤的高度重視,并采取有力措施來提高醫(yī)學論文的統(tǒng)計學質(zhì)量。

1 資料與方法

1.1 資料來源

對中國知網(wǎng)數(shù)據(jù)庫收錄的296種綜合醫(yī)藥衛(wèi)生期刊(http://navi.cnki.net/KNavi/Journal.html#)按下列條件進行檢索:全文出現(xiàn)“成組t檢驗”“獨立樣本t檢驗”或“t檢驗”,發(fā)表時間為2014—2018年。按時間順序排序,每種期刊盡可能選用最新發(fā)表的1篇論文。每篇論文選擇1項成組t檢驗,錄入2組例數(shù)、均數(shù)、標準差及t值、P值。若原文中沒有明確說明成組t檢驗或獨立樣本t檢驗,只說明使用t檢驗,筆者將對其進行核實,確保所用方法為成組t檢驗,排除配對t檢驗、秩和檢驗等。

1.2 方差齊性判斷及論文中P值的核驗

具體方法見文獻[8]。因為本研究所納入的成組t檢驗均未提及單側(cè)檢驗,所以P值采用雙側(cè)檢驗結(jié)果。如果測算的t(或t′)值和P值與論文中差別較大,則懷疑論文中的數(shù)據(jù)錯誤。考慮到“四舍五入”的情況,利用均數(shù)、標準差計算的結(jié)果與利用原始數(shù)據(jù)計算的結(jié)果可能存在一定偏差,但是差別不應太大。進一步利用該系統(tǒng)測算t(或t′)值和P值因均數(shù)、標準差的“四舍五入”造成的波動范圍,如果論文結(jié)果在這個范圍外,則確定原文結(jié)果錯誤。例如某研究設觀察組、對照組各60例,觀察組麻醉時間為(66.5±2.7) min,對照組為(68.4±3.1) min,2組比較t=0.721,P>0.05[9]。利用軟件對上述結(jié)果進行核驗,2組資料方差齊,t=3.580,P=0.0005(雙側(cè)),與論文結(jié)果差別較大。根據(jù)2個樣本均數(shù)比較t(t′)檢驗計算公式,在樣本數(shù)量不變的情況下,2個均數(shù)差值越大、標準差越小,則t(或t′)越大、P值越小,反之亦然??紤]到“四舍五入”因素,均數(shù)66.5的精確值在66.45與66.55之間,同理可以給出其他均數(shù)、標準差的精確值所在范圍。據(jù)此,可以計算出因均數(shù)、標準差的“四舍五入”造成的P值波動范圍為0.0002~0.0011,由此可以確定原文P>0.05錯誤。

1.3 納入分析的因素

(1)是否為核心期刊[10]。有學者比較核心期刊與非核心期刊文獻數(shù)量增長速度[11]、篇尾空白處理[12]等方面的差別,受此啟發(fā),筆者嘗試比較核心期刊與非核心期刊成組t檢驗P值錯誤的比例。(2)樣本量大小。成組t檢驗要求資料符合正態(tài)分布以及方差齊。樣本量較大時,對非正態(tài)分布、方差不齊的2組資料比較采用成組t檢驗,可能對結(jié)果影響不大,但對于小樣本資料結(jié)果影響較大。(3)方差齊性。2組定量資料比較時,如果方差不齊,不能采用成組t檢驗,而應當采用t′檢驗或秩和檢驗,如果誤用成組t檢驗,則會影響P值。(4)t值及具體P值。醫(yī)學論文應當給出確切的統(tǒng)計量和P值,醫(yī)學論文中缺少具體統(tǒng)計量及P值的問題已經(jīng)引起了編輯同仁的重視[13-14]。本研究嘗試分析是否給出t值及具體P值與P值錯誤是否有關。

1.4 統(tǒng)計學處理

采用SPSS 22.0軟件進行數(shù)據(jù)處理,采用相對數(shù)對P值錯誤進行表述,應用χ2檢驗對2組間差異進行單因素分析,利用Mantel-Haenszel法進行分層分析,采用二項式logistic回歸進行多因素分析,檢驗水準α=0.05(雙側(cè))。

2 結(jié)果

2.1 基本情況

296種期刊中,除去??⒔晡幢皇珍?、未檢索到合適論文等60種期刊,納入統(tǒng)計期刊共236種,每種期刊選擇1項成組t檢驗。其中2014年1項,2015年4項,2016年14項,2017年83項,2018年134項;50項存在P值錯誤,占比21.19%。

2.2 P值錯誤單因素分析

2.2.1 是否為核心期刊

236項成組t檢驗中,109項來自核心期刊,占比46.19%,127項來自非核心期刊,占比53.81%。核心期刊P值錯誤共30項,占比27.52%,非核心期刊P值錯誤共20項,占比15.75%,2組差異具有統(tǒng)計學意義。

2.2.2 樣本量大小

根據(jù)文獻[15]的方法,將2組中至少1組樣本量≤60定義為小樣本資料。236項成組t檢驗中,43項為大樣本資料,占比18.22%,193項為小樣本資料,占比81.78%。大樣本組P值錯誤9項,占比20.93%,小樣本組P值錯誤41項,占比21.24%,2組差異無統(tǒng)計學意義。

2.2.3 方差齊性

236項成組t檢驗中,方差齊171項,占比72.46%,方差不齊65項,占比27.54%。方差齊組的P值錯誤31項,占比18.13%,方差不齊組的P值錯誤19項,占比29.23%,2組差異無統(tǒng)計學意義。

2.2.4 是否給出t值

236項成組t檢驗中,給出t值152項,占比64.41%,未給出t值84項,占比35.59%。給出t值組P值錯誤34項,占比22.37%,未給出t值組P值錯誤16項,占比19.05%,2組差異無統(tǒng)計學意義。

2.2.5 是否給出具體P值

總體分為給出和未給出具體P值,前者包括P值為0.00、0.000、0.0000和其他具體值。實際P值并不等于0,當P值太小時,統(tǒng)計軟件會四舍五入為P=0.0000,在論文中應描述為P<0.001或P<0.0001[16-18]。因此,將二者也歸為給出具體P值。其他為未給出具體P值,包括P<0.01、P<0.05、P>0.05、P>0.1。236種期刊中,給出具體P值126項,占比53.39%,未給出具體P值110項,占比46.61%。給出具體P值組中P值錯誤39項,占比30.95%,未給出具體P值組中P值錯誤11項,占比10.00%,2組差異具有統(tǒng)計學意義。

以上單因素分析結(jié)果見表1。

表1 236項成組t檢驗P值錯誤單因素分析

2.3 P值錯誤分層分析

將是否給出具體P值作為混雜因素,采用Mantel-Haenszel分層分析法比較核心期刊與非核心期刊P值錯誤發(fā)生率,結(jié)果表明差異無統(tǒng)計學意義(χ2=2.703,P=0.100)。

2.4 P值錯誤多因素分析

各變量的賦值情況見表2。將上述因素均納入模型,得到236項成組t檢驗P值錯誤二項式logistic回歸分析結(jié)果(表3)??梢钥闯觯欠穹讲铨R(OR值為0.470,95%CI為0.230~0.961)、是否給出具體P值(OR值為5.459,95%CI為2.311~12.895)具有統(tǒng)計學意義。

表2 各變量的賦值情況

表3 236項成組t檢驗P值錯誤二項式logistic回歸分析

3 原因分析與建議

本研究發(fā)現(xiàn),醫(yī)學論文成組t檢驗中P值錯誤發(fā)生率高達21.19%,嚴重影響了論文的學術質(zhì)量,需要引起高度重視。其可能原因主要包括:統(tǒng)計分析軟件操作失誤;寫作過程中P值筆誤;寫作過程中樣本例數(shù)、均數(shù)、標準差數(shù)據(jù)筆誤,造成核驗P值本身錯誤而誤判;統(tǒng)計方法不當,例如符合正態(tài)分布但方差不齊時沒用t′檢驗;手工計算錯誤;排版錯誤;數(shù)據(jù)造假等。為避免成組t檢驗P值錯誤,提高醫(yī)學論文的統(tǒng)計學質(zhì)量,提出以下建議。

(1) 重視成組t檢驗的應用條件。進行成組t檢驗,特別是樣本量較小時,用于2組比較的資料必須符合正態(tài)分布。筆者在收集研究資料的過程中發(fā)現(xiàn),資料不符合正態(tài)分布的情況較為常見。例如某研究采用成組t檢驗比較膽管癌和膽總管結(jié)石患者血清 CA199 水平,2組數(shù)值分別為(413.09±355.35) U/mL和(183.48±322.24) U/mL,標準差接近甚至超過均數(shù),初步可以判斷為非正態(tài)分布[19]。應當首先對數(shù)據(jù)進行正態(tài)分布檢驗,若為非正態(tài)分布,改為中位數(shù)及四分位間距描述,采用 Wilcoxon 秩和檢驗進行2組比較[20-21]。

成組t檢驗的另一個應用條件是方差齊,如果符合正態(tài)分布但方差不齊應該取t′檢驗的P值。但本組資料方差不齊的比例高達27.54%,均未提及采用t′檢驗,由此推測,許多方差不齊的2組比較很可能采用的是成組t檢驗的P值,導致P值不精確甚至錯誤。二項式logistic回歸分析結(jié)果也顯示,方差齊減少了P值錯誤的可能性。如果統(tǒng)計學方法選擇錯誤,統(tǒng)計學處理結(jié)果的正確性將無從談起,因此編輯審核稿件時,一定要首先審核所用的統(tǒng)計學方法是否正確。

(2) 要求論文作者給出觀察指標的描述分析。例如比較2組正態(tài)分布的資料時,要求作者給出樣本量、均數(shù)、標準差等指標,這是論文寫作的基本要求,也便于利用這些數(shù)據(jù)核實統(tǒng)計推斷結(jié)果。如果覺得結(jié)果可疑,可以請作者提供原始數(shù)據(jù),通過統(tǒng)計學軟件進行核查。

(3) 要求論文作者給出統(tǒng)計量和具體P值。醫(yī)學論文要給出確切的統(tǒng)計量和P值,包括中華醫(yī)學會系列雜志在內(nèi)的許多醫(yī)學期刊都對此做出了明確要求[22-23]。但本研究發(fā)現(xiàn),236項成組t檢驗中,未給出t值和具體P值的比例分別高達35.59%和46.61%。不給出t值和具體P值,不利于判斷2組比較統(tǒng)計學差異的具體程度。另外,本研究結(jié)果顯示,給出具體P值的論文中P值錯誤發(fā)生率較高,主要因為本研究所用的判別方法更容易發(fā)現(xiàn)具體P值的錯誤。例如文獻[24]比較痛經(jīng)女性組與正常女性組經(jīng)期 SCL-90 各因素的均值,其中“強迫”一項的P值為0.003,筆者利用文中數(shù)據(jù)測算的結(jié)果是P值為0.0003,波動范圍為0.0003~0.0004,因此判斷原文P值錯誤。如果原文給出的不是具體值,而是P<0.01或P<0.05,則不會判為錯誤。

4 結(jié)語

統(tǒng)計學處理是醫(yī)學論文的重要內(nèi)容,統(tǒng)計學結(jié)果錯誤將嚴重影響論文的學術質(zhì)量。利用基于Excel 的統(tǒng)計分析系統(tǒng)核驗了中國知網(wǎng)收錄的綜合醫(yī)藥衛(wèi)生期刊中成組t檢驗的P值,發(fā)現(xiàn)P值錯誤較多,必須引起高度重視。期刊編輯應當重視對統(tǒng)計學方法應用條件的審查;要求作者給出統(tǒng)計描述以及統(tǒng)計推斷的具體結(jié)果,必要時請作者提供原始數(shù)據(jù),通過統(tǒng)計學軟件進行核查,嚴防統(tǒng)計數(shù)據(jù)造假等學術不端現(xiàn)象;可以利用簡單易學的統(tǒng)計學軟件核實P值;做好校對工作,及時發(fā)現(xiàn)排版導致的錯誤。由于本研究只調(diào)查了綜合醫(yī)藥衛(wèi)生期刊,結(jié)果可能與國內(nèi)醫(yī)學期刊的整體情況有一定出入,有待擴大范圍做進一步的深入研究。

猜你喜歡
成組醫(yī)學論文均數(shù)
醫(yī)學論文中引言的寫法
醫(yī)學論文中引言的寫法
醫(yī)學論文中引言的寫法
醫(yī)學論文中引言的寫法
航天典型結(jié)構(gòu)件成組加工工藝方法
線性表成組鏈式存儲結(jié)構(gòu)研究
成組集中策略下滾裝汽車堆場車位分配優(yōu)化
成組條件下的研制批產(chǎn)混合調(diào)度方法
關于均數(shù)與偏差
關于均數(shù)與偏差
吴江市| 贡觉县| 清涧县| 雷波县| 闸北区| 莫力| 上饶县| 孝感市| 嘉峪关市| 江都市| 汨罗市| 富源县| 上饶县| 辰溪县| 丘北县| 循化| 鸡泽县| 成安县| 天柱县| 汶川县| 琼结县| 从化市| 新建县| 财经| 仪陇县| 德化县| 绥江县| 克东县| 康定县| 凤台县| 毕节市| 河曲县| 孝感市| 文化| 平定县| 菏泽市| 汉寿县| 乳山市| 石城县| 北碚区| 兰溪市|