,
在科技期刊論文中,數(shù)據(jù)的重要性不言而喻。但作者計算方法不當或筆誤而導致的錯誤數(shù)據(jù)時有發(fā)生。如果不能及時發(fā)現(xiàn)這些錯誤,不但會影響論文的正確表達,還會影響雜志的聲譽。因此科技期刊編輯,一定要重視數(shù)據(jù)審核[1]。
編輯面對論文中的數(shù)據(jù)時,除了依靠科學常識、邏輯方法[2]、審稿專家的意見,以及高度的責任心外[3],還要有專業(yè)的復(fù)核工具。最常用的是計算器、Excel加載項中的數(shù)據(jù)分析工具以及SAS、SPSS、STATA等專業(yè)統(tǒng)計軟件,然而這些工具不如流行病學計算器EpiCalc(Epidemiology Calculator)軟件實用和方便。EpiCalc軟件是英國的 Joe Gilman和Mark myatt 于1997年共同開發(fā)的用于流行病學二次數(shù)據(jù)處理的免費軟件,供流行病學、統(tǒng)計學專業(yè)和臨床專業(yè)等人員使用。自從該軟件投入使用以來,很多文獻從不同方面對該軟件的使用進行了介紹[4-6],但未采用更權(quán)威的工具進行驗證。筆者結(jié)合實例介紹EpiCalc的同時,利用SAS 8.2軟件對其進行了驗證。
該軟件安裝程序可免費下載(下載地址http:∥www.brixtonhealth.con/ec2v102.exe),主界面如圖1所示。
圖1 EpiCalc軟件的主要界面
其主要功能有:計算可信區(qū)間,根據(jù)兩組的均數(shù)、標準差和樣本例數(shù)比較兩總體均數(shù)的差別(圖2),進行四格表的χ2檢驗或計算Fisher確切概率,進行R×C表的χ2檢驗(圖3)。此外還可進行擬合優(yōu)度檢驗、樣本含量的估計和分層、分級資料的統(tǒng)計分析,以及據(jù)統(tǒng)計量值和樣本例數(shù)計算概率。
圖2 EpiCalc軟件進行兩總體均數(shù)比較的界面
圖3 EpiCalc軟件進行R×C表χ2檢驗的數(shù)據(jù)輸入界面
相對于功能強大的專業(yè)統(tǒng)計學軟件,如SAS,SPSS,STATA等,EpiCalc軟件更容易掌握。SAS和STATA軟件需要編程[7],對于編輯而言,能使用的功能并不多,專門安裝和學習這些軟件未免有些“大動干戈”;SPSS軟件不需編程,但通常需要提供原始數(shù)據(jù),而且掌握基本的SPSS知識也需要花一番功夫;利用計算器和Excel,也能進行一些簡單的統(tǒng)計學分析,但過程比較繁雜,且容易出錯。而掌握EpiCalc軟件則相對容易,具有基本統(tǒng)計學知識的編輯,只需自學2個小時即可熟練應(yīng)用。
該軟件可免費下載,且安裝程序小、操作簡單、啟動快速。編輯在審閱或加工稿件時,可隨時啟用,就像用計算器一樣方便。同時,該軟件界面簡單,數(shù)據(jù)錄入方便,結(jié)果簡潔易懂,非常方便編輯使用。
在《膿毒癥患者并發(fā)急性肺損傷危險因素分析》一文中,死亡組(n=19)與存活組(n=17)的呼吸分別是(33.0±5.3)次/min、(30.2±3.0)次/min,兩組比較有統(tǒng)計學意義(P<0.05)。對此類表面上看差別不大的數(shù)據(jù),有必要進行復(fù)核。打開EpiCalc軟件,選擇compare,再依次選擇means和two means(圖1)。出現(xiàn)界面如圖2,confidence level(可信度)選擇默認的95%,將兩組的樣本例數(shù)、均數(shù)、標準差填入對應(yīng)的空欄中即可。結(jié)果顯示:t=1.92,對應(yīng)的P=0.0634(圖4),說明兩組總體均數(shù)的差別沒有統(tǒng)計學意義,與原文結(jié)論正好相反。
圖4 EpiCalc軟件t檢驗結(jié)果界面
筆者對上述數(shù)據(jù)同時利用SAS 8.2軟件進行驗證,程序為:
data aa;
n1=19;
n2=17;
m1=33.0;
m2=30.2;
s1=5.3;
s2=3.0;
sc2=(s1**2*(n1-1)+s2**2*(n2-1))/(n1+n2-2);
st=sqrt(sc2*(1/n1+1/n2));
t=tinv(0.975,n1+n2-2);
in=t*st;
lclm=abs(m1-m2)-in;
uclm=abs(m1-m2)+in;
proc print;
var lclm uclm;
run;
結(jié)果:lclm=-0.1656,uclm=5.7656。lclm和uclm分別表示兩均數(shù)相差95%可信區(qū)間的下限和上限。如果該區(qū)間包含0,則表示兩組均數(shù)無統(tǒng)計學差別,該結(jié)論與EpiCalc軟件結(jié)論一致。
在《對全髖與全膝關(guān)節(jié)置換術(shù)后LMWH應(yīng)用時機的初步研究》一文中,THA組內(nèi)與TKA組內(nèi)DVT發(fā)生率差異均具有極顯著統(tǒng)計學意義(P=0.000)(表1)。
該文的主要問題是不能采用χ2檢驗,應(yīng)該采用Fisher確切概率法,因為2×2列表中期望頻數(shù)太小,有2個格子的頻數(shù)小于5。打開EpiCalc軟件,選擇tables,再選擇2-by-2 unstratified(2×2表,未分層),展開界面見圖5,將2、30、2、47輸入對應(yīng)的空欄中,同時選擇左下角的Perform Fishers exact test(確切概率法),結(jié)果發(fā)現(xiàn)THA組術(shù)后DVT發(fā)生率比較沒有統(tǒng)計學差異(P=0.6456)(圖6),TKA組內(nèi)DVT發(fā)生率也無統(tǒng)計學差異(P=1.0000)。
表1 人工關(guān)節(jié)置換術(shù)后使用LMWH組與延期72 h使用LMWH組術(shù)后DVT發(fā)生率
圖5 EpiCalc軟件四格表展開界面
圖6 EpiCalc軟件四格表統(tǒng)計檢驗結(jié)果
同樣,利用SAS 8.2軟件對THA組術(shù)后DVT發(fā)生率比較進行驗證,程序為:
data aa;
do r=1 to 2;
do c=1 to 2;
input f @@;
output;
end;
end;
cards;
2 30 2 47
proc freq;
weight f;
tables r*c/chisq expected nopercent;
run;
結(jié)果見圖7,確切概率(雙側(cè))=0.6456,同EpiCalc得出的結(jié)果一樣;同樣,TKA組內(nèi)DVT發(fā)生率也無統(tǒng)計學差異(P=1.0000)。
圖7 SAS8.2軟件驗證部分結(jié)果界面
科技論文中的結(jié)果部分,大多數(shù)都需要用數(shù)據(jù)表達,其形式有的簡單,有的復(fù)雜,涉及的統(tǒng)計學方法也多種多樣[8]??萍计诳木庉嫴豢赡軐ξ恼轮械乃薪Y(jié)果進行復(fù)核,因為有些結(jié)果是需要提供原始數(shù)據(jù)的。因此,編輯只能根據(jù)論文中的現(xiàn)有數(shù)據(jù)進行復(fù)核,涉及的統(tǒng)計學方法相對簡單,一般包括兩組之間的t檢驗、四格表及R×C表的χ2檢驗、Fisher確切概率法等。
通過復(fù)核,可以達到兩個目的:一是可以確認部分結(jié)果是否準確;二是可以判斷作者的科研態(tài)度及統(tǒng)計分析能力,從而為編輯取舍或退修稿件提供參考[9]。有些稿件表面上看沒有問題,且行文流暢、結(jié)構(gòu)嚴謹,但審核結(jié)果中的數(shù)據(jù)卻錯誤百出,對于這樣的稿件也只能做退稿處理了。因此,對論文中的數(shù)據(jù)進行審核非常必要,選擇一個好的審核工具則可以達到事半功倍的效果。