国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ROC曲線繪制和曲線下面積比較的SAS宏包*

2018-07-16 06:08:22李太順
中國衛(wèi)生統(tǒng)計 2018年2期
關(guān)鍵詞:參數(shù)表繪制靈敏度

李太順 劉 沛

東南大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系(210009)

【提 要】 目的 探討SAS宏包解決醫(yī)學診斷數(shù)據(jù)中常見ROC曲線繪制以及曲線下面積比較的簡單實現(xiàn)。方法 采用介紹的SAS宏包,對青少年兒童高血壓樣本數(shù)據(jù),分別選擇幾種常見最佳截斷點方法進行比較分析,并進行各指標曲線下面積比較分析。結(jié)果 rocplot與roc宏包不僅給出了不同截斷點選擇方法所對應的結(jié)果以及曲線下面積比較的結(jié)果,還給出了相應可視化圖形。結(jié)論 rocplot與roc宏包使用方便,功能豐富,在指定相應參數(shù)情況下可完成最佳截斷點選擇以及曲線下面積比較的問題,對非統(tǒng)計專業(yè)的用戶有較好的適用性。

診斷試驗評價是醫(yī)學研究的重要組成部分,在醫(yī)學診斷試驗中,常用靈敏度和特異度作為評價診斷試驗的準確度指標。但其值依賴于截斷點,截斷值的改變會引起靈敏度與特異度值的變化。如何綜合靈敏度與特異度,并且反映截斷點診斷價值就成了診斷試驗評價中的重要問題。受試者工作特征曲線(receiver operating characteristic curve,ROC)是解決此類問題的有效方法[1]。ROC是以真陽性率(靈敏度)為縱坐標,假陽性率(1-特異度)為橫坐標繪制的曲線。ROC將靈敏度與特異度以圖示方法結(jié)合在一起,可直觀反映某方法不同截斷點下靈敏度與特異度的關(guān)系,為選擇最優(yōu)截斷點即診斷臨界點提供依據(jù),同時ROC下面積(area under the ROC curve,AUC)可用來評價診斷試驗的準確性[3]。ROC是目前公認的評價診斷試驗準確性最佳的方法之一[4]。

ROC曲線分析的SAS宏包實現(xiàn)

在臨床診斷試驗評價中,SAS是目前公認的權(quán)威軟件,雖然通過編程可實現(xiàn)ROC分析的功能,但編程過程繁瑣,不便非統(tǒng)計專業(yè)人員應用。SAS宏包可將復雜的程序打包,用戶無需掌握編程過程,調(diào)用時只需賦值各參數(shù)值,應用于自己的數(shù)據(jù)即可。國內(nèi)有學者關(guān)于ROC分析SAS實現(xiàn)的文獻報道[5-6],但并未見介紹SAS宏包在診斷試驗評價中的應用,本文以實例在SAS軟件中使用SAS宏包實現(xiàn)診斷試驗評價的最佳截斷值點的選擇和曲線下面積比較的過程,為廣大醫(yī)務(wù)工作者提供參考,也為SAS在診斷試驗評價應用中的推廣提供思路。

軟件操作及數(shù)據(jù)分析

1.SAS宏程序包的下載與安裝

本文主要介紹SAS官網(wǎng)中提供的關(guān)于ROC分析的兩個宏程序包:第一宏包名稱rocplot,適用于ROC曲線的繪制及最優(yōu)截斷點選擇,下載地址為:http://support.sas.com/kb/25/018.html;第二個宏包名稱為roc,適用于兩診斷實驗曲線下面積比較,下載地址為:http://support.sas.com/kb/25/017.html。建議下載文件后儲存為SAS格式:rocplot宏包命名為rocplot.sas;roc宏包命名為roc.sas。本文所介紹的宏包適用于SAS 9.3及以上版本。

2.數(shù)據(jù)來源與加載

數(shù)據(jù)源于蕪湖市城區(qū)7~17歲學齡兒童體檢數(shù)據(jù),目的是研究肥胖指標對青少年高血壓的鑒別診斷能力,并對各參數(shù)的診斷價值作比較。數(shù)據(jù)形式見表1,數(shù)據(jù)加載命令如下:

libname data "C:UserssumsungDesktop ocdata";

*:(id:樣本編號;gender:性別;age:年齡;result:結(jié)局;weight:體重;waistline:腰圍;hipline:臀圍)

3.數(shù)據(jù)分析

(1)繪制ROC并尋找最佳截斷點

以指標hipline采用“Youden指數(shù)最大法”計算最佳截斷點為例:

步驟1:加載rocplot宏包,將rocplot.sas宏包加載到SAS中。

%include "C:UserssumsungDesktop oc ocmacro ocplot.sas";

注釋:%include “宏包所處的位置目錄”。

步驟2:運行proc logistc語句,將結(jié)果輸出為rocplot宏包使用作準備。

proclogistic data=bp;

model result(event="1")=hipline /outroc=roc1 roceps=0;

output out=outp p=phat;

run;

注釋:在本例中研究因素為hipline,結(jié)局變量為result,result變量中“1”視為高血壓發(fā)生,繪制ROC曲線所需的數(shù)據(jù)輸出為roc1數(shù)據(jù)集,每個觀測值hipline的預測概率數(shù)據(jù)輸出為outp數(shù)據(jù)集,并將預測概率命名為phat。

步驟3:調(diào)用rocplot宏,繪制ROC曲線,以“Youden指數(shù)最大法”選擇最佳截斷點。

%rocplot(inroc=roc1,inpred=outp,p=phat,

id=hipline _cutpt__opty_,

optcrit= youden,x=hipline)。

注釋:inroc=繪制ROC曲線所需數(shù)據(jù)集;inpred=觀測值預測概率值數(shù)據(jù)集;p=預測概率值變量名稱;id=ROC曲線圖上顯示的變量名稱(此處顯示腰圍值、切點值、Youden指數(shù)值);optcrit=最佳切斷點選擇標準(此處為Youden指數(shù));x=選擇標準所適用對象(此處為hipline)。

步驟4:查看并解釋相應結(jié)果。

rocplot宏包語句的結(jié)果給出了信息全面的ROC曲線圖以及最佳截斷點的選擇結(jié)果,以hipline為診斷指標,以“Youden指數(shù)”最大為評價標準,則切點值選擇為0.12258,對應的hipline為83,Youden指數(shù)為0.2261,詳見圖1。

圖1 腰圍hipline診斷青少年高血壓的ROC曲線圖

(2)兩相關(guān)指標曲線下面積(AUC)的比較

步驟1:加載roc宏包,將roc.sas宏包加載到SAS中

%include "C:UserssumsungDesktop oc ocmacro oc.sas";

注釋:%include “宏包所處的位置目錄”。

步驟2:分別以age變量和hipline變量運行proc logistic語句

SAS程序參照上述第二步,繪制ROC曲線所需的數(shù)據(jù)集分別保存為roc1_age和roc1_hipline,預測概率數(shù)據(jù)集保存為outp_age和outp_hipline,預測概率命名為phat_age和phat_hipline。

步驟3:調(diào)用roc宏,繪制ROC曲線,比較曲線下面積

%roc( data=outp_ageoutp_hipline,var=age hipline,response=result)

注釋:data=比較數(shù)據(jù)集來源,var=比較變量,response=結(jié)局變量。

步驟4:查看并解釋相應結(jié)果

曲線下面積比較結(jié)果發(fā)現(xiàn)臀圍的AUC大于年齡的AUC,差異有統(tǒng)計學意義(P<0.0001),臀圍的診斷價值大,詳見表2與圖2。

表2 兩相關(guān)指標曲線下面積比較結(jié)果

圖2 兩相關(guān)指標ROC曲線比較圖

4.應用拓展

由于SAS宏包中的宏參數(shù)較多,用戶在選擇時存在困難。針對上述問題,本文事先在外部excel文件中列出宏包中所有宏參數(shù)列表,并列出默認值和解釋說明,外部宏參數(shù)表相應框架格式見表3。用戶根據(jù)說明在參數(shù)列表中選擇相應參數(shù)并賦值,然后再使用SAS語句將外部excel參數(shù)表導入SAS中與宏包連接起來使用,大大簡化了用戶的操作難度。下面以rocplot宏包使用為例,具體實現(xiàn)過程如下:

%macrorocone(address1,dataset,result,name,address2,value);

/*第一步將rocplot.sas程式預先讀入SAS中*/

%include "& address1";

/*第二步執(zhí)行proc logistic 語句,輸出結(jié)果,以供rocplot.sas程式應用*/

databp;

set& dataset;

run;

proc logistic data=bp;

model& result(event="1")=& name /outroc=roc1 roceps=0;

output out=outp p=phat;

run;

proc import datafile="& address2"/*將外部參數(shù)表格導入/

out=shun

dbms=excel

replace;

sheet=sheet1;

run;

data _null_;

set shun;

callsymputx(parname,& value);

run;

/*第三步為調(diào)用rocplot宏程序*/

title"ROC plot for result=& name";

%rocplot(inpred =& inpred,inroc=& inroc,p=& p,id= & id,idstat=& idstat,format=& format,charlen=& charlen,split=& split,thinsens=& thinsens,thiny=& thiny,optcrit=& optcrit,costratio=& costratio,pevent=& pevent,optbyx=& optbyx,x=& x,multoptplot=& multoptplot,multoptlist=& multoptlist,plottype=& plottype,linestyle=& linestyle,labelstyle=& labelstyle,optsymbolstyle=& optsymbolstyle,markerstyle=& markerstyle,markers=& markers,marker=& marker,offsetmin=& offsetmin,offsetmax=& offsetmax,grid=& grid,altaxislabel=& altaxislabel)

%mendrocone;

注釋:address1=宏包rocplot的物理地址,dataset=要分析的數(shù)據(jù)集,result=分析的因變量,name=要分析的自變量,address2=外部宏參數(shù)表excel存放的物理地址,value=選擇的外部參數(shù)表中賦值的列(用戶可同時賦值多個列)。

表3 外部參數(shù)表框架結(jié)構(gòu)

討  論

本文ROC曲線下面積估計采用非參數(shù)法[7],根據(jù)實驗結(jié)果直接計算繪制出ROC曲線所需的工作點(靈敏度、1-特異度),繪制出ROC曲線,再由梯形規(guī)則計算出相應的曲線下面積,與患者和非患者實驗結(jié)果秩和檢驗的Mann Whitney統(tǒng)計量相等,其優(yōu)點是沒有限制條件,適用于任何診斷試驗ROC曲線下面積的估計。兩相關(guān)ROC曲線下面積比較采用非參數(shù)檢驗方法[8],不適用于兩獨立ROC曲線下面積比較。

目前進行ROC曲線分析的軟件主要有SPSS軟件、SAS軟件、R軟件[9]和ROC曲線分析專用工具ROCKIT等。但上述軟件要么在截斷點選擇和曲線下面積比較功能上存在不足,要么就是對數(shù)據(jù)資料存在限制或需要繁瑣的編程。SPSS軟件雖然可以繪制ROC曲線,但沒有最優(yōu)截斷點選擇和兩相關(guān)診斷實驗曲線下面積比較的模塊,ROCKIT等ROC曲線分析專用軟件雖然可以實現(xiàn)上述功能但對資料存在限制,僅適用于符合參數(shù)法條件的資料[10]。R軟件在實現(xiàn)兩診斷實驗曲線下面積比較時需調(diào)動OptimalCutpoints包、Daim包、ROCR包或PROC包,過程過于繁瑣[11]。SAS軟件雖然也無ROC分析的專用模塊,實現(xiàn)過程需要復雜的編程,但SAS宏包克服了上述不足,其方法和SAS程序簡單方便。此外本文提出在外部建立宏參數(shù)表與SAS宏包配合使用的方法,方便了用戶進行參數(shù)設(shè)置,降低了操作難度并適用于大批量作業(yè)分析。綜上所述,利用SAS宏包技術(shù)完成診斷試驗評價的過程既可以保證數(shù)據(jù)結(jié)果的權(quán)威,又可克服編程的困難。

本文介紹的SAS宏包功能強大,文章僅介紹了rocplot宏在Youden指數(shù)最大準則下最佳截斷值選擇的功能實現(xiàn),臨床上選擇標準有很多,如正確區(qū)分率、靈敏度與特異度的絕對差值以及成本效益。rocplot宏可實現(xiàn)多種標準準則選擇最佳截斷點,并可做相應比較,roc宏可實現(xiàn)不同競爭模型ROC曲線下面積的比較,由于篇幅有限具體實現(xiàn)請參閱官網(wǎng)介紹。

猜你喜歡
參數(shù)表繪制靈敏度
Art on coffee cups
鋼結(jié)構(gòu)有限元參數(shù)化分析系統(tǒng)研究
導磁環(huán)對LVDT線性度和靈敏度的影響
放學后
童話世界(2018年17期)2018-07-30 01:52:02
WPS在成形管生產(chǎn)過程中的運用
EXCEL在調(diào)度自動化系統(tǒng)數(shù)據(jù)庫維護中的應用
地下水非穩(wěn)定流的靈敏度分析
穿甲爆破彈引信對薄弱目標的靈敏度分析
在轉(zhuǎn)變中繪制新藍圖
無后備靈敏度的220kV變壓器后備保護整定
姚安县| 阳山县| 万山特区| 卢湾区| 岱山县| 芜湖市| 乌兰县| 黄平县| 安达市| 剑川县| 凤翔县| 临夏县| 阜阳市| 建阳市| 周宁县| 肇州县| 丹东市| 五华县| 大邑县| 开江县| 江津市| 全南县| 新巴尔虎右旗| 茌平县| 互助| 理塘县| 长海县| 渭南市| 黎川县| 博野县| 福安市| 江安县| 娱乐| 清水河县| 喜德县| 武强县| 杨浦区| 宁德市| 石楼县| 贵定县| 项城市|