郭華源薛萬國黃輝馮濤
放射影像調(diào)閱行為的統(tǒng)計與分析
郭華源1薛萬國1黃輝2馮濤3
放射科,醫(yī)院;X線膠片;數(shù)據(jù)說明,統(tǒng)計
【中國圖書資料分類法分類號】 R179.323
隨著醫(yī)療業(yè)務(wù)的快速增長和放射影像在臨床診斷中作用的不斷增強,放射影像資源呈快速增長趨勢,影像存儲空間也日趨緊張。如圖1所示,我院放射影像每月新增量由2004-12的30GB增長到2007-11的470GB。
圖1 放射影像每月新增量
通過日志分析來獲取用戶行為規(guī)律和特性,已成為一種重要的信息挖掘手段。如文獻[1]研究了網(wǎng)絡(luò)日志中是否蘊含用戶訪問Web的規(guī)律性特征以及如何據(jù)此提高Web服務(wù)質(zhì)量的問題;文獻[2]基于用戶行為分析的思路,提出一種自動進行搜索引擎性能評價地方法。因此,本文通過對醫(yī)生日常工作中調(diào)閱放射影像的日志進行統(tǒng)計和分析,獲取被調(diào)閱影像的資源分布特征和影像調(diào)閱行為的時間分布特征,為醫(yī)院對放射影像進行高效存儲與管理提供有效參考。
我院放射影像存儲服務(wù)器面向臨床提供放射影像查詢和調(diào)閱服務(wù),并且所有影像調(diào)閱的通信過程都詳細寫入日志文件。日志文件采用數(shù)據(jù)表的方式,按照調(diào)閱行為發(fā)生時間的先后順序記錄每一次DICOM通信的狀況。日志文件的每一行表示一條記錄,每條記錄都由多個字段來描述一幅影像的傳輸狀況,如表1所示。
現(xiàn)有兩種統(tǒng)計粒度可選擇。一種是基于Image級,統(tǒng)計的基本單位是Image;另一種是基于Study級,統(tǒng)計的基本單位是Study。由于臨床醫(yī)生調(diào)閱影像通常是以Study為參考單位,又鑒于DICOM協(xié)議的“Patient-Study-Series-Image”四級信息模型特點[3],將統(tǒng)計粒度定義為Study級將會更加凸顯調(diào)閱行為特征。
統(tǒng)計算法如下:
①根據(jù)Communication Date&Time字段的值,從日志文件中依次讀入一定時間段內(nèi)的每條記錄。
②判斷SCU/SCP字段的值,如為SCU則表示在此次通信中影像存儲服務(wù)器把影像存儲到請求者的工作站上,也就是為某應(yīng)用實體提供影像調(diào)閱取回服務(wù)。
③判斷InstanceUID字段值,如非空則表示有影像傳輸。
④判斷Success/Failure字段值,如為“1”則表示通信成功。
⑤日志文件中只記錄了每次通信中所傳影像的 InstanceUID,還需要得到這些影像所對應(yīng)StudyUID的存儲時間。所以要連接影像存儲服務(wù)器,通過查詢DICOMDB來獲取被調(diào)閱影像的采集時間。
⑥根據(jù)采集時間,將滿足上述條件2~4的日志記錄按照日期時間分別統(tǒng)計。由于同一次通信中每個Image_uid都聯(lián)合查詢了 Study_uid_id,因此要剔除 Communication ID和Study_uid_id分別都相同的重復(fù)項。
最后,得到基于Study級的影像調(diào)閱統(tǒng)計數(shù)據(jù)。
表1 日志記錄的字段解析
根據(jù)上述統(tǒng)計算法,對2007-10-26~11-01、11-21~11-27的兩個時間段內(nèi)的放射影像調(diào)閱日志進行數(shù)據(jù)統(tǒng)計和處理分析。
3.1 按采集時間統(tǒng)計影像被調(diào)閱次數(shù) 見圖2及表2。
圖2 被調(diào)閱影像按采集時間分布
圖2和表2表明,臨床醫(yī)生調(diào)閱放射影像絕大部分是集中在最近1個月內(nèi)患者檢查所采集的影像,產(chǎn)生時間越久遠的影像,其被調(diào)閱的次數(shù)也越少。主要有以下兩方面的原因。
一方面,新近采集的影像刻畫了患者病情的最新進展狀況,是醫(yī)生做臨床診斷最主要的影像學根據(jù)。同時這些影像也是醫(yī)生為患者制定手術(shù)方案、擬定治療計劃、撰寫病案等最重要的參考信息,因此導(dǎo)致新近采集的影像被調(diào)閱的次數(shù)要遠遠高于其他影像。
表2 影像被調(diào)閱次數(shù)按采集時間段的百分占比
另一方面,產(chǎn)生時間較久遠的影像被調(diào)閱的次數(shù)很低。雖然這部分影像的現(xiàn)實診斷意義已經(jīng)大大降低,但是還具有參考比較價值。例如臨床醫(yī)生在回溯病情、分析病因,或者尋找疾病發(fā)展規(guī)律時,不僅要調(diào)閱新近的影像,而且還可能會調(diào)閱在此之前的所有相關(guān)影像以資參考和比較。
3.2 按24h統(tǒng)計醫(yī)生影像調(diào)閱次數(shù) 見圖3及表3。
圖3 24h醫(yī)生影像調(diào)閱行為分布
表3 時間區(qū)段內(nèi)調(diào)閱次數(shù)與全天調(diào)閱總次數(shù)的百分比
圖3和表3表明,臨床醫(yī)生每天影像調(diào)閱主要集中在7:00~22:00之間。其中,三個影像調(diào)閱高峰時段分別是 9:00~12:00,14:00~17:00,以及20:00~21:00。這些高峰時段正好是每天醫(yī)生會診、手術(shù)、討論等最集中的時候。這從一個側(cè)面凸顯現(xiàn)代影像技術(shù)不僅在準確展現(xiàn)病情、精確定位病灶、科學定制治療方案等方面起到不可替代的信息支撐作用,而且還直接參與手術(shù)、治療的全過程,成為臨床醫(yī)生不可或缺的輔診工具和疾病救治利器。
另外,在23:00~6:00極少發(fā)生影像調(diào)閱行為。主要因為這是晚間休息時段,除非出現(xiàn)急診、搶救等突發(fā)情況需要調(diào)閱影像。
醫(yī)院影像數(shù)據(jù)的快速增長,一方面將會為臨床醫(yī)生提供更多的輔診信息,另一方面也給信息管理部門帶來日趨沉重的運行維護壓力。如何在確保存儲可靠性與經(jīng)濟性的同時又能夠?qū)崿F(xiàn)影像調(diào)閱的便捷性與實效性,通過對放射影像調(diào)閱行為的統(tǒng)計和分析,本文對此問題進行如下探索。
(1)根據(jù)被調(diào)閱影像的資源分布特征,可以對影像數(shù)據(jù)的存儲實施如下策略:
①對近段時間內(nèi)采集的影像數(shù)據(jù)實行在線存儲,對一段時間以前采集的數(shù)據(jù)進行近線或離線存儲。時間閥值的選擇則需要對影像調(diào)閱的資源分布特點、現(xiàn)有在線的存儲容量、近線/離線的調(diào)取速度等條件進行權(quán)衡。
②對訪問次數(shù)高的數(shù)據(jù)實行無損壓縮,而對訪問次數(shù)很低的數(shù)據(jù)則可以實行有損壓縮。從磁盤空間利用率上比較,有損壓縮要高于無損壓縮;但從圖像質(zhì)量上比較,則是無損壓縮要好于有損壓縮。此外,基于影像調(diào)閱的資源分布特點,近段時間內(nèi)采集的影像數(shù)據(jù)的訪問次數(shù)高,而一段時間以前采集的數(shù)據(jù)的訪問次數(shù)低。因此,通過綜合兩者所長,使有限存儲資源的利用最大化。
(2)從影像調(diào)閱行為的時間分布特點來看,每天7:00~22:00是影像調(diào)閱的集中時段。在此期間,要確保系統(tǒng)影像服務(wù)的可靠性和高效性,一切可能危及影像服務(wù)質(zhì)量和安全的行為都要盡量規(guī)避。而每天23:00~6:00之間則是系統(tǒng)“運維窗口”,系統(tǒng)維護、升級、切換、數(shù)據(jù)備份和遷移等都可優(yōu)先考慮在此時間段內(nèi)進行。
本文通過對醫(yī)生日常工作中對放射影像的調(diào)閱行為進行統(tǒng)計和分析,發(fā)現(xiàn)被調(diào)閱影像的資源分布特點是絕大部分集中在最近一個月內(nèi)患者檢查所采集的影像,而產(chǎn)生時間越久遠的影像,其被調(diào)閱的次數(shù)也越少。同時,醫(yī)生影像調(diào)閱行為的時間分布特點是集中在每天7:00~22:00,而23:00~6:00影像調(diào)閱稀少。最后,根據(jù)這些分布特點,本文還就如何對放射影像進行高效存儲與管理提出應(yīng)用策略。
[1] 郭巖,白碩,楊志峰,等.網(wǎng)絡(luò)日志規(guī)模分析和用戶興趣挖掘.計算機學報,2005,28(9):1483-1496.
[2] 劉奕群,張敏,茹立云,等.基于用戶行為分析的搜索引擎自動性能評價.軟件學報,2008,19(11):3023-3032.
[3] National Electrical Manufacturers Association.Digital Imaging and Communication In Medicine(DICOM),PS3.3-2007 [EB/OL].[2007-12-9].ftp://medical.nem a.org/medical/ dicom/2007/.
(責任編輯 于曉紅 納琨)
1.100853 北京 解放軍總醫(yī)院計算機應(yīng)用與管理科;2.100853 北京 解放軍總醫(yī)院放射診斷科; 3.200335 上海 上海岱嘉醫(yī)學信息系統(tǒng)有限公司
郭華源 E-mail:guohy2005@163.com.