朱嘉亮,馮磊,郝擎,李哲媛,成雙紅
(1.中國(guó)食品藥品檢定研究院,北京100050;2.云南省食品藥品檢驗(yàn)所,云南昆明650011)
大數(shù)據(jù)視角下國(guó)家藥品抽驗(yàn)數(shù)據(jù)共享平臺(tái)建設(shè)的思路
朱嘉亮1,馮磊1,郝擎1,李哲媛2,成雙紅1
(1.中國(guó)食品藥品檢定研究院,北京100050;2.云南省食品藥品檢驗(yàn)所,云南昆明650011)
目的探討我國(guó)藥品抽驗(yàn)數(shù)據(jù)共享平臺(tái)建設(shè)的思路,為平臺(tái)建設(shè)提供參考。方法從規(guī)劃設(shè)計(jì)、數(shù)據(jù)清洗、數(shù)據(jù)挖掘等方面分析平臺(tái)建設(shè)的目的、作用及存在的問題,進(jìn)一步提出新的發(fā)展思路和方向。結(jié)果與結(jié)論平臺(tái)的建設(shè)是一項(xiàng)系統(tǒng)工程,為促進(jìn)大數(shù)據(jù)在藥品監(jiān)管中的有效應(yīng)用,應(yīng)充分發(fā)揮大數(shù)據(jù)在實(shí)時(shí)監(jiān)控、統(tǒng)一調(diào)度、決策輔助等方面的作用。
大數(shù)據(jù);藥品抽驗(yàn);數(shù)據(jù)共享平臺(tái)
21世紀(jì)是一個(gè)“數(shù)據(jù)為王”的時(shí)代,隨著各種新型信息發(fā)布方式的不斷涌現(xiàn),數(shù)據(jù)結(jié)構(gòu)呈指數(shù)級(jí)向多元化、復(fù)雜化方向發(fā)展,大數(shù)據(jù)作為繼云計(jì)算、物聯(lián)網(wǎng)之后世界范圍內(nèi)又一次顛覆性的信息技術(shù)革命[1],可在獲得大量碎片化信息的基礎(chǔ)上挖掘分析,獲得新的認(rèn)知,作出前瞻性的數(shù)據(jù)判斷[2]。大數(shù)據(jù)已滲透到各行各業(yè),藥品監(jiān)管系統(tǒng)也不例外。Hal Varian[3]指出,數(shù)據(jù)是廣泛可用的,缺乏的是從中提取出知識(shí)的能力。大數(shù)據(jù)作為信息技術(shù)的集中反映,其規(guī)模效應(yīng)正在給數(shù)據(jù)存儲(chǔ)、管理及分析帶來(lái)極大挑戰(zhàn),知識(shí)管理方式的變革正在醞釀和發(fā)生。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)已逐漸成為一種資產(chǎn),如何有效從“數(shù)據(jù)海洋”中精準(zhǔn)分析、挖掘提取信息正快速成為未來(lái)藥品監(jiān)管工作戰(zhàn)略性發(fā)展的重點(diǎn)和方向。
1.1背景
國(guó)家藥品計(jì)劃抽驗(yàn)(以下簡(jiǎn)稱國(guó)抽)作為上市藥品質(zhì)量監(jiān)管的重要技術(shù)手段之一,能及時(shí)反映上市后藥品在生產(chǎn)、經(jīng)營(yíng)、使用過程中的質(zhì)量狀況。實(shí)踐證明,國(guó)抽工作對(duì)于提高藥品質(zhì)量,凈化藥品市場(chǎng),打擊制售假劣藥品不法行為,保證人民用藥安全有效,起到了明顯的促進(jìn)作用[4]。
國(guó)抽工作自2008年啟動(dòng)至今,國(guó)家藥品抽驗(yàn)管理信息系統(tǒng)(以下簡(jiǎn)稱“國(guó)抽系統(tǒng)”)已上線運(yùn)行7年,功能在于對(duì)藥品抽驗(yàn)數(shù)據(jù)進(jìn)行錄入和統(tǒng)計(jì),實(shí)現(xiàn)藥品抽驗(yàn)從抽樣到報(bào)告的全過程管理,有效地保障了國(guó)抽工作的正常、有序開展。為保證當(dāng)年國(guó)抽項(xiàng)目實(shí)施的順暢及數(shù)據(jù)的安全,一般將上一年度收集的抽驗(yàn)數(shù)據(jù)以備份形式另行存放,系統(tǒng)的性質(zhì)決定其無(wú)法對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析,制約了國(guó)抽數(shù)據(jù)的再利用。
為了解決以上問題,中國(guó)食品藥品檢定研究院于2011年底成立課題組,啟動(dòng)了國(guó)家藥品抽驗(yàn)數(shù)據(jù)共享平臺(tái)(以下簡(jiǎn)稱平臺(tái))項(xiàng)目建設(shè),于2013年開始著手建立平臺(tái),并對(duì)國(guó)家食品藥品監(jiān)督管理總局、各省級(jí)食品藥品監(jiān)督管理部門、各省市級(jí)以上食品藥品檢驗(yàn)機(jī)構(gòu)開放共享,支持管理型人員和專業(yè)技術(shù)人員對(duì)國(guó)抽數(shù)據(jù)進(jìn)行深入挖掘和利用,幫助各級(jí)領(lǐng)導(dǎo)和業(yè)務(wù)人員實(shí)時(shí)對(duì)藥品抽驗(yàn)相關(guān)工作進(jìn)行監(jiān)管和分析研究[5]。
1.2必要性和可行性分析
國(guó)抽系統(tǒng)運(yùn)行7年以來(lái),積累了大量寶貴的業(yè)務(wù)數(shù)據(jù),累計(jì)抽驗(yàn)品種1 040個(gè),抽驗(yàn)樣品166 705批次,積累了幾十萬(wàn)條藥品抽驗(yàn)數(shù)據(jù)和1000多份藥品質(zhì)量分析報(bào)告,見表1。這些海量的檢驗(yàn)數(shù)據(jù)對(duì)各級(jí)藥品監(jiān)督執(zhí)法和科學(xué)決策具有重要的參考價(jià)值,但隱藏在數(shù)據(jù)背后的價(jià)值卻無(wú)法有效地挖掘出來(lái),分析原因如下。
表1 2008年至2014年國(guó)家藥品評(píng)價(jià)抽驗(yàn)結(jié)果
“信息孤島”現(xiàn)象影響資源共享:由于整個(gè)藥監(jiān)系統(tǒng)信息化建設(shè)缺乏統(tǒng)一規(guī)劃和目標(biāo),未設(shè)立統(tǒng)一標(biāo)準(zhǔn),各級(jí)藥檢機(jī)構(gòu)系統(tǒng)獨(dú)立運(yùn)行,造成各單位之間溝通渠道不暢,無(wú)法實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)的縱向交換和橫向共享[6]。數(shù)據(jù)采集的渠道不同、標(biāo)準(zhǔn)各異,重復(fù)冗余,使各單位間的各種系統(tǒng)難以兼容,信息資源難以共享,形成了“信息孤島”。監(jiān)管人員需進(jìn)入不同信息平臺(tái),重復(fù)錄入不同形式的基層監(jiān)管數(shù)據(jù),不僅加重了基層監(jiān)管人員的工作量,浪費(fèi)了大量的財(cái)力和時(shí)間,而且信息資源還不能充分發(fā)揮應(yīng)有的作用;藥品信息完全處于開放、孤立、失控的狀態(tài),不利于監(jiān)管效能的提升。目前,由于權(quán)限設(shè)置,只有承檢單位的少數(shù)參與人員可看到本單位承檢的產(chǎn)品數(shù)據(jù)。如何深度挖掘藥品評(píng)價(jià)抽驗(yàn)數(shù)據(jù)的價(jià)值,需要一個(gè)可供廣大藥品監(jiān)管與檢驗(yàn)人員共享的信息平臺(tái)。
數(shù)據(jù)質(zhì)量存在問題:數(shù)據(jù)收集和錄入的準(zhǔn)確性不高,數(shù)據(jù)標(biāo)準(zhǔn)前后不一致。從2008年起,隨著藥品抽驗(yàn)業(yè)務(wù)的逐步深入和規(guī)范化,國(guó)抽系統(tǒng)的功能、架構(gòu)、數(shù)據(jù)標(biāo)準(zhǔn)都在逐步完善,造成了前期數(shù)據(jù)和后期數(shù)據(jù)的標(biāo)準(zhǔn)存在較大差異,導(dǎo)致國(guó)抽系統(tǒng)的原始數(shù)據(jù)質(zhì)量參差不齊,數(shù)據(jù)質(zhì)量整體較差。監(jiān)管人員在手工錄入抽驗(yàn)數(shù)據(jù)時(shí),也可能存在遺漏或錯(cuò)誤的情況。監(jiān)管部門收集到的數(shù)據(jù)不準(zhǔn)確,造成統(tǒng)計(jì)分析的結(jié)果失真,不利于信息化建設(shè)的發(fā)展。
數(shù)據(jù)利用水平不夠高:表現(xiàn)在數(shù)據(jù)標(biāo)準(zhǔn)化工作滯后,導(dǎo)致信息共享度低,無(wú)法有效匯總分析,不能為藥品監(jiān)管提供足夠的信息技術(shù)支撐。針對(duì)這種情況,需對(duì)現(xiàn)有業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行清洗和梳理,然后進(jìn)行分析和統(tǒng)計(jì),最終提高決策的合理性和有效性。另外,國(guó)抽工作7年來(lái)已收集了1 000多份藥品質(zhì)量分析報(bào)告,包含了各藥檢所對(duì)藥品質(zhì)量、藥品現(xiàn)行標(biāo)準(zhǔn)的分析、判斷和合理化建議,但對(duì)這些有著很高參考價(jià)值的資料,卻無(wú)法進(jìn)行快速檢索,也不能對(duì)報(bào)告內(nèi)的相關(guān)內(nèi)容和數(shù)據(jù)進(jìn)行快速定位和再次利用。
數(shù)據(jù)粒度較粗而無(wú)法進(jìn)行精細(xì)化的業(yè)務(wù)統(tǒng)計(jì)和分析:國(guó)抽系統(tǒng)目前收集的數(shù)據(jù)包括抽樣單數(shù)據(jù)和各檢驗(yàn)機(jī)構(gòu)的檢驗(yàn)報(bào)告結(jié)論及檢驗(yàn)項(xiàng)目結(jié)果數(shù)據(jù),但檢驗(yàn)項(xiàng)目結(jié)果數(shù)據(jù)粒度較粗,很多單項(xiàng)檢驗(yàn)結(jié)果的值都是以文本方式上報(bào),如符合規(guī)定和不符合規(guī)定。對(duì)于這種文本數(shù)據(jù),信息系統(tǒng)無(wú)法進(jìn)行更進(jìn)一步地分析、統(tǒng)計(jì)和挖掘,無(wú)法更準(zhǔn)確地掌握藥品質(zhì)量的穩(wěn)定性,提升上市藥品的監(jiān)管效能。
2.1原則
按照“整體規(guī)劃、統(tǒng)一標(biāo)準(zhǔn)、分步實(shí)施、逐步完善”的原則,從藥品抽驗(yàn)監(jiān)管需要出發(fā),統(tǒng)一數(shù)據(jù)定義與編碼,統(tǒng)一數(shù)據(jù)交換標(biāo)準(zhǔn),逐步建立健全平臺(tái),實(shí)現(xiàn)對(duì)國(guó)抽數(shù)據(jù)的深度利用和信息資源共享,輔助行政監(jiān)管部門進(jìn)行合理、有效地決策。
適用性原則:按照經(jīng)濟(jì)實(shí)用、成熟先進(jìn)、持續(xù)穩(wěn)定的要求,確定信息系統(tǒng)建設(shè)的規(guī)模和軟硬件檔次,要求系統(tǒng)具有很強(qiáng)的環(huán)境適應(yīng)性、較好的開放性、結(jié)構(gòu)的可變性和可擴(kuò)展性;功能模塊間可互相通信,交換數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)集成、共享的要求。
整體性原則:系統(tǒng)建設(shè)要統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)(指標(biāo)體系和數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn))、安全標(biāo)準(zhǔn),并形成統(tǒng)一的數(shù)據(jù)共享平臺(tái),同時(shí)兼顧特殊性,形成縱向和橫向的一體化管理。
安全可靠性原則:從系統(tǒng)的角度看,信息安全可分為存儲(chǔ)安全、邏輯安全、訪問安全和傳輸安全,只有四者有機(jī)結(jié)合才能保證系統(tǒng)具有較高的安全性。故采用中國(guó)食品藥品檢定研究院的信息安全平臺(tái),結(jié)合系統(tǒng)自身的安全體系,充分保證系統(tǒng)、網(wǎng)絡(luò)和數(shù)據(jù)的安全。
可擴(kuò)展性原則:為保持業(yè)務(wù)流程的連續(xù)性和系統(tǒng)信息的一致性,平臺(tái)的設(shè)計(jì)應(yīng)具有較大的可升級(jí)空間和可擴(kuò)展性,立足于對(duì)現(xiàn)有國(guó)抽數(shù)據(jù)的挖掘與共享,同時(shí)為將來(lái)省抽數(shù)據(jù)的利用留余地。
分步實(shí)施原則:信息化建設(shè)是一個(gè)長(zhǎng)期、持續(xù)的過程,平臺(tái)建設(shè)既要考慮短期內(nèi)的投資成效,又要保護(hù)前期投資持續(xù)發(fā)展。系統(tǒng)的設(shè)計(jì)采用先進(jìn)、合理的架構(gòu),使其能穩(wěn)定運(yùn)行、安全可靠、快速訪問。
2.2關(guān)鍵技術(shù)
2.2.1數(shù)據(jù)清洗
在大數(shù)據(jù)環(huán)境下,大數(shù)據(jù)的維度包含了數(shù)量、多樣性、速度、精確性等,在如此大維度中不可避免地存在冗余、錯(cuò)誤、粗糙的數(shù)據(jù),如何將這些良莠不齊的非清潔數(shù)據(jù)有效轉(zhuǎn)化成高質(zhì)量的干凈數(shù)據(jù),需要數(shù)據(jù)清洗。數(shù)據(jù)的質(zhì)量體現(xiàn)出數(shù)據(jù)的價(jià)值,數(shù)據(jù)清洗是數(shù)據(jù)質(zhì)量研究的起點(diǎn),其本質(zhì)是發(fā)現(xiàn)并解決問題的過程,最終目的是提高數(shù)據(jù)的質(zhì)量[7]。數(shù)據(jù)清洗主要是將不正確、不完整和不一致的數(shù)據(jù)進(jìn)行過濾和規(guī)范,從而提高決策系統(tǒng)的準(zhǔn)確性;并根據(jù)待分析數(shù)據(jù)的特點(diǎn)對(duì)規(guī)范后的數(shù)據(jù)進(jìn)行歸約,從而提高決策系統(tǒng)的效率。
2.2.2數(shù)據(jù)整合
平臺(tái)利用Pipeline Pilot完成了決策系統(tǒng)數(shù)據(jù)清洗、權(quán)限設(shè)置和檢索系統(tǒng)的開發(fā)與實(shí)現(xiàn),整合信息,定制流程。通過Pipeline Pilot,用戶不僅能整合和挖掘雜亂無(wú)章的海量數(shù)據(jù),自動(dòng)化數(shù)據(jù)的處理流程,還可實(shí)現(xiàn)研究成果快速分析與共享,提升大范圍的協(xié)作能力。Pipeline Pilot既支持簡(jiǎn)單的數(shù)據(jù)格式(文本和數(shù)字),又支持復(fù)雜的科學(xué)數(shù)據(jù)類型(圖像、化學(xué)結(jié)構(gòu)和生物序列),是國(guó)際通用的流程化開發(fā)平臺(tái),可無(wú)縫整合大多數(shù)通用軟件和第三方軟件平臺(tái),如Spotfire,Oracle,LIMS等。Pipeline Pilot作為專業(yè)的數(shù)據(jù)流控制平臺(tái),可將數(shù)據(jù)采集、規(guī)范、歸約和存儲(chǔ)集成一個(gè)完整的流程,整個(gè)流程可定期自動(dòng)化執(zhí)行。Pipeline Pilot實(shí)現(xiàn)了數(shù)據(jù)源、數(shù)據(jù)清洗、數(shù)據(jù)分析決策的無(wú)縫對(duì)接及整個(gè)流程的自動(dòng)化操作(見圖1)。
圖1 平臺(tái)管理型數(shù)據(jù)模塊工作流程圖
2.2.3數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是一種展望和預(yù)測(cè)性的信息分析技術(shù),可挖掘出數(shù)據(jù)間的潛在模式,并形成相關(guān)數(shù)據(jù)新的集合,以促進(jìn)信息的傳遞和重新利用[8]。平臺(tái)利用Spotfire完成決策系統(tǒng)數(shù)據(jù)的查詢、統(tǒng)計(jì)、分析、展現(xiàn)等功能的開發(fā)和實(shí)現(xiàn)。Spotfire是一款用于科學(xué)數(shù)據(jù)分析的可視化交互平臺(tái),是最新一代的科學(xué)商業(yè)智能軟件,能對(duì)多種類型數(shù)據(jù)如藥物研發(fā)、臨床、化學(xué)、管理、銷售等數(shù)據(jù)進(jìn)行快速分析和處理,可滿足不同性質(zhì)的管理和研發(fā)流程對(duì)大量數(shù)據(jù)的分析和決策的要求。其最大的特點(diǎn)是可通過多種動(dòng)態(tài)的圖形和篩選條件,對(duì)大量的數(shù)據(jù)進(jìn)行快速分析和處理,并做出報(bào)告或與他人分享結(jié)果,作出決策。支持多種客戶端界面和Web界面的訪問和顯示,并可連接包括Oracle在內(nèi)的多種數(shù)據(jù)庫(kù)。
Spotfire能快速便捷地生成多種形式豐富的分析圖形,具有靈活地向下鉆取的功能。對(duì)于生成的每一個(gè)圖形,用戶可對(duì)感興趣部分根據(jù)需要進(jìn)行多重向下鉆取,鉆取所得數(shù)據(jù)可通過各種表格和圖形展現(xiàn),從而更好地幫助用戶深層次和定制化地挖掘所需內(nèi)容,滿足日常和研究工作中的各種要求。
Spotfire能完美再現(xiàn)分析人員的思路,提供各種導(dǎo)航功能和控件。用戶可根據(jù)自己的分析思路來(lái)制作向?qū)募逊治鲞^程中的各個(gè)步驟和中間結(jié)果通過豐富的圖表逐步呈現(xiàn),帶領(lǐng)使用者逐步完成整個(gè)分析過程,得到分析結(jié)果。
Spotfire對(duì)突發(fā)事件有良好的快速處理能力。對(duì)突發(fā)事件的處理,重點(diǎn)是如何快速?gòu)拇罅肯嚓P(guān)數(shù)據(jù)中找到問題的關(guān)鍵。傳統(tǒng)工具需要分析人員將分析思路提交給統(tǒng)計(jì)或IT人員來(lái)實(shí)現(xiàn),其時(shí)效性遠(yuǎn)遠(yuǎn)不能滿足突發(fā)事件的要求。Spotfire使分析人員可獨(dú)立進(jìn)行各種分析,并通過豐富的圖表有效提升分析效率和展現(xiàn)分析結(jié)果,在盡可能短的時(shí)間里發(fā)現(xiàn)問題的關(guān)鍵點(diǎn)和確定處理問題的切入點(diǎn)。
共享平臺(tái)系統(tǒng)的開發(fā)建設(shè)采用國(guó)際領(lǐng)先的智能化數(shù)據(jù)處理工具,對(duì)國(guó)抽系統(tǒng)產(chǎn)生的海量數(shù)據(jù)按照數(shù)據(jù)規(guī)范進(jìn)行清洗、整合后,根據(jù)業(yè)務(wù)需求對(duì)數(shù)據(jù)進(jìn)行二次計(jì)算,并以可視化交互方式進(jìn)行展示,通過簡(jiǎn)單、靈活、可擴(kuò)展的操作方式獲取分析統(tǒng)計(jì)結(jié)果,幫助各級(jí)領(lǐng)導(dǎo)和業(yè)務(wù)人員實(shí)時(shí)對(duì)藥品抽驗(yàn)相關(guān)工作進(jìn)行監(jiān)管和分析。共享平臺(tái)包括常規(guī)的系統(tǒng)首頁(yè)和3個(gè)核心功能模塊,分別為抽驗(yàn)信息查詢、檢驗(yàn)數(shù)據(jù)分析和評(píng)價(jià)報(bào)告檢索,詳見圖2。
圖2 平臺(tái)架構(gòu)及用戶角色圖
抽驗(yàn)信息查詢模塊:用于藥品抽驗(yàn)信息和檢驗(yàn)結(jié)果信息的分析。此模塊為用戶提供不同抽樣地域、抽驗(yàn)品種、生產(chǎn)單位、檢驗(yàn)機(jī)構(gòu)的數(shù)據(jù)查詢功能,可通過預(yù)置的統(tǒng)計(jì)方式實(shí)現(xiàn)對(duì)歷年藥品抽驗(yàn)數(shù)據(jù)按不同分析項(xiàng)目進(jìn)行查詢、統(tǒng)計(jì),并對(duì)各查詢結(jié)果進(jìn)行排序。系統(tǒng)還為用戶提供自定義查詢功能,通過簡(jiǎn)單的操作快捷地展示用戶自己的想法,并據(jù)此作出相應(yīng)的決策。
檢驗(yàn)數(shù)據(jù)分析模塊:用于對(duì)抽驗(yàn)品種各檢驗(yàn)項(xiàng)目數(shù)據(jù)的分析對(duì)比,主要為藥品檢驗(yàn)人員提高檢驗(yàn)精度、修正檢驗(yàn)方法與標(biāo)準(zhǔn)、進(jìn)行探索性研究等工作提供科學(xué)有效的依據(jù)。此模塊底層數(shù)據(jù)是國(guó)家藥品抽驗(yàn)承檢單位在檢驗(yàn)過程中記錄的各檢驗(yàn)項(xiàng)目的數(shù)據(jù)信息,提供檢驗(yàn)情況總覽、數(shù)值項(xiàng)目分析、生產(chǎn)單位對(duì)比、抽驗(yàn)批次分析及圖譜分析5部分功能,用于對(duì)抽驗(yàn)品種查看其標(biāo)準(zhǔn)檢驗(yàn)項(xiàng)目、涉及生產(chǎn)單位的分布及不符合規(guī)定批次分布情況,也可查看重點(diǎn)分析項(xiàng)目的檢驗(yàn)結(jié)果正態(tài)分布情況和在不同檢驗(yàn)標(biāo)準(zhǔn)下的檢驗(yàn)結(jié)果分布情況等,通過深度分析各項(xiàng)目檢驗(yàn)數(shù)據(jù),找出數(shù)據(jù)背后隱藏的規(guī)律,協(xié)助明確品種的研究方向。今后將逐步實(shí)現(xiàn)試驗(yàn)數(shù)據(jù)分析模塊中的圖譜分析功能,借助軟件工具對(duì)圖譜數(shù)據(jù)的處理能力,將支持對(duì)藥品檢驗(yàn)的原始圖譜進(jìn)行疊合、比對(duì)和分析。
評(píng)價(jià)報(bào)告檢索模塊:提供對(duì)歷年藥品質(zhì)量分析報(bào)告等非結(jié)構(gòu)化信息的預(yù)覽、檢索和下載等功能,用戶可在全部文檔中通過藥品名稱、檢驗(yàn)單位、抽樣年份、預(yù)設(shè)關(guān)鍵字及自定義關(guān)鍵詞等快速準(zhǔn)確查詢和定位相關(guān)信息,極大地提高了工作效率和準(zhǔn)確率。
4.1完善數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)
為保證業(yè)務(wù)數(shù)據(jù)在提取、統(tǒng)計(jì)、分析或檢索過程中的準(zhǔn)確性和唯一性,確保原始業(yè)務(wù)數(shù)據(jù)的質(zhì)量,對(duì)已有數(shù)據(jù)需徹底清洗和規(guī)范,使之能符合數(shù)據(jù)分析的要求。此過程需要和業(yè)務(wù)部門商討,總結(jié)出數(shù)據(jù)的規(guī)范和標(biāo)準(zhǔn),并通過一些專業(yè)的數(shù)據(jù)處理工具對(duì)原始數(shù)據(jù)進(jìn)行自動(dòng)清洗。今后還需引入業(yè)務(wù)專家對(duì)清洗后的數(shù)據(jù)進(jìn)行人工審核,繼續(xù)找出數(shù)據(jù)中存在的問題,并給予修正,直到滿足后期數(shù)據(jù)分析的要求為止。針對(duì)后續(xù)即將生成的各類數(shù)據(jù),建議參考國(guó)抽系統(tǒng)的數(shù)據(jù)模板,充分聽取業(yè)務(wù)檢驗(yàn)人員及專家的建議,并結(jié)合各藥檢機(jī)構(gòu)檢驗(yàn)信息系統(tǒng)的實(shí)際情況,重新制訂共享平臺(tái)的數(shù)據(jù)采集標(biāo)準(zhǔn)和模板,詳細(xì)規(guī)定數(shù)據(jù)所需要的字段及上報(bào)要求,阻止低質(zhì)量數(shù)據(jù)進(jìn)入平臺(tái)。
4.2探索新數(shù)據(jù)類型的趨勢(shì)分析方法
藥品生產(chǎn)是一個(gè)系統(tǒng)工程,存在許多不確定因素,而目前對(duì)其中的一些因素還未完全掌握。通過對(duì)歷史數(shù)據(jù)的趨勢(shì)分析,用統(tǒng)計(jì)學(xué)技術(shù)排除隨機(jī)行為后有統(tǒng)計(jì)學(xué)意義的趨勢(shì),可根據(jù)評(píng)估過去藥品的質(zhì)量狀況,預(yù)測(cè)未來(lái)藥品質(zhì)量狀況發(fā)展趨勢(shì),綜合分析并找出不確定因素對(duì)藥品質(zhì)量的影響,包括對(duì)各因素間的相互關(guān)系和作用強(qiáng)弱等。只有不斷探索新數(shù)據(jù)類型的趨勢(shì)分析方法,促進(jìn)數(shù)據(jù)分析的可視化,關(guān)注大數(shù)據(jù)新的分析技術(shù)和工具的應(yīng)用等,在共享平臺(tái)上嵌入多種統(tǒng)計(jì)分析模型,如一般線性回歸模型、廣義線性回歸模型、時(shí)間序列分析模型、多水平分析模型、空間回歸模型、時(shí)空統(tǒng)計(jì)模型等,才能更好地監(jiān)測(cè)和提高藥品質(zhì)量。
4.3培養(yǎng)藥監(jiān)系統(tǒng)的綜合性數(shù)據(jù)分析人才
大數(shù)據(jù)時(shí)代的到來(lái)對(duì)藥監(jiān)系統(tǒng)人才的技能和素質(zhì)提出了新的要求,急需擅于處理龐大規(guī)模和復(fù)雜結(jié)構(gòu)數(shù)據(jù)的專業(yè)人才,包括數(shù)據(jù)分析家、數(shù)據(jù)架構(gòu)師、數(shù)據(jù)可視化人員和數(shù)據(jù)管理人員等,以適應(yīng)深度分析數(shù)據(jù)的需要。除要具備較強(qiáng)的數(shù)理統(tǒng)計(jì)知識(shí)和技能,還要擁有一定藥學(xué)、公共衛(wèi)生、信息技術(shù)等專業(yè)知識(shí),才能具備跨學(xué)科、跨領(lǐng)域的數(shù)據(jù)綜合分析思想,駕馭大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘與分析應(yīng)用。
4.4完善信息化標(biāo)準(zhǔn)體系,打破“信息孤島”模式
數(shù)據(jù)共享是實(shí)現(xiàn)信息價(jià)值最大化的重要途徑之一,首先需實(shí)現(xiàn)全國(guó)藥品檢驗(yàn)系統(tǒng)的數(shù)據(jù)共享,必須打破“信息孤島”模式,應(yīng)在國(guó)家食品藥品監(jiān)督管理總局主導(dǎo)下,按照統(tǒng)一規(guī)劃、頂層設(shè)計(jì)、統(tǒng)一協(xié)調(diào)、分步實(shí)施的原則合理推進(jìn)。通過建立信息化標(biāo)準(zhǔn)體系來(lái)實(shí)現(xiàn)信息化建設(shè)的規(guī)范化、科學(xué)化、合理化,實(shí)現(xiàn)全國(guó)藥品檢驗(yàn)系統(tǒng)信息化體系整合建設(shè),以供全國(guó)藥監(jiān)資源共享,消除“信息孤島”現(xiàn)象,形成一個(gè)自上而下的統(tǒng)一平臺(tái)。
大數(shù)據(jù)是一種從海量數(shù)據(jù)中快速獲取信息的能力,為提高我國(guó)藥品監(jiān)管的有效性提供了新的思路和切入點(diǎn)。平臺(tái)的建設(shè)是一項(xiàng)技術(shù)、業(yè)務(wù)、管理緊密結(jié)合的復(fù)雜工程,我國(guó)還處在探索和試驗(yàn)階段。在平臺(tái)建設(shè)的設(shè)計(jì)過程中,應(yīng)充分考慮平臺(tái)的標(biāo)準(zhǔn)化和開放性,以及完善的配套法規(guī)制度,如平臺(tái)運(yùn)行保障制度、數(shù)據(jù)質(zhì)量保障制度、數(shù)據(jù)安全保障制度等。
在大數(shù)據(jù)時(shí)代下,期待用“破壞性創(chuàng)造”來(lái)進(jìn)行大數(shù)據(jù)和藥品監(jiān)管的大融合,進(jìn)一步推動(dòng)國(guó)家食品藥品監(jiān)管的信息化建設(shè),為提升藥品監(jiān)管效能,提供科學(xué)、有效的技術(shù)支撐。
[1]李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊,2012,27(6):647-657.
[2]The Economist.Data,data,everywhere-A special report on managing information[EB/OL].[2013-04-26].http://www.economist.com/ node/15557443.
[3]許德瑋,桑梓勤,劉磊.基于云計(jì)算的醫(yī)療衛(wèi)生位置服務(wù)平臺(tái)研究[J].醫(yī)學(xué)信息學(xué)雜志,2013,34(6):8-13.
[4]朱嘉亮,姜典才,張弛,等,藥品抽驗(yàn)?zāi)J降母倪M(jìn)和完善——對(duì)藥品質(zhì)量狀況分析方法的初探[J].藥物分析雜志,2009,29(10):1765-1 767.
[5]周霖,殷國(guó)真,李楊,等.實(shí)驗(yàn)室資源管理平臺(tái)綜述[J].現(xiàn)代科學(xué)儀器,2013(1):162-164.
[6]陳鋒,鄭曉瓊.全國(guó)省級(jí)藥品檢驗(yàn)所信息化現(xiàn)狀調(diào)研[J].中國(guó)藥事,2008,22(1):34-35.
[7]蔣勛,劉喜文.大數(shù)據(jù)環(huán)境下面向知識(shí)服務(wù)的數(shù)據(jù)清洗研究[J].圖書與情報(bào),2013(5):16-21.
[8]曹建軍,刁興春,汪挺,等.領(lǐng)域無(wú)關(guān)數(shù)據(jù)清洗研究綜述[J].計(jì)算機(jī)科學(xué),2010,37(5):26-28.
R954
A
1006-4931(2015)18-0001-04
朱嘉亮,女,助理研究員,研究方向?yàn)樗幤烦轵?yàn)及管理,(電話)010-67095815(電子信箱)zhujl@nifdc.org.cn;成雙紅,女,副主任藥師,從事藥品技術(shù)監(jiān)督管理工作,本文通訊作者,(電話)010-67095801(電子信箱)csh1007@nifdc.org.cn。
2015-05-07)