張利
成立一家醫(yī)療大數據公司需要具備什么?在一位醫(yī)療大數據公司數據事業(yè)部博士看來,答案是:幾個聯合創(chuàng)始人、幾臺電腦。
那醫(yī)療數據呢?他的答案是:自一年多前加入這家醫(yī)療數據公司至今,從來沒有得不到數據的時候。不過,前提是需要付出一點“公益心”。
2017年初,這家醫(yī)療數據公司CEO與上海一家三甲醫(yī)院病理科主任聊天時,后者談及,有大量的存量醫(yī)療數據,沒人去挖也不知道如何挖;這位CEO當即表示,可免費提供技術對歷史病理數據進行挖掘,幫助醫(yī)生。約一個月后,主任傳來醫(yī)院過去35年約5萬人次的病理數據。
《財經》記者走訪的多位業(yè)內人士均表示,醫(yī)療大數據公司能否獲取數據取決于能否滿足醫(yī)療機構或醫(yī)生的利益?!白鲞@件事能給什么利益,如果值得我冒風險,我就配合你去做?!币晃会t(yī)療大數據公司產品經理說。
數據是智能時代的“石油”已成共識。在原國家衛(wèi)生計生委指導下,中國電子、中移動、中科院分別牽頭成立的三大健康醫(yī)療大數據集團,承擔國家健康醫(yī)療大數據中心、區(qū)域中心、應用發(fā)展中心和產業(yè)園建設等國家試點工程任務;市場也催生了一大批專攻大數據、互聯網、AI的醫(yī)療企業(yè),醫(yī)療數據從來沒有像今天這樣挑動社會各方的神經。
然而,一片欣欣向榮的綺麗表象下是昏暗的底色。
醫(yī)院數據開放飄忽不定,上述產品經理對《財經》記者分析,醫(yī)院不知道什么樣的數據可以給公司,也不知道風險在哪里。
更根本的是,如何將數據應用于醫(yī)療仍是一個新鮮待解的課題。如何將不同的醫(yī)療信息進行整合分析以產生有價值的應用,整個行業(yè)還沒有吃透?,F階段,單是把知識結構化就是一項很復雜的任務,且需在數據安全、患者隱私、產業(yè)發(fā)展等多方面尋求平衡。
“不知道醫(yī)療大數據可以用在哪里,就先把這塊地圈起來,有沒有用再說?!币晃煌顿Y人對《財經》記者分析。
企業(yè)爭相跑馬圈數據,上演了一場利益拉鋸戰(zhàn)。
民資企業(yè)獲取數據的主流手段,是以科研合作的形式從醫(yī)生或者醫(yī)院科室中拿到。“國家隊”則是大手筆,在地方政府主導并授權下,能拿到整個醫(yī)院,甚至全市的醫(yī)療數據。
科研合作的醫(yī)療大數據項目,需先經過醫(yī)生所在醫(yī)院倫理委員會的審查。按官方流程,這是獲取醫(yī)療數據唯一一道關卡。倫理委員會旨在保護患者合法權益,維護其尊嚴。
現實中,通過倫理委員會的審查,很大程度上取決于“帶頭人的威望”。上述病理科主任性格豪爽,又是學科帶頭人,在醫(yī)學界應者眾,數據很容易收集上來。他召集30多家醫(yī)院開展多中心臨床試驗,試圖通過對歷史數據的挖掘,研究某種疾病在過去幾十年來的發(fā)病情況。
“他(病理科主任)說,你只管收數據就好了?!鄙鲜龉敬髷祿聵I(yè)部博士說,一個月內通過醫(yī)院的倫理審查,公司就拿到了數據。
“國家隊”的排頭兵——中電數據的做法是,獲得地方政府的授權,在當做數據采集、管控、清洗、開發(fā)。2017年4月,中電數據承接福州健康醫(yī)療大數據中心與產業(yè)園建設國家試點(福州)項目的規(guī)劃,一個月后,就實現福州市48家醫(yī)院數據互聯互通,這是近600萬人、超過150億條的健康醫(yī)療數據。
在中電數據董事長李世鋒看來,在國家健康醫(yī)療大數據試點工程中,由政府主導并授權中電數據對醫(yī)院的數據進行匯聚治理,利用數據促進應用發(fā)展,例如慢病管理、輔助診療、智能影像、新藥研制,這些應用又服務于醫(yī)院,形成良性的數據生態(tài)。
盡管是醫(yī)療數據的“掌門人”,醫(yī)院對可以開放哪些數據,開放到什么程度并不明確。
《網絡安全法》《刑法》等法規(guī)中厘定了醫(yī)療數據開放的“高壓線”。如果醫(yī)療機構或個人在沒有獲得就診者允許的情況下,通過擅自獲取、公布、出售、非法提供等方式利用個人公民信息,情節(jié)嚴重的,涉嫌觸犯非法獲取公民個人信息罪。
鑒于此,想要從醫(yī)院拿到數據非常不容易?!霸洪L通常很保守,因為誰也不愿為這個泄露出去的信息數據負責?!卑不蔗t(yī)科大學信息中心前員工黃楓稱。
而在紅線范圍內,究竟如何進行數據的商業(yè)化應用,也不明確,因為關鍵點——醫(yī)療數據是誰的、誰有權利決定如何使用等不明確。在中國現行法律中,如《執(zhí)業(yè)醫(yī)師法》《侵權責任法》《醫(yī)療機構病歷管理規(guī)定》《病歷書寫基本規(guī)范》等,并未對病歷的權利主體作出規(guī)定。
這樣的模糊不清,在實踐中演化成利益與風險的選擇題,醫(yī)院、科室、醫(yī)生個人等都會權衡輕重。
“如果病歷大數據是醫(yī)療機構與患者共同所有,”海上律師事務所合伙人劉曄對《財經》記者分析,“患者有權利限制醫(yī)院行使占有、使用、收益、處分這四項權利。比如,病歷數據作為商業(yè)目的使用獲得收益時,應當事前征得特定患者的同意,并給患者適當補償?!?/p>
上述公司大數據事業(yè)部博士告訴《財經》記者,其公司與上海三甲醫(yī)院的合作中,參與多中心臨床試驗的30多家醫(yī)院中,僅有一家醫(yī)院倫理委員會要求公司告知涉及到的每個患者,考慮工作量太大,于是放棄了這家醫(yī)院的數據。
醫(yī)院是否開放數據,取決于利益與風險的大小?!耙皇强催@個事情是不是醫(yī)院必要的;二是看批準之后會對患者或者臨床帶來什么收益?!币晃簧虾H揍t(yī)院信息科主任告訴《財經》記者。
在“國家隊”的項目中,促使醫(yī)院主動向中電數據開放數據的是,希望享受到數據匯總產生的一些好應用。目前,中電數據與福州醫(yī)院的數據還未實現實時共享,正是因為相關應用仍在探索中。吸引醫(yī)生個人與數據公司科研合作的在于可以免費享受到后者提供的數據分析技術。
一位醫(yī)療大數據公司董事長告訴《財經》記者,其公司在對接醫(yī)院數據時,有些醫(yī)院管理信息系統(HIS系統)企業(yè)會向其索要“接口費”,價格從幾萬到幾十萬元不等。
多位業(yè)內人士表示,“接口費”已經成為一些HIS企業(yè)大數據版圖的一部分,“接口費”多是以合作項目派工的勞務費名義支付,醫(yī)院并不直接涉入。
一位遠程醫(yī)療公司總經理認為,軟件廠商開放接口需要專門派人駐點,收取費用是應該的,至于收多少,則沒有標準。
黃楓分析,整合醫(yī)療數據要面臨三方面的困難:管理因素、業(yè)務因素和技術因素。所謂管理因素,即取決于醫(yī)院領導是否支持,HIS商、科室是否愿意配合。
有的醫(yī)院內部不同科室的數據系統也不同,各自占用數據為營。上述公司大數據事業(yè)部博士稱,如果本院醫(yī)生參與了外單位的數據項目,與其他科室主任協調拿數據時,有些醫(yī)院甚至內部之間也是要花錢買。
所涉各方不得不權衡的利益與風險,本質上是數據所屬權的模糊不明。國家衛(wèi)生健康委醫(yī)政醫(yī)管局副局長焦雅輝在接受媒體采訪時曾表示,對醫(yī)療電子信息的“確權”研究工作正在進行中。
開放使用與隱私保護的平衡?
將姓名、電話號碼、身份證號碼三項刪除,配備專門的人接收數據,并進行一定程度的物理隔離,在上述公司大數據事業(yè)部博士看來,企業(yè)做到這個地步已經夠了,如果不上升到懲戒層面,醫(yī)生、醫(yī)院和公司都沒有動力去進一步做數據脫敏。
出臺已近兩年的《網絡安全法》中規(guī)定,未經被收集者同意,不得向他人提供個人信息。但是,經過處理無法識別特定個人且不能復原的除外。
將敏感信息刪除,這是最傳統的數據脫敏方式。
多位業(yè)內人士均表示,合作之初,企業(yè)會囑咐醫(yī)生將脫敏后的數據傳上來,但很多醫(yī)生并不知道如何脫敏,經常直接上傳原始數據,再由公司將姓名、身份證號碼、手機號等刪除。
在英國格林威治大學商學院教授韓春佳看來,即便刪除患者個人信息,能否實現用戶數據隱私的保護效果值得懷疑,“大部分情況下是很容易通過其他的關聯信息,或者是通過已有的信息,重新識別出這個人是誰”。
如何在保護個人隱私的前提下,實現數據的開發(fā)利用,是整個大數據行業(yè)都面臨的問題。
國務院2016年發(fā)布的《關于促進和規(guī)范健康醫(yī)療大數據應用發(fā)展的指導意見》稱,到2020年,健康醫(yī)療大數據相關政策法規(guī)、安全防護、應用標準體系不斷完善。
這被視為“頂層設計”,按原國家衛(wèi)生計生委副主任金小桃分析,強調頂層設計,即強調“保護隱私”。
醫(yī)院是醫(yī)療數據的第一層,也是最重要的一層保護膜。
“信息科做得好的醫(yī)院,通常醫(yī)生是沒有數據的?!秉S楓對《財經》記者分析,理論上,醫(yī)生的電腦是聯網的,數據不在本機上,醫(yī)生拷不走。然而實際中,大多數醫(yī)院做不到這一點,醫(yī)生能夠繞過各種管理、技術環(huán)節(jié)收集到數據。另外,多數醫(yī)院信息化做得不好,很容易被黑客攻破。
美國的HIPAA法案(Health Insurance Portability and Accountability Act)規(guī)定,任何涉及個人健康信息的公司都應該具備物理、網絡和程序安全措施。該法案獲得國內醫(yī)療大數據公司認可。
國內的主要法律依據是《網絡安全法》,不過,其主要還是原則性、基礎性規(guī)范。
國家互聯網信息辦公室發(fā)布的《個人信息和重要數據出境評估辦法(征求意見稿)》中,主要針對的是數據在境內外使用。
按其規(guī)定,所有網絡運營者在境內運營中收集和產生的個人信息和重要數據,應當在境內存儲;作為例外,對于因業(yè)務需要,確需向境外提供的,應當事先進行安全評估。
為此,中電數據與IBM成立合資公司,向中國市場提供Watson Health相關解決方案?!熬褪且鉀Q引進先進技術,數據不出境?!崩钍冷h告訴《財經》記者,中電數據提供給IBM Watson的是模擬數據。
在國內法規(guī)細節(jié)還待完善之時,符合HIPAA,成為醫(yī)療大數據公司自律的標準,這也更易于企業(yè)形象宣傳。
不過,即便符合HIPAA,并不意味著數據隱私的安全。
“因為即使不采用任何安全技術,也可以通過一系列治理,完成HIPAA法案的合規(guī)。”韓春佳對《財經》記者說,“國內數據保護技術領域的研究剛剛起步,國外已經形成了一套體系,能在保護患者隱私的前提下實現數據的合理利用?!?/p>
國內更傾向于通過完善的防火墻實現數據的絕對安全,但是這一定程度上限制了數據的流通和使用。
李世鋒介紹,福州的醫(yī)療大數據產業(yè)園區(qū),數據并沒有上傳到互聯網,而是在試點區(qū)域對有限的用戶做有限數據的開放,數據在數據中心,誰也拿不走。如果企業(yè)需要某種疾病相關數據,中電數據僅會開放有限的數據,前者把算法模式放進來做驗證。
但這在一定程度上限制了醫(yī)療大數據產品的發(fā)展。比如在醫(yī)療AI領域,肺結節(jié)智能篩查之所以火熱,一個重要原因是,該領域有很多數據集可以直接下載。
李世鋒說,在國家法律法規(guī)和行業(yè)政策制定的同時,在保證數據安全的情況下,可以探索更多可能的應用。
數據拿到之后,并非立即就能煉出金子,后續(xù)的開發(fā)和利用受限于醫(yī)療數據的質量、顆粒度、維度、寬度等的優(yōu)劣,這取決于醫(yī)院的信息化系統。
醫(yī)療信息化系統被稱為最復雜的信息系統之一,業(yè)內人士常用“蜂窩煤” 來形容彼此之間的相互獨立。不同的系統難以互聯互通,醫(yī)療數據開發(fā)難度高。
比如,臨床數據產生的過程會涉及五個信息系統,從住院醫(yī)生醫(yī)囑、護士站確認,到藥房擺藥、藥師復核,及至送到護士區(qū),這個過程涉及的系統聯合起來才能完成整個住院病人發(fā)藥的業(yè)務場景。
對應的是,每個系統會產生不同的數據,這些互聯的數據,再匯集到臨床數據中心,才能串聯起一個臨床數據系統。
雖然2002年出臺的《醫(yī)院信息系統基本功能規(guī)范》,規(guī)范了“商品化醫(yī)院信息系統必須達到的基本要求”,但現實中很少有醫(yī)院能滿足這一要求。黃楓分析,如此復雜的系統,又需醫(yī)院自掏腰包,因而,究竟想達到什么成果,取決于院長的觀念、經費、上級檢查等多種因素。
像上述的臨床數據系統如果五個信息枝脈缺一,就會有數據缺漏;加之數據標準不統一、錄入不規(guī)范,企業(yè)拿到的很多數據不可用,開發(fā)產品和服務都會受影響,即便出來成果,也不太可能復制,更多是定制化,這其實削弱了互聯網企業(yè)的優(yōu)勢。
高質量的數據昂貴。一位廣東三甲醫(yī)院影像科主任收集整理清洗300名病人數據耗費40多萬元。他讓最信任的、最靠譜的學生進行隨訪,此外,還會對數據進行嚴格的質控,“否則,這些數據是沒有意義的”。
高質量的醫(yī)療數據既要完備,又要真實,兩者缺一不可,取決于結構化病歷或??苹膶I(yè)系統,這同時也會增加醫(yī)生處理數據的時間。且不同專科、不同業(yè)務領域,形成醫(yī)療信息系統的標準化很困難。
黃楓稱,標準化的核心不是IT技術能力的問題,而是管理問題。不同的科室,流程、管理、成本核算方式也不同,“如果想要把業(yè)務全改變,同時又能滿足科室的利益訴求,是很難做到的”。
這導致不同醫(yī)院之間數據差異極大,公司很難提供通用的數據處理方案。上述公司大數據事業(yè)部博士稱,他所在的公司為一個項目中30多家不同醫(yī)院提供的是定制化的服務,算法能解決80%的問題,剩余的20%還需要人工進行逐個修訂。
現階段,醫(yī)療大數據公司更多將自己定位為一個服務提供商。在Latitude Health 合伙人趙衡看來,比拼的是更強的數據資源獲取能力和更強的應用場景,最關鍵的是未來能否產生規(guī)?;挠?。
“未來可能更多的可能是跟應用廠商合作,然后通過相應的一攬子服務,而不是單純的數據服務。”李世鋒說。