楊欽泰
1 中山大學(xué)附屬第三醫(yī)院耳鼻咽喉頭頸外科、變態(tài)反應(yīng)(過(guò)敏)科(廣州,510000)
變應(yīng)性鼻炎發(fā)病率快速增加是全球的共同趨勢(shì),目前認(rèn)為城市化和現(xiàn)代化生活方式是導(dǎo)致其快速增加的重要原因。張羅教授研究團(tuán)隊(duì)發(fā)現(xiàn),中國(guó)最近六年變應(yīng)性鼻炎患者增加了1 個(gè)億,目前我國(guó)至少有3 億變應(yīng)性鼻炎患者[1]。科學(xué)家們指出,城市化和現(xiàn)代化生活方式讓我們?nèi)祟?lèi)與大自然在一定程度上實(shí)現(xiàn)“自我隔離”,使得感染性疾病減少,但我們的免疫系統(tǒng)因缺乏“鍛煉”而失調(diào),導(dǎo)致免疫性疾病(主要是過(guò)敏性疾?。┛焖僭黾印K麄儼l(fā)出警告:這種發(fā)展趨勢(shì)如果得不到有效抑制,再過(guò)20年,我們每個(gè)人都將不能逃脫過(guò)敏性疾病的魔爪。因此,面向“人民生命健康”全民共同防治過(guò)敏是對(duì)接“國(guó)家重大的需求”。
面對(duì)日益增多的變應(yīng)性鼻炎患者,作為醫(yī)生,你真的了解他們的真實(shí)需求嗎?大數(shù)據(jù)顯示:“非常不了解”,至少醫(yī)生和患者雙方對(duì)變應(yīng)性鼻炎治療的認(rèn)知存在嚴(yán)重偏差。我們醫(yī)生都非常清楚變應(yīng)性鼻炎是全身過(guò)敏性疾病在上氣道的表現(xiàn),影響患者生活質(zhì)量,并可能進(jìn)一步發(fā)展成為多系統(tǒng)的過(guò)敏性疾病。目前雖然局部糖皮質(zhì)激素等對(duì)癥藥物治療或者對(duì)因的脫敏治療對(duì)變應(yīng)性鼻炎有一定療效,但容易反復(fù)發(fā)作,根治非常困難,患者需要定期隨訪(fǎng)并納入慢病管理。程雷教授團(tuán)隊(duì)利用人工智能技術(shù)對(duì)近年我國(guó)互聯(lián)網(wǎng)用戶(hù)變應(yīng)性鼻炎的相關(guān)檢索信息進(jìn)行大數(shù)據(jù)分析,發(fā)現(xiàn)我國(guó)患者普遍認(rèn)為變應(yīng)性鼻炎是小病,到醫(yī)院看病希望醫(yī)生用最佳方案或者采用偏方能夠一次性根治[2]。其中“變應(yīng)性鼻炎的最佳治療方法、變應(yīng)性鼻炎的治療偏方、變應(yīng)性鼻炎怎么樣處理好”[2]是互聯(lián)網(wǎng)上關(guān)于變應(yīng)性鼻炎提問(wèn)最多的三個(gè)問(wèn)題,這就是真實(shí)世界患者的真實(shí)需求。然而,當(dāng)就診患者得到醫(yī)生的回應(yīng)“變應(yīng)性鼻炎容易反復(fù)發(fā)作,需要長(zhǎng)期規(guī)范治療,目前難于根治等”后,很多患者會(huì)根據(jù)網(wǎng)絡(luò)競(jìng)價(jià)排名等問(wèn)題而傳入不良醫(yī)療機(jī)構(gòu)所謂的“根治”,造成了后續(xù)諸多不良影響,甚至導(dǎo)致鼻腔不可逆的破壞后果。要提升變應(yīng)性鼻炎的診療質(zhì)量和水平,是最關(guān)鍵和必要的條件,通過(guò)大數(shù)據(jù)獲悉患者的真實(shí)需求。
我們正快速步入互聯(lián)網(wǎng)大數(shù)據(jù)和人工智能時(shí)代,在大數(shù)據(jù)和人工智能等技術(shù)開(kāi)始全面落地應(yīng)用之后,這些新技術(shù)不僅會(huì)對(duì)個(gè)人信息進(jìn)行收集、分析和應(yīng)用,同時(shí)對(duì)于整個(gè)產(chǎn)業(yè)領(lǐng)域和社會(huì)資源都會(huì)進(jìn)行管理,這是一個(gè)明確的發(fā)展趨勢(shì),簡(jiǎn)單的說(shuō)就是“資源數(shù)字化”,資源數(shù)字化也是智能化的重要基礎(chǔ)。
研究發(fā)現(xiàn),日常生活中人們不管是出于善意或是惡意經(jīng)常會(huì)說(shuō)謊,所以傳統(tǒng)的統(tǒng)計(jì)調(diào)研方法得出的結(jié)論一部分可能是錯(cuò)誤和偏倚的,有時(shí)會(huì)誤導(dǎo)我們的認(rèn)知[3]。然而,人們?cè)谝环N情況下會(huì)放下戒備、吐露心聲、暴露自己的真實(shí)想法,那就是面對(duì)互聯(lián)網(wǎng)[3]。人們面對(duì)搜索引擎的時(shí)候一定不會(huì)說(shuō)謊,因此,搜索引擎也被稱(chēng)為“數(shù)據(jù)吐真劑”。在大數(shù)據(jù)時(shí)代進(jìn)行“小樣本”抽樣分析已不合時(shí)宜,我們需要的是盡可能的全部數(shù)據(jù),稱(chēng)為“全樣本”?;ヂ?lián)網(wǎng)大數(shù)據(jù)可以達(dá)到近乎全樣本的功能,由海量的數(shù)據(jù)形成的真實(shí)而龐大的數(shù)據(jù)可以分析和總結(jié)出意想不到的結(jié)論和趨勢(shì),這些又“大”和又“真”的數(shù)據(jù)最能接近人們的真實(shí)狀態(tài)。
由中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的《第47 次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截止2020 年12 月,我國(guó)網(wǎng)民規(guī)模達(dá)9.89 億,其中使用手機(jī)上網(wǎng)的比例高達(dá)99.7%,即9.86 億[4]。而我國(guó)搜索引擎用戶(hù)規(guī)模達(dá)7.70 億,占網(wǎng)民整體77.8%[4]。同一部門(mén)數(shù)據(jù)顯示,百度搜索引擎的用戶(hù)滲透率排名第一,達(dá)90.9%[5],網(wǎng)民在利用互聯(lián)網(wǎng)尋求醫(yī)療信息等場(chǎng)景其使用率為70.5%[5]??梢?jiàn),在中國(guó),有問(wèn)題問(wèn)“度娘”(百度)已經(jīng)形成一種習(xí)慣,“沒(méi)看病,先上網(wǎng)”已經(jīng)形成一種趨勢(shì),我們應(yīng)該通過(guò)對(duì)這種“習(xí)慣”和“趨勢(shì)”的資源數(shù)字化來(lái)掌握民眾的真實(shí)需求,而“百度指數(shù)”則是一個(gè)有力的工具。
目前百度搜索引擎已開(kāi)放大數(shù)據(jù)展示平臺(tái),百度指數(shù)可提供基于百度海量網(wǎng)民檢索行為的數(shù)據(jù)統(tǒng)計(jì)和分享,其每天發(fā)布特定檢索詞在全國(guó)各省市的搜索量。據(jù)此,我們可以獲悉關(guān)鍵詞的檢索趨勢(shì)、需求圖譜、人群畫(huà)像以及時(shí)空分布等。在新冠肺炎疫情期間,我們利用人工智能技術(shù)挖掘疾病癥狀檢索關(guān)鍵詞的百度指數(shù)及中國(guó)疾病預(yù)防控制中心發(fā)布的疫情實(shí)時(shí)大數(shù)據(jù)探索了新冠肺炎的癥狀特征[6]。結(jié)果顯示疫情期間湖北省民眾對(duì)下呼吸道癥狀的檢索量較上呼吸道癥狀明顯增多,而且腹瀉癥狀的檢索量亦顯著升高,與此后多項(xiàng)研究結(jié)果相符[6]。此外,百度指數(shù)增量與新增確診數(shù)、新增疑似數(shù)呈顯著正相關(guān)[6],提示大數(shù)據(jù)對(duì)于傳染性疾病具有一定的趨勢(shì)性判斷和預(yù)警的作用。由此可見(jiàn),網(wǎng)絡(luò)搜索引擎大數(shù)據(jù)具有海量性、高速性、多樣性、真實(shí)性等特征,且成本低、易獲取,可有效助力醫(yī)療快速發(fā)展。
我們最近在“百度指數(shù)”平臺(tái)以“變應(yīng)性鼻炎”作為檢索詞,對(duì)檢索人群屬性進(jìn)行了機(jī)器快速聚類(lèi)分析,獲得了百度搜索引擎用戶(hù)變應(yīng)性鼻炎的地域分布、時(shí)間分布等時(shí)空分布特征。首先,我們知道在百度搜索“變應(yīng)性鼻炎”的人群一般有兩種,一種是自己得了變應(yīng)性鼻炎的人群,另外一種是家人有變應(yīng)性鼻炎的人群,他們搜索的主要目的是獲取疾病知識(shí)和尋求解決方案,因此檢索人群的所屬區(qū)域及排名可在一定程度上反映變應(yīng)性鼻炎在中國(guó)各地的分布趨勢(shì),即主要分布在東部沿海地區(qū)和中部地區(qū)(圖1)。另外,由于搜索者的普遍特征是有問(wèn)題即刻搜索,也就是變應(yīng)性鼻炎發(fā)作時(shí)才搜索,搜索量和發(fā)病情況存在密切相關(guān)性,因此,百度指數(shù)還能反映變應(yīng)性鼻炎在不同地區(qū)的發(fā)病時(shí)間分布差異。我們對(duì)廣東省和全國(guó)的百度檢索特征進(jìn)行了比較研究,分析結(jié)果顯示全國(guó)變應(yīng)性鼻炎的日均百度指數(shù)具有明顯的季節(jié)差異,主要表現(xiàn)為3~5 月及7~9月的兩個(gè)搜索高峰(圖2),這與中國(guó)兩個(gè)花粉季節(jié)和季節(jié)性變應(yīng)性鼻炎發(fā)病時(shí)段重合。然而,廣東省的日均百度指數(shù)則沒(méi)有明顯的季節(jié)差異,只有1~2月的一個(gè)相對(duì)低谷(圖3)。廣東省屬于南方地區(qū),90%變應(yīng)性鼻炎患者都是塵螨過(guò)敏,花粉過(guò)敏相對(duì)較少,而1~2 月是該省全年氣溫最低的季節(jié)(平均10℃左右),不具備塵螨生長(zhǎng)的適宜氣溫(25°C 左右),所以塵螨過(guò)敏原相對(duì)減少,患者病情也相對(duì)平穩(wěn)或者發(fā)作減少,自然而然導(dǎo)致搜索量的下降。百度指數(shù)的這一搜索趨勢(shì)提示變應(yīng)性鼻炎的發(fā)病在全國(guó)范圍與廣東省范圍存在明顯差異,全國(guó)范圍綜合來(lái)看變應(yīng)性鼻炎因花粉季節(jié)影響存在季節(jié)性的發(fā)病高峰,而廣東省地區(qū)以塵螨為主的常年性發(fā)病則相對(duì)比較平穩(wěn)。由此可見(jiàn),網(wǎng)絡(luò)搜索引擎大數(shù)據(jù)可在一定程度上反映真實(shí)世界變應(yīng)性鼻炎的流行趨勢(shì),可作為傳統(tǒng)流行病學(xué)調(diào)查手段的一種有力補(bǔ)充。搜索引擎大數(shù)據(jù)與人工智能技術(shù)相輔相成,二者有機(jī)結(jié)合,能夠?qū)崿F(xiàn)機(jī)器快速分析患者需求、熱搜指數(shù)提前預(yù)警及系統(tǒng)支持實(shí)時(shí)分析等功能,有助于滿(mǎn)足新時(shí)代疾病精準(zhǔn)防控的需求。
圖1 全國(guó)“變應(yīng)性鼻炎”百度指數(shù)地域分布(省份,2013.7-2020.12)
圖2 “變應(yīng)性鼻炎”全國(guó)百度指數(shù)走勢(shì)(2013.7-2020.12)
圖3 “變應(yīng)性鼻炎”廣東百度指數(shù)走勢(shì)(2013.7-2020.12)
推特(Twitter)是國(guó)外最受歡迎的網(wǎng)絡(luò)社交平臺(tái),澳大利亞學(xué)者通過(guò)對(duì)推特的大數(shù)據(jù)分析進(jìn)行花粉監(jiān)測(cè),并指導(dǎo)季節(jié)性變應(yīng)性鼻炎的預(yù)防和用藥[7]。一項(xiàng)來(lái)自意大利學(xué)者的研究報(bào)道,利用人工智能進(jìn)行變應(yīng)性鼻炎患者鼻分泌物的細(xì)胞學(xué)檢測(cè),靈敏度達(dá)97%,準(zhǔn)確度達(dá)94%,可明顯減少顯微鏡下人工識(shí)別的時(shí)間和工作強(qiáng)度[8]。國(guó)外多國(guó)過(guò)敏領(lǐng)域?qū)<易罱献鹘⒌淖儜?yīng)性鼻炎臨床決策支持系統(tǒng)(clinical decision support system, CDSS) 應(yīng)用程序(app)[9],可協(xié)助診斷變應(yīng)性鼻炎,生成治療管理方案,指導(dǎo)患者進(jìn)行自我管理,并協(xié)助醫(yī)生管理患者,為利用大數(shù)據(jù)和人工智能提高健康管理提供了一個(gè)很好的范例[10]。
然而,我們必須清楚大數(shù)據(jù)和人工智能在實(shí)際應(yīng)用中存在的局限性及其注意事項(xiàng)。
事實(shí)上,當(dāng)前的大數(shù)據(jù)仍然以“信息孤島”的形式存在,電商掌握著用戶(hù)的消費(fèi)習(xí)慣,導(dǎo)航掌握著用戶(hù)的移動(dòng)軌跡,各醫(yī)院的患者診療信息互不聯(lián)通,沒(méi)有任何一個(gè)組織機(jī)構(gòu)能夠獲取在廣度和深度上都足夠充分的、完全的數(shù)據(jù)。此外,目前來(lái)自于現(xiàn)實(shí)或網(wǎng)絡(luò)的大數(shù)據(jù)并不能完全覆蓋整個(gè)人類(lèi)社會(huì)、達(dá)到全樣本。例如,我國(guó)60 歲及以上人口的比例為18.7%[11],而我國(guó)60 歲及以上網(wǎng)絡(luò)用戶(hù)的比例僅為6.9%[4],提示網(wǎng)絡(luò)數(shù)據(jù)不可避免地會(huì)產(chǎn)生一定程度的偏倚。
大數(shù)據(jù),顧名思義,其數(shù)據(jù)體量巨大。此外,其增長(zhǎng)速度極其迅猛。然而,大數(shù)據(jù)研究的權(quán)威學(xué)者維克托·邁爾·舍恩伯格指出,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。因此,我們必須接受大數(shù)據(jù)的混雜性,否則剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法得到有效利用。對(duì)于我們的臨床和科研需求而言,針對(duì)一個(gè)問(wèn)題,往往大多數(shù)時(shí)候并非所有的數(shù)據(jù)都是適合的,有用的數(shù)據(jù)僅占其中很小一部分。這就要求我們必須在海量數(shù)據(jù)中,排除冗余的、無(wú)意義的數(shù)據(jù),在龐大的噪聲中挖掘、采集有用的數(shù)據(jù)。
由于大數(shù)據(jù)的客觀(guān)特性,天然地需要與人工智能結(jié)合并進(jìn)行數(shù)據(jù)處理。蓬勃發(fā)展的人工智能似乎能夠滿(mǎn)足我們的眾多需求,但仍存在著許多障礙和陷阱。曾備受矚目的IBM Watson Health(沃森健康)人工智能,后來(lái)證實(shí)它所提出的許多治療建議實(shí)際上是錯(cuò)誤的,例如建議在有嚴(yán)重出血的患者中使用貝伐珠單抗[12]。這說(shuō)明有缺陷的算法可能對(duì)患者造成重大傷害,從而導(dǎo)致醫(yī)療事故。人工智能運(yùn)用算法解析大量數(shù)據(jù),不斷學(xué)習(xí),找到輸入和輸出之間的“關(guān)系”,然后對(duì)新的輸入進(jìn)行判斷和預(yù)測(cè)。然而,數(shù)字人工智能的算法就像一個(gè)“黑匣子”,可能輸出讓人無(wú)法理解的結(jié)果。因此,當(dāng)人工智能被運(yùn)用到臨床前,需要不斷地調(diào)試、審核、模擬、驗(yàn)證以及進(jìn)行前瞻性研究。
總而言之,大數(shù)據(jù)為人工智能提供了源源不斷的燃料,而人工智能則持續(xù)推進(jìn)大數(shù)據(jù)應(yīng)用深化,讓原本海量數(shù)據(jù)實(shí)現(xiàn)價(jià)值。二者緊密聯(lián)合、相輔相成,從而獲取對(duì)疾病更精確、更深層的認(rèn)識(shí),也是變應(yīng)性鼻炎真實(shí)世界研究的重要武器。醫(yī)務(wù)工作者在臨床診療過(guò)程中必須更加重視患者的真實(shí)需求,利用大數(shù)據(jù)及人工智能對(duì)變應(yīng)性鼻炎患者進(jìn)行針對(duì)性的科普宣教,協(xié)助診斷及治療決策,加強(qiáng)指導(dǎo)患者的管理,使變應(yīng)性鼻炎患者獲得科學(xué)的診斷和防治。然而,在實(shí)踐過(guò)程中,我們必須清楚大數(shù)據(jù)、人工智能的局限性以及數(shù)據(jù)隱私等注意事項(xiàng)。
中國(guó)中西醫(yī)結(jié)合耳鼻咽喉科雜志2021年3期