吳鐵成,曹 蕾,尹蓮花,何友澤,劉志臻,楊敏光,徐 穎,吳勁松*
1 福建中醫(yī)藥大學(xué)康復(fù)產(chǎn)業(yè)研究院,福建 福州 350122;
2 福建中醫(yī)藥大學(xué)附屬第二人民醫(yī)院,福建 福州 350003
輕度認知障礙(mild cognitive impairment,MCI)作為健康老齡化和癡呆之間的臨床前和過渡階段,是延緩癡呆進展的重要階段[1]。有研究者對66 篇文章的薈萃分析發(fā)現(xiàn),50 歲及以上的社區(qū)老年人MCI 的總患病率為15.5%,且隨著年齡的增長而增加[2],其發(fā)展為癡呆的累積比例為39.2%[3]。因此,針對高危人群中MCI的早期辨識顯得更為關(guān)鍵。
目絡(luò),可理解為現(xiàn)代醫(yī)學(xué)中的結(jié)膜微循環(huán),主要由細動脈、細靜脈及毛細血管網(wǎng)組成,其位置淺表,易于觀察,是觀察全身微循環(huán)的窗口[4]。有研究證實,結(jié)膜微循環(huán)與大腦血管發(fā)育及生理結(jié)構(gòu)相似,通過結(jié)膜微循環(huán)檢查可反映中樞神經(jīng)系統(tǒng)及全身血管系統(tǒng)的生理病理變化[5]。動物實驗發(fā)現(xiàn),結(jié)膜微循環(huán)與大腦皮質(zhì)之間存在顯著的相關(guān)性,表明結(jié)膜微循環(huán)可能作為觀察大腦微循環(huán)的指標[6-7]。SMITH 等[8]使用計算機輔助活體顯微鏡對阿爾茨海默病(Alzheimer's disease,AD)患者的結(jié)膜微循環(huán)進行檢測,發(fā)現(xiàn)AD 患者的腦血管變性會引起結(jié)膜微循環(huán)異常,如小靜脈異常寬大、毛細血管減少、相鄰血管內(nèi)血管淤積、微動脈瘤等。基于上述理論,有學(xué)者研究了AD 患者的目絡(luò)特征,結(jié)果發(fā)現(xiàn),AD 組重要目絡(luò)形態(tài)特征為“斑”,目絡(luò)顏色“黯褐色”特征分值高于對照組,而“紫色”“粉色”低于對照組[9]。然而,目前MCI 患者的目絡(luò)特征尚不明確,若能明確其特征,則有助于MCI的精準辨識。
MCI 屬于“腦病”范疇,其病位證素涉及心、腎、肝、脾和肺等臟腑[10]。病性證素多為氣虛、血虛、陰虛、陽虛、血瘀和痰濁等[11-14]。這些中醫(yī)證素也是MCI 辨識的重要依據(jù)。目與腦關(guān)系密切,且相互影響?!澳空?,心之使者”“手少陰之脈……系目系”,故“神”以心為舍,由目入腦[15-16]。當(dāng)出現(xiàn)腦功能障礙時,目的“旁支細絡(luò)”也即目絡(luò),會出現(xiàn)形態(tài)、顏色方面的改變。目絡(luò)特征的改變與中醫(yī)證素特點密切關(guān)聯(lián)。若將目絡(luò)特征與中醫(yī)證素辨證相結(jié)合,有助于進一步提升對MCI 的辨識[17]。而隨著人工智能和現(xiàn)代醫(yī)學(xué)的發(fā)展,眼部影像診斷系統(tǒng)可以通過數(shù)字化方法采集目絡(luò)特征,可實現(xiàn)客觀、量化目絡(luò)特征數(shù)據(jù),為其結(jié)合中醫(yī)證素進行MCI 的辨識提供了可能。
本研究旨在運用眼健康成像儀采集MCI 人群的目絡(luò)信息,探究MCI 人群的目絡(luò)特征的分布規(guī)律,并把目絡(luò)特征和中醫(yī)證素資料作為辨識指標,運用機器學(xué)習(xí)算法構(gòu)建MCI 辨識模型,以期能為MCI的中醫(yī)辨識和預(yù)防提供客觀化依據(jù)。
1.1.1診斷標準 符合《2018 年中國癡呆與認知障礙診治指南》[18]中關(guān)于MCI 的診斷標準,并通過神經(jīng)內(nèi)科醫(yī)生依據(jù)MCI 診斷標準結(jié)合神經(jīng)心理學(xué)評估結(jié)果進行診斷。
1.1.2納入標準 ① 年齡55~75 周歲;② 癡呆篩查面談8項(AD8)≥2分[19];③ 福州版蒙特利爾認知評估量表(Fuzhou version of Montreal cognitive assessment,MoCA)在19~24 分,若受教育年限≤6 年,則為14~19分[20];④ 簽署知情同意書,自愿參加。
1.1.3排除標準 ① 有腦外傷、腦梗死、帕金森病、癲癇等神經(jīng)系統(tǒng)疾病史;② 簡版老年人抑郁量表(geriatric depression scale-15,GDS-15)≥8 分[21];③有抑郁癥狀者或其他精神相關(guān)疾病患者,近2 周內(nèi)服用過神經(jīng)抑制類藥物或相關(guān)精神類藥物者;④ 患有糖尿病合并視網(wǎng)膜病變或其他視網(wǎng)膜疾病者;⑤患有結(jié)膜炎、角膜炎等可引起白睛血絡(luò)顏色、形態(tài)改變的眼部疾病者;⑥ 因眼部外傷、手術(shù)等影響檢查或不能耐受目診儀檢查者;⑦ 佩戴眼鏡、助聽器后也仍存在視聽障礙者;⑧ 文盲或聽不懂普通話者;⑨ 正在參加影響本研究結(jié)果評價的其他臨床試驗者。
1.1.4中止標準 ① 評估過程中,不能按評估要求進行認知評估的受試者;② 評估過程中,因任何原因提出主動退出的受試者;③ 評估期間出現(xiàn)突發(fā)事件或疾病不能繼續(xù)參加試驗者。
本研究于2022 年4 月—2022 年12 月在福建省福州市5個社區(qū)和福建中醫(yī)藥大學(xué)附屬第二人民醫(yī)院健康管理中心招募受試者。累計招募符合條件受試者404 例,將2 組人群按照性別、年齡、受教育年限以卡鉗值0.2 進行1∶1 傾向性得分匹配,最終納入316 名受試者,其中認知正常組和MCI 組各158 例。2 組一般資料比較差異無統(tǒng)計學(xué)意義(P>0.05),具有可比性。見表1。本研究已通過福建中醫(yī)藥大學(xué)附屬康復(fù)醫(yī)學(xué)倫理委員會以及福建中醫(yī)藥大學(xué)附屬第二人民醫(yī)院倫理委員會審批(審批號分別為2019KY-002-02和SPHFJP-K2019001-1)。
表1 2組一般資料比較[M(P25,P75)]Table 1 Comparison of general data between two groups [M(P25,P75)]
2.1.1認知功能評分 MoCA 是被用于篩查MCI 患者最常用的整體認知評估量表,覆蓋了8 個認知領(lǐng)域的測試,共30 個單項,每項回答正確者得1 分,回答錯誤或答不知道者不得分,各認知領(lǐng)域測試得分相加得到量表總分,滿分為30 分,分數(shù)越高表示受試者總體認知功能越好。
2.1.2抑郁狀態(tài)評分 GDS-15 用以鑒別受試者是否有抑郁傾向。該量表共15 項,有10 個條目為正向,回答“是”,計1 分,“否”計0 分;其中條目第1、5、7、11、13 為反向計分,回答“是”計為0 分,“否”計1 分。滿分15 分;GDS-15≥8 分表示可能有抑郁的問題。本研究需用以排除抑郁對老年認知功能評估的影響。
2.2.1中醫(yī)證候信息采集表 采用福建中醫(yī)藥大學(xué)中醫(yī)診斷學(xué)科自行研發(fā)的中醫(yī)證素辨識系統(tǒng)進行MCI 中醫(yī)證素辨證,它主要是以中醫(yī)證候信息采集表作為證候信息采集工具,再結(jié)合《中藥新藥臨床研究指導(dǎo)原則(試行)》[22]中對臨床癥狀的輕、中、重進行鑒別,制定了內(nèi)容較為完善的中醫(yī)證候信息采集表。
2.2.2中醫(yī)證素辨識 中醫(yī)證素辨識系統(tǒng)的證素辨識過程以朱文鋒編纂的《證素辨證學(xué)》[23]為理論指導(dǎo),在系統(tǒng)的辨證過程中,主要通過對患者中醫(yī)證候信息采集來提取證候要素。根據(jù)證候在診斷中的輕重,采取了加權(quán)閾值法確定證素每一癥狀的輕重,未明確指明輕重程度,默認以中等程度為準,若癥狀重時,其定量診斷值乘1.5,若該癥狀輕時,乘0.7。辨證時,先分別將患者的癥狀按提示的辨證要素進行累加,取超過100閾值的項目作為辨證診斷。
應(yīng)用北京博奧生物公司研發(fā)的MY EYE D-10目診儀(產(chǎn)品貨號:400411),囑受試者正坐于目診儀鏡頭前,分別拍照采集左、右眼部圖像。操作流程以單側(cè)眼睛為例,囑受試者將眼皮貼合于儀器托架上,眼睛直視正前方,并用力睜大,充分暴露白睛部分。一名研究者操作目診儀器進行拍照采集,囑受試者頭部固定,眼睛分別向左側(cè)、右側(cè)、上方、下方光源位置注視。當(dāng)水平看向左、右側(cè)光源時,助手從旁用手指輕拉上下眼瞼;當(dāng)向上方光源看時,助手用手指輕拉住受試者下眼瞼;當(dāng)向下方光源看時,助手用手指輕拉住受試者上眼瞼,以充分暴露白睛部分。最終采集到雙眼正前、左、右、上、下各5 張充分暴露白睛部位的圖像,并數(shù)字化提取目絡(luò)中“斑”“點”“霧漫”“月暈”“丘”“血脈”的分布頻率特征。
采用SPSS Modeler 18.0 統(tǒng)計軟件,將篩選后的目絡(luò)和證素特征作為自變量,將MCI 成立是否作為因變量,導(dǎo)入經(jīng)典機器學(xué)習(xí)算法,分別構(gòu)建模型,辨識是否為MCI。
2.4.1機器學(xué)習(xí)算法選擇 ① 支持向量機(support vector machine,SVM)[24],主要通過尋找類別的最優(yōu)超平面實現(xiàn)類別分類,其核心方法在于直接確定核函數(shù),來解決高維映射的維數(shù)問題,故常用在小樣本、非線性和高維的回歸和二分類問題上。② 決策樹C5.0(decision tree C 5.0,DT C5.0)[25],以其數(shù)據(jù)分析能力和相對直觀的模式,被廣泛應(yīng)用的一項分類算法。采用迭代式從頂部向下的移動方式選擇最優(yōu)特征,并對訓(xùn)練數(shù)據(jù)進行分割實現(xiàn)分類。其中DTC5.0 算法適用于大多數(shù)問題,且更容易理解和部署。③ 人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[26],是在一種模擬人腦思維的計算機建模方式,由相連鏈接的神經(jīng)元組成。根據(jù)神經(jīng)網(wǎng)絡(luò)層數(shù),分為2 層、3 層和多層神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和輸出層組成。主要通過調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)各層級各節(jié)點的相互連接,來達到處理信息的目的。④ 隨機森林算法(random forest,RF)[27],是由大量決策樹構(gòu)建而成,具有抗噪能力強、防止過擬合、方便數(shù)據(jù)等特點,通過計算每個決策樹的結(jié)果,選擇加權(quán)投票數(shù)量最多的結(jié)果為最終結(jié)果。較之傳統(tǒng)決策樹算法,具有較高的預(yù)測準確率。
2.4.2機器算法模型構(gòu)建流程 采用SPSS Modeler 18.0 統(tǒng)計軟件進行模型構(gòu)建,以支持向量機(SVM)建模為例。在該軟件中,在“Sources”選項卡添加“Excel”節(jié)點,導(dǎo)入“Model data.xlsx”。在“Field Ops”選項卡添加“Type”節(jié)點,設(shè)置認知等級為“Target”,目絡(luò)特征和中醫(yī)證素為“Input”,再添加“Partition”節(jié)點。以4∶1 的比例,隨機將臨床數(shù)據(jù)分為80%訓(xùn)練集和20%驗證集[28],訓(xùn)練數(shù)據(jù)集被用于特征選擇和模型開發(fā),其相應(yīng)的測試數(shù)據(jù)集被用于開發(fā)的模型的獨立測試。在“Modeling”選項卡添加“SVM”節(jié)點,設(shè)置模型名稱為“SVM模型”,模式選擇“Expert”,然后運行整個模型。在“Output”選項卡添加“Analysis”節(jié)點,在“Graphs”選項卡添加“Evaluation”節(jié)點。構(gòu)建模型結(jié)束后,運行模型獲得結(jié)果。
決策樹模型、人工神經(jīng)網(wǎng)絡(luò)模型和隨機森林模型,均應(yīng)用SPSS Modeler 18.0統(tǒng)計軟件,具體方法與SVM模型方法相似。
2.4.3模型效果評價指標 本研究的模型評價指標包括準確率(accuracy)、受試者工作特征曲線(receiver operator characteristic curve,ROC)和曲線下面積(area under curve,AUC),其中分類結(jié)果有4種情況:真陽性(true positive,TP)、假陽性(false positive,F(xiàn)P)、真陰性(true negative,TN)和假陰性(false negative,F(xiàn)N)。
2.4.3.1準確率 指真陽性與真陰性之和占總例數(shù)的比例。準確率越高,真實性越好。
2.4.3.2敏感度 又稱真陽性率,是分類判別陽性而被模型正確地判別為陽性樣本的比例。該值越大越好,反映了正確判別陽性病例的能力。
2.4.3.3特異度 又稱真陰性率,是分類判別陰性而被模型正確判別陰性的比例。該值越高,反應(yīng)模型誤判率越低,反映了正確排除陽性病例的能力。
2.4.3.4ROC 曲線下面積 又稱AUC,是綜合評價模型準確性的重要指標,其取值范圍為0~1。值越高表示模型判別價值越高。
采用SPSS 26.0 進行數(shù)據(jù)統(tǒng)計分析。定量資料符合正態(tài)分布的采用(±s)表示,不符合正態(tài)分的布采用中位數(shù)(四分位數(shù))M[P25,P75]表示;組間比較,若各組均滿足正態(tài)性且方差齊,采用兩獨立樣本t檢驗,若不滿足則采用兩樣本非參數(shù)Mann-WhiteneyU檢驗。對于分類資料,使用頻數(shù)、百分率或構(gòu)成比(n,%)進行描述;兩組間比較,無序分類資料采用卡方檢驗或Fisher 精確概率檢驗。采用Delong檢驗比較各模型的AUC。以P<0.05 為差異有統(tǒng)計學(xué)意義。
MCI組紅色點、黯褐色斑、黯黃色霧漫、丘、血脈紅色、血脈迂曲分布頻率高于認知正常組(P<0.05),黯粉色斑頻率低于認知正常組(P<0.05)。2 組間“月暈”特征分布頻率差異無統(tǒng)計學(xué)意義(P>0.05)。見表2。
表2 MCI與認知正常人群目絡(luò)特征比較(n,%)Table 2 Comparison of eyes collateral channels characteristic between MCI and normal cognition groups (n,%)
MCI 組心、脾、肝積分均高于認知正常組,中位數(shù)分別為83.2、90.0、182.6(P<0.05)。MCI 組的痰、濕、血瘀、氣滯、熱、陽亢、暑、食積積分均高于認知正常組(P<0.05)。見表3。MCI組的陰虛、血虛、氣虛、津虧、氣陷積分均高于認知正常組(P<0.05)。見表4。對158 例MCI 患者中醫(yī)證素特征分布進行統(tǒng)計分析后發(fā)現(xiàn),病位證素以肝出現(xiàn)頻率最多(98.1%),其次為腎(96.8%)、筋骨(82.3%),再者為脾(65.8%)、心(55.7%)、經(jīng)絡(luò)(53.2%)、膽(31.6%)、心神(30.4%)、胃(27.8%)、肺(25.3%)。其中心、肝、脾證素分值均高于認知正常組(P<0.05),病性證素中對實性證素和虛性證素的分析發(fā)現(xiàn),出現(xiàn)頻率最多的實性證素為痰(94.3%)和濕(94.3%),頻數(shù)分布次之是血瘀(88.6%)和氣滯(84.8%);出現(xiàn)頻數(shù)最多的虛性證素為陰虛(97.5%)和血虛(94.9%),其次是氣虛(90.5%)和陽虛(76.6%)。
表3 MCI與認知正常人群實性證素積分比較[M(P25,P75)]Table 3 Comparison of real syndrome elements between MCI and normal cognition groups [M(P25,P75)]
表4 MCI與認知正常人群虛性證素積分比較[M(P25,P75)]Table 4 Comparison of deficiency syndrome elements between MCI and normal cognition groups [M(P25,P75)]
本研究將MCI 白睛目絡(luò)特征和有統(tǒng)計學(xué)差異的常見中醫(yī)證素特征進行信息聯(lián)合運用機器學(xué)習(xí)不同算法構(gòu)建MCI辨識模型。
3.3.1支持向量機算法 基于本算法分析,模型結(jié)果顯示:預(yù)測變量重要性排序較高的是氣滯、脾、痰、黯黃色霧漫,其次為陽亢、陰虛、心、肝、黯褐色斑、筋骨。
3.3.2決策樹C5.0 算法 基于本算法分析特征要素,模型結(jié)果顯示:預(yù)測變量重要性排序依次為痰、血瘀、黯黃色霧漫、陰虛、寒、血脈迂曲、黯粉色斑。該模型的深度為6,共有16 個節(jié)點,8 個終結(jié)點,形成對MCI 診斷的8 條路線,其中貢獻率較大的特征要素為痰。
3.3.3人工神經(jīng)網(wǎng)絡(luò)算法 基于人工神經(jīng)網(wǎng)絡(luò)算法,模型結(jié)果顯示:預(yù)測變量重要性排序較高的為氣滯、黯褐色斑、濕,其次為肝、血脈紅色、陽亢、腎、血脈迂曲、脾、氣虛。其中貢獻率較大的特征要素為氣滯。
3.3.4隨機森林算法 基于隨機森林算法,模型結(jié)果顯示:預(yù)測變量重要性特征變量為腎、陽虛、血瘀,其次為經(jīng)絡(luò)、血脈紅色、精虧、血虛、血脈迂曲、痰、血脈迂曲。其中貢獻率較大的特征要素為腎和陽虛。各個模型訓(xùn)練集和驗證集的準確率、敏感度、特異度和AUC(接受者操作特性曲線下面積)。見表5 和圖1。但4 種模型間AUC 值差異無統(tǒng)計學(xué)意義(P>0.05)。
圖1 不同機器學(xué)習(xí)算法的模型在訓(xùn)練集(左)和驗證集(右)中的ROC曲線Figure 1 ROC curves of different machine learning model in the training set (left) and testing set (right)
表5 不同機器學(xué)習(xí)算法的MCI辨識模型評估比較Table 5 Comparison of different MCI recognition machine learning algorithms
本研究基于現(xiàn)代技術(shù),運用眼健康成像儀采集MCI人群的目絡(luò)信息,探索了MCI人群的目絡(luò)特征,并結(jié)合MCI 人群中醫(yī)證素資料構(gòu)建了MCI 辨識模型,為MCI的辨識和預(yù)防提供了客觀化依據(jù)。
通過目診儀采集目絡(luò)信息,我們發(fā)現(xiàn),MCI患者紅色點、黯褐色斑、黯黃色霧漫、丘、血脈紅色、血脈迂曲出現(xiàn)頻率均高于認知正常組,相反,黯粉色斑的頻率低于認知正常組,可能是MCI 的目絡(luò)特征。這與之前學(xué)者對AD 患者的目絡(luò)特征研究的結(jié)果相似,尤其是白睛目絡(luò)形態(tài)特征的“斑”與顏色特征的“黯褐色”“粉色”[9]。我們也發(fā)現(xiàn),MCI 患者出現(xiàn)頻率較高的實性證素為痰、濕、血瘀和氣滯,虛性證素為陰虛、血虛、氣虛和陽虛,表明MCI 患病有多種證素兼雜。
進一步,我們將白睛目絡(luò)特征信息與MCI 常見中醫(yī)證素特征相互聯(lián)合,應(yīng)用4 種算法對MCI 進行辨識模型構(gòu)建。比較不同機器學(xué)習(xí)算法構(gòu)建的辨識模型,SVM 默認函數(shù)為徑向基函數(shù),是將數(shù)據(jù)映射到高維特征空間進行分類的方式,其模型特異度為0.765,其辨識準確率達到73.08%,AUC 為0.807,在4 種MCI 辨識模型中均為表現(xiàn)最佳。DT C5.0 的MCI 辨識模型評價驗證結(jié)果也較好,僅次于SVM 模型,位居第2。對于識別MCI,目絡(luò)特征中貢獻度最大的是黯黃色霧漫,其次是血脈迂曲和黯粉色斑,證候要素中貢獻最大的是病性要素痰,其次是血瘀和陰虛。我們也運用了ANN 和RT 算法進行分析,兩者的準確率只有56.41%和57.69%,特異性>0.6,但敏感性不到0.5,提示這兩類模型在本研究中漏診率偏高,整體性能較差。
5G 時代人工智能和深度學(xué)習(xí)技術(shù)的發(fā)展,為現(xiàn)代目診數(shù)字化、智能化診斷的提供了技術(shù)支持。朱會明等[29]研發(fā)了一個中醫(yī)肝病目診診斷的可穿戴智能設(shè)備和系統(tǒng),實現(xiàn)了目象信息采集、處理及診斷的客觀化;XIAO 等[30]基于深度學(xué)習(xí)技術(shù)提取目像特征,構(gòu)建了篩查肝膽疾病的眼底模型和裂隙等模型;程修平[31]運用隨機森林算法,將白睛絡(luò)脈資料、證候資料納入變量,構(gòu)建了中風(fēng)病恢復(fù)期氣虛血瘀證的智能診斷模型。而本研究中,基于MCI 患者目絡(luò)特征和中醫(yī)證素特點,構(gòu)建了4 種不同算法的模型。其中,對于MCI 的判別,支持向量機算法所構(gòu)建的模型,其準確率、敏感度和特異度均高于其他三類,為最優(yōu)辨識模型。其預(yù)測的重要證素變量集中在氣滯、痰、脾,目絡(luò)變量主要是黯黃色霧漫、黯褐色斑,也均體現(xiàn)了MCI 的中醫(yī)病性特點,可為臨床MCI辨識提供更客觀的方案。
隨著人工智能現(xiàn)代醫(yī)學(xué)的發(fā)展,目診儀器通過數(shù)字化方法收集與處理白睛信息,更好地實現(xiàn)目絡(luò)信息的客觀化、定量化。我們進一步運用數(shù)字化采集的目絡(luò)信息結(jié)合機器學(xué)習(xí)算法構(gòu)建了MCI 辨識模型,為MCI 早期辨識提供了客觀依據(jù)。但本研究尚存在不足,① 由于受地域、時間、人員等條件的限制,病例樣本規(guī)模小,未能全面探究MCI 與目絡(luò)的聯(lián)系,今后可以擴大臨床樣本量,開展多中心性的調(diào)查研究;② 本研究中MCI辨識模型是基于橫斷面研究設(shè)計的數(shù)據(jù),暫未進行外部驗證,今后該模型可進行多中心的前瞻性研究加以驗證優(yōu)化;③ 研究對象聚焦于MCI 和認知正常老年人,未來可以將研究人群擴展到癡呆人群,對不同類型的癡呆人群的目絡(luò)特征進行比較,以期對認知功能的不同階段的辨識提供客觀依據(jù)。