郝小可,李 想,閻 剛,王曉芳
(河北工業(yè)大學 人工智能與數(shù)據(jù)科學學院,天津 300401)
阿爾茨海默病(Alzheimer′s Disease,AD)是一種遲發(fā)的神經(jīng)退行性疾病。這種疾病通常見于65歲以上的人,它可以破壞患者的記憶能力和其他生理功能[1]。根據(jù)美國阿爾茨海默病協(xié)會最近的一項調(diào)查[2],AD已成為65歲以上美國老人的第五大死亡因素。目前,全球患有AD的人數(shù)達到4 700萬。隨著全球老齡化的發(fā)展,到2050年這一數(shù)字將超過1.31億。全世界每33秒就有一個新確診的AD病例。目前還沒有治療神經(jīng)退行性疾病的方法,該疾病的診斷方法依賴于患者的臨床癥狀和醫(yī)生的經(jīng)驗[3],只有當病人有明顯的癥狀時才能得到確認診斷。醫(yī)生使用臨床診斷方法診斷出來的病人往往處于疾病的晚期。因此設(shè)計一種有效早期診斷AD的方法,對病人的治療和康復(fù)至關(guān)重要。
最近的研究表明一些神經(jīng)影像技術(shù)已經(jīng)被用于輔助計算機診斷疾病[4-6],包括磁共振圖像(Magnetic Resonance Image,MRI)、擴散加權(quán)張量成像(Diffusion-weighted Tensor Imaging,DTI)和正電子發(fā)射斷層掃描(Positron Emission Tomography,PET)。在這些新技術(shù)中,結(jié)構(gòu)性磁共振成像(Structural Magnetic Resonance Imaging,SMRI)可以檢測出大腦結(jié)構(gòu)的異常[7]。例如,Lei等[5]提出了一個稀疏的自適應(yīng)學習方法用于診斷神經(jīng)退行性疾病,同時結(jié)合了局部保留投影方法和線性判別分析方法。Prashanth等[6]利用紋狀體結(jié)合率(Striatal Binding Ratio,SBR)值作為特征輸入,用于構(gòu)建診斷帕金森病(Parkinson’s disease,PD)的支持向量機(Support Vector Machine,SVM)分類器。以上研究表明,神經(jīng)影像數(shù)據(jù)可以對神經(jīng)類退化疾病的診斷提供重要幫助。
一般來說,現(xiàn)有的診斷AD的方法集中在單個圖譜上提取生物標志物。而從單一圖譜得出的特征表示無法揭示不同人群(AD患者和正常對照(Normal Control,NC))之間的群體差異,也不能全面反映測試者的全局特征,這些情況會導(dǎo)致疾病診斷產(chǎn)生偏差[8]。實際上,大腦的結(jié)構(gòu)和腦區(qū)之間的連接是復(fù)雜的,單一圖譜的圖像特征難以完全描述大腦的結(jié)構(gòu)信息。相比之下,使用多圖譜的方法可以捕捉到與疾病相關(guān)的鑒別特征和重要的結(jié)構(gòu)性信息。目前已經(jīng)有一些學者開始關(guān)注多圖譜領(lǐng)域。例如,Min等[9]從不同圖譜數(shù)據(jù)中提取到了豐富的特征信息。Liu等[10]提出了一種可以減少回歸誤差并去除測試者噪聲特征的多圖譜方法。這些研究都表明,使用多圖譜數(shù)據(jù)可以提取與疾病相關(guān)的鑒別特征,從而極大地改善分類器的性能。
目前,大多數(shù)預(yù)測疾病的模型都是用單個中心的數(shù)據(jù)進行訓(xùn)練。單一中心的數(shù)據(jù)集通常比較小,因此無法訓(xùn)練出一個準確和穩(wěn)定的疾病分類器。測試者較少的數(shù)據(jù)集由于樣本量的限制,會導(dǎo)致訓(xùn)練后的分類器過擬合[11]。此外,模型在測試數(shù)據(jù)集上進行分類的準確率往往低于在訓(xùn)練數(shù)據(jù)集上分類的準確率,這個現(xiàn)象正是由于不同域的分布差異造成的。為了解決這些問題,一種直接的方法是將不同域的數(shù)據(jù)集直接合并,但是一些研究發(fā)現(xiàn)這種做法在腦部疾病分析中會使得實驗產(chǎn)生矛盾甚至相反的結(jié)論。例如,Zhao等[12]發(fā)現(xiàn)AD患者的腦區(qū)整體連通性是低于正常人的,而Supekar等[13]卻得出了相反的結(jié)論。造成這種現(xiàn)象的原因是多種的:首先,來自不同站點的樣本具有不同的年齡和性別分布;其次,這些醫(yī)學數(shù)據(jù)來自不同站點的不同設(shè)備,設(shè)備的型號和參數(shù)設(shè)置(頭部線圈通道數(shù)和掃描時間)的不統(tǒng)一都會造成站點間樣本數(shù)據(jù)分布的差異;此外,數(shù)據(jù)預(yù)處理方法的不統(tǒng)一也會造成這個問題。但是目前大多數(shù)的腦疾病分類方法都忽略了數(shù)據(jù)集之間的異質(zhì)性問題。
為了解決不同數(shù)據(jù)集樣本特征分布差異的問題,使用多站點數(shù)據(jù)間公共信息的域自適應(yīng)方法應(yīng)運而生。該方法的目的是為了提取域之間公共的信息特征。目前域自適應(yīng)方法可以分為3種類型[14]:特征自適應(yīng)、分類器自適應(yīng)和深度自適應(yīng)。1)特征自適應(yīng)方法旨在根據(jù)兩域的特征分布構(gòu)建連接兩域樣本特征的橋梁。2)分類器自適應(yīng)方法的目的是為了獲得一個通用的分類器,該分類器對于源域和其他域的測試者都具有較好的識別性能。但是在分類器自適應(yīng)的過程中產(chǎn)生的不正確的偽標簽會極大地影響預(yù)測結(jié)果。3)深度自適應(yīng)在目標域有標簽時可以較好的工作,但是從目標域中獲取大量的標簽是一個具有挑戰(zhàn)性的任務(wù)。此外,較小的樣本規(guī)模很難訓(xùn)練出具有寬泛性的分類器。雖然跨域數(shù)據(jù)的特征分布具有差異,但是不同數(shù)據(jù)集同一類別的測試者的數(shù)據(jù)特征在空間分布上具有緊密聯(lián)系。因此,本文關(guān)注基于特征的域自適應(yīng)方法。在基于特征適應(yīng)的遷移學習領(lǐng)域,一些研究者已經(jīng)探索并取得了一些成果。例如,Gopalan等[15]在源域和目標域之間構(gòu)建了采樣測地流線來達到連接源域和目標域的目的。在此工作基礎(chǔ)上Gong等[16]對模型進行了改進,通過構(gòu)建一個內(nèi)在的低維空間結(jié)構(gòu)代替了高維投影矩陣,這個方法比原先的更加簡單。Long等[17]構(gòu)建了一個可以同時適應(yīng)條件分布和邊緣分布的模型,從而使特征有了新的表示。Jhuo等[18]提出了一個用于域適應(yīng)的低秩重構(gòu)模型,該模型將源域數(shù)據(jù)轉(zhuǎn)化為過渡狀態(tài),從而使源域數(shù)據(jù)能夠被目標域樣本所表示。
如上所述,目前在計算機輔助診斷AD的研究中仍存在一些局限性。1)目前的研究大多只考慮單一圖譜數(shù)據(jù),不能捕捉到具有鑒別性和整體結(jié)構(gòu)的特征信息。2)現(xiàn)有的方法往往忽略了不同域數(shù)據(jù)的異質(zhì)性,這可能導(dǎo)致較差的分類性能。3)基于特征重構(gòu)的域適應(yīng)只是將源域映射到一個子空間,使兩個域的數(shù)據(jù)可以相互表示,但是類信息沒有被充分地利用,這就導(dǎo)致了域之間的分布差異問題不能很好地解決。為了處理這些問題,本文提出了一種基于多圖譜的且針對類重構(gòu)的域自適應(yīng)AD分類方法。
本文提出的算法框架如圖1所示。基于遷移學習的多圖譜特征選擇算法首先使用多圖譜數(shù)據(jù)進行特征選擇,然后通過特征自適應(yīng)的方法來保留不同域之間的關(guān)聯(lián)信息,最后使用多核支持向量機進行分類。與以前的工作相比,該模型融合了來自多個圖譜的特征信息,保留與疾病相關(guān)的判別特征和整體的腦結(jié)構(gòu)信息。通過低秩矩陣優(yōu)化樣本權(quán)重同時選擇信息最豐富的特征。為了處理不同域分布差異產(chǎn)生的負面影響,模型在域適應(yīng)過程中引入了特定類別的重構(gòu)矩陣。最后在多中心阿爾茨海默病成像(Multi-Center Alzheimer’s Disease Imaging,MCADI)數(shù)據(jù)集和阿爾茨海默病神經(jīng)影像學計劃(Alzheimer′s Disease Neuroimaging Initiative,ADNI)數(shù)據(jù)集上對所提出的模型進行了評估。與其他域適應(yīng)性遷移學習方法相比,實驗結(jié)果表明本文提出的模型獲得了最佳的分類精度。
圖1 基于遷移學習的神經(jīng)影像特征選擇算法框架Fig.1 Transfer learning-based neuroimaging feature selection algorithm framework
多圖譜學習是對多個圖譜數(shù)據(jù)同時進行學習,同時根據(jù)多圖譜的樣本權(quán)重信息進行多圖譜的特征選擇。
首先,模型進行特征提取。給定樣本的M個圖譜數(shù)據(jù),即每個樣本有M種大腦腦區(qū)劃分形式,通過使用皮爾森相關(guān)系數(shù)計算任意2個腦區(qū)波形信號的相關(guān)性,然后使用一階鄰域聚合的方式進行特征表示。一階鄰域聚合的目標公式如下:
式中:O′1為第n個腦區(qū)所有連接強度之和;a1n為第1個腦區(qū)和第n個腦區(qū)之間的連接強度,將任意腦區(qū)所有連接強度之和作為該腦區(qū)的特征,最終一個樣本的特征由其對應(yīng)的O′1、O′2、…O′n組成。
接著采用基于權(quán)重誘導(dǎo)低秩學習的多圖譜特征選擇方法進行特征選擇。表示第m個圖譜的第i個樣本,由該圖譜上的每個樣本所有腦區(qū)對應(yīng)的一階鄰域聚合特征組成,yi是第i個樣本的標簽信息。最終的目標公式如下所示。
式中:N為樣本個數(shù);M為圖譜數(shù)目;βm為第m個圖譜的特征選擇向量;wm i為第m個圖譜上第i個樣本的權(quán)重,任意一個樣本權(quán)重wim都是大于0的。W∈RN×M為權(quán)重矩陣,其元素分別由不同圖譜的樣本權(quán)重構(gòu)成。λM為約束圖譜特征稀疏的正則化參數(shù),λR為約束多圖譜關(guān)聯(lián)的正則化參數(shù)。
在機器學習問題中,通常在同一個數(shù)據(jù)集上進行訓(xùn)練集和測試集的劃分。然而在現(xiàn)實世界中,由于數(shù)據(jù)集之間不滿足同分布基本假設(shè),在一個數(shù)據(jù)集上訓(xùn)練得到的分類器在其他的數(shù)據(jù)集上進行分類的準確率往往會有較大程度的下降?;谟蜃赃m應(yīng)的遷移學習的目的是為了得到適用于不同數(shù)據(jù)集的普適性分類器。本文把源域表示為XS,目標域表示為XT,源域和目標域的數(shù)據(jù)均通過1.1節(jié)中的算法進行多圖譜特征提取。由于源域和目標域的數(shù)據(jù)空間和維度不相同,研究者通常將2個域的數(shù)據(jù)映射到公共子空間中進行分布對齊。本文提出的方法將源域和目標域數(shù)據(jù)通過投影矩陣P投影到公共子空間后,通過重構(gòu)矩陣Z來實現(xiàn)2個域樣本的相互表示。接著利用標簽信息,只希望源域和目標域中相同類別的樣本之間可以實現(xiàn)相互表示,而不同類別之間的相互表示將被當作誤差。本文所提出的遷移學習的模型框架見于圖2。
圖2 遷移學習框架Fig.2 Transfer learning framework
圖2中上下兩部分代表2個域,其中源域中的深藍色圖案和目標域中的淺藍色圖案屬于同一類c1樣本,源域中的黃色圖案和目標域中的橙色圖案屬于c2類樣本。Z為重構(gòu)矩陣,其中Z的下標表示源域樣本的類別,上標表示目標域樣本的類別。在域自適應(yīng)過程中,本文希望源域中的c1類樣本可以和目標域中的c1類樣本通過重構(gòu)矩陣Z11構(gòu)建連接;源域中的c2類樣本可以和目標域中的c2類樣本通過重構(gòu)矩陣Z22構(gòu)建連接。此外,源域中的c1類樣本與目標域中的c2類樣本構(gòu)建的連接被視為誤差;同樣地,源域中的c2類樣本與目標域中的c1類樣本構(gòu)建的連接也被視為誤差。即圖中的Z12和Z21兩者表示的是2個誤差項的重構(gòu)矩陣。
依靠類別的域自適應(yīng)方法的目標函數(shù)見公式(3):
式中:PPT=I是用來得到共享投影矩陣P的非平凡解;PXSZ表示經(jīng)過投影和重構(gòu)的源域數(shù)據(jù);而代表源域的c類樣本在和目標域的該類樣本進行相互表示時產(chǎn)生的誤差;樣本類別的數(shù)目為D;‖Z‖*是核范數(shù),用來近似替代Z的低秩;為源域中的c類樣本被目標域的k類樣本表示,即該項為誤差項。
通過多圖譜特征選擇方法可以保留不同圖譜中與致病最為相關(guān)的特征,然后使用域自適應(yīng)的方法對源域和目標域的樣本進行遷移學習,從而消除不同域之間的分布差異。與傳統(tǒng)的直接混合數(shù)據(jù)集的方法不同,本文提出的多圖譜遷移學習模型能夠同時結(jié)合多圖譜和域自適應(yīng)算法來改善分類器的性能。
公式(3)的優(yōu)化是凸函數(shù)優(yōu)化問題,可以使用增廣拉格朗日函數(shù)法(Augmented Lagrangian Method,ALM)來解決。引入輔助變量J和F,式(3)可以變化為下列形式:
將公式(4)變?yōu)樵鰪V拉格朗日的形式:
式中:Y1、Y2、Y3和Y4是拉格朗日乘子,μ是懲罰項的參數(shù)且μ>0。本文通過固定其他變量來迭代優(yōu)化一個變量,在t+1(t>0)次迭代后求得解。
在t+1次迭代,通過式(6)~式(10)求解。
1)更新J:固定其他變量來更新J
2)更新F:固定其他變量來更新F
3)更新Z:固定其他變量來更新Z
4)更新P:固定其他變量來更新P
5)更新乘子以及參數(shù):
具體的迭代更新步驟見算法1。
輸1:入:源域樣本XS和目標域樣本XT初始化:添加輔助變量J和F,添加乘子以及參數(shù)2:while不收斂do 3:更新J:固定F、Z和P,公式(6)可以通過奇異值收縮法求解4:更新F:固定J、Z和P,公式(7)可以通過奇異值收縮法求解5:更新Z:固定J、F和P,公式(8)求解可得Z 6:更新P:固定J、F和Z,公式(9)求解可得P 7:更新乘子Y1、Y2和Y3 Y1=Y1+μ( )Z-F Y2=Y2+μ( )P-J Y3=Y3+μ( )PXc T-PXc SZc c Y4=Y4+μ(PXc SZc k)8:更新參數(shù)μ μ=min( )μ,μmax 9:檢查收斂性end while輸出:重構(gòu)矩陣Z和投影矩陣P
對于疾病二分類問題,通??紤]3個指標數(shù)據(jù):精度(Accuracy,ACC)、敏感度(Sensitivity,SEN)、特異性(Specificity,SPE)。這些性能指標均由模型給出的標簽預(yù)測值和真實值計算得出。為了方便計算這些性能指標,在這里引入混淆矩陣,見表1。
ACC是最為廣泛使用的性能評估指標,它指的是所有預(yù)測正確的樣本占全部樣本的比例,計算方法見公式(11):
表1 混淆矩陣Tab.1 Confusion matrix
但是在醫(yī)學應(yīng)用場景中,尤其是在數(shù)據(jù)比例不平衡的情況下,只關(guān)注預(yù)測正確的結(jié)果會產(chǎn)生一定的誤導(dǎo)性,例如把病人誤診為正常人是對測試者極大的不利。因此在實際情況下我們需要更有效的性能指標來全面地評估疾病分類結(jié)果。
SEN表示預(yù)測正確的陽性測試者占實際陽性測試者的比例,計算公式見下:
該指標越高,表示越多的陽性患者得到了確診,即漏診率越低。
SPE表示預(yù)測正確的陰性測試者占實際陰性測試者的比例。計算公式如下:
該指標越高表示越多的陰性測試者得到了正確的鑒別,即誤診率越低。
本文實驗數(shù)據(jù)來自MCADI和ADNI(http://www.loni.ucla.edu/ADNI)。ADNI標準數(shù)據(jù)集共有103個測試者,其中包含51名AD患者,52名NC。MCADI數(shù)據(jù)集包含467個測試者,其中包含252名AD患者和215名NC。MCADI數(shù)據(jù)集中每個被試均有3種圖譜數(shù)據(jù),包括Brainnetome圖譜、Power圖譜和Willard圖譜。以上所有被試的圖像都需要通過預(yù)處理才能得到相應(yīng)的信號值或者特征值。
為了驗證本文提出的多圖譜遷移學習方法的有效性,實驗采用同類文章[11,19]所使用的5折交叉驗證方法來評估本文提出算法的性能。具體來說,對于分類實驗,將每個域的樣本隨機分為5個子集,依次選擇目標域的4個子集加上整個源域作為訓(xùn)練集,剩下的1個目標域子集作為測試集。這樣保證了在交叉驗證中測試集的數(shù)據(jù)不會出現(xiàn)在訓(xùn)練集里。同時為了驗證提出方法的魯棒性,接下來交換源域和目標域。換句話說,原先作為源域的數(shù)據(jù)集作為目標域,原先當作目標域的數(shù)據(jù)集作為源域。同樣地采用5折交叉驗證方法來評估模型的魯棒性。計算5次實驗的平均精度、平均敏感度、平均特異性三個指標來評價各個方法的性能。
此外實驗中需要使用支持向量機的分類方法(Library for Support Vector Machine,LIBSVM)工具實現(xiàn)。而且所有使用支持向量機分類的方法都采用線性核,參數(shù)依照系統(tǒng)默認值進行設(shè)定。
為了驗證本文使用的多圖譜算法是否助于提高疾病分類性能,本文將提出的多圖譜算法與使用單圖譜、雙圖譜組合的特征選擇方法進行對比。為了驗證文本提出的遷移學習對于解決跨域問題的效果,本文同時使用傳統(tǒng)支持向量機的方法(即未進行遷移學習的方法,用Baseline來表示)和其他遷移學習模型與本文提出的方法進行比較。
圖3和圖4是文中提出的方法在單圖譜和雙圖譜上實驗結(jié)果的對比,其中單圖譜包括Brainnetome圖譜、Power圖譜和Willard圖譜。雙圖譜方法為3個圖譜排列組合構(gòu)成的3個雙圖譜。最后為本文提出的3個圖譜均使用的多圖譜特征選擇算法。
圖3 不同圖譜ADNI到MCADI的遷移結(jié)果Fig.3 Transfer results of different templates from ADNI to MCADI
圖4 不同圖譜MCADI到ADNI的遷移結(jié)果Fig.4 Transfer results of different templates from MCADI to ADNI
表2和表3展示了本文提出的方法與傳統(tǒng)機器學習方法以及其他遷移學習方法的實驗結(jié)果對比?;鶞史椒ǎ˙aseline)是傳統(tǒng)的支持向量機分類方法,也即未進行域自適應(yīng)的方法。Geodesic flow kernel(GFK)[16]首先在源域和目標域之間構(gòu)建一條測地線,通過測地線中集成的無數(shù)個子空間來一步步實現(xiàn)消除域間差異。Joint distribution adaptation(JDA)[17]通過同時調(diào)整源域和目標域的條件分布和邊緣分布來實現(xiàn)聯(lián)合分布的自適應(yīng)。Label disentangled analysis(LDA)[19]是一種無監(jiān)督自適應(yīng)方法,該方法不是從標簽層面來進行特征分布的對齊,而是去除部分標簽信息但保留域間共享的標簽信息,然后交叉對齊特征和標簽進行數(shù)據(jù)的分類。表中的所有實驗數(shù)據(jù)都是經(jīng)過5折交叉驗證取平均值后得到的。
表2 ADNI向MCADI遷移不同方法結(jié)果對比Tab.2 Result of different methods from ADNI to MCADI
表3 MCADI向ADNI遷移不同方法結(jié)果對比Tab.3 Result of different methods from MCADI to ADNI
圖3和圖4展示了不同圖譜數(shù)量組合,本文提出的基于遷移學習的多圖譜特征選擇算法用于AD分類的結(jié)果。圖3中的實驗將MCADI數(shù)據(jù)集作為源域,ADNI數(shù)據(jù)集作為目標域。圖4中的其他實驗條件和圖3設(shè)置相同,不同之處在于把ADNI數(shù)據(jù)集作為源域,把MCADI數(shù)據(jù)集作為目標域。
從圖3和圖4的實驗結(jié)果來看,使用雙圖譜的結(jié)果均優(yōu)于使用單一圖譜的結(jié)果,而使用全部圖譜數(shù)據(jù)的算法性能最優(yōu)。
表2和表3展示了不同的遷移學習方法在該數(shù)據(jù)集上的實驗結(jié)果,2個表的實驗設(shè)置差別體現(xiàn)在源域和目標域選擇的不同。
從表2和表3中可以看到,不論是哪一種遷移方向,本文提出的方法的準確率是最高的,同時該方法的敏感度和特異性均是最高的,說明該方法對于AD具有較低的誤診率和漏診率。此外所有使用遷移學習方法的準確率均高于Baseline方法,這證明了遷移學習有助于解決跨域分類問題。
為了進一步驗證本文提出的依靠類別進行域自適應(yīng)的算法有助于減少域之間的分布差異,針對是否利用類信息開展消融實驗。具體來說,在公共子空間進行特征對齊時,不僅是同類樣本之間進行特征對齊,不同類樣本之間也會進行該步驟。同樣地,該方法也進行了2組實驗,表4展示了該方法在跨域數(shù)據(jù)集上的實驗結(jié)果。
從表4可以看出,在域自適應(yīng)過程中去除類信息后,2組實驗的準確率在80.00%附近。將該實驗結(jié)果對比表2和表3中的實驗結(jié)果發(fā)現(xiàn),未利用標簽信息進行域自適應(yīng)的算法準確率相比本文提出的算法準確率有著較大幅度下降。這表明了本文提出的依靠類別進行域自適應(yīng)的算法有助于減少域之間的分布差異。
為了驗證不同圖譜對病變腦區(qū)的敏感程度不同,將1.1節(jié)中的多圖譜特征選擇算法用于探究不同圖譜下患者大腦異常腦區(qū)。
在圖5中,展示了3個圖譜在不同平面上的致病腦區(qū)分布,其中每一列對應(yīng)一個圖譜,3個圖譜分別為Brainnetome圖譜、Power圖譜和Willard圖譜。由圖5可以看出,從每個圖譜中獲得的感興趣腦區(qū)位置在大腦各個平面中并不完全一致,這表明不同圖譜對病變腦區(qū)的敏感程度不同,這也表明了使用多圖譜數(shù)據(jù)的必要性。
圖5 3個圖譜在不同平面的大腦節(jié)點分布圖Fig.5 The distribution of brain nodes on different planes of the three templates
表4 消融實驗結(jié)果Tab.4 Results of ablation experiments
為了充分利用多圖譜數(shù)據(jù)間豐富的互補信息,本文提出了一種基于遷移學習的多圖譜特征選擇算法,使用樣本權(quán)重指導(dǎo)圖譜數(shù)據(jù)進行特征選擇。將進行特征選擇后的數(shù)據(jù)開展遷移學習,將源域和目標域數(shù)據(jù)投影到公共子空間中使得源域和目標域的樣本可以通過重構(gòu)矩陣進行表示,此過程僅需要兩域中同類別的樣本進行遷移而不同類別之間的表示被視為誤差。最后的分類實驗結(jié)果證實了該算法的有效性。
今后的研究將從以下2個方面開展:1)本文只采用了2個域之間的遷移學習,而在臨床上還存在其他的AD數(shù)據(jù)可以使用,可以考慮多個域數(shù)據(jù)同時進行遷移。2)數(shù)據(jù)集樣本量不平衡時會對遷移效果產(chǎn)生影響,樣本量較小的數(shù)據(jù)集在進行遷移時效果不穩(wěn)定,針對這類情況該模型仍有改進的空間。