汪錢榮,陳文鈺,趙為華
(南通大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,江蘇 南通 226019)
分類方法是統(tǒng)計(jì)學(xué)和數(shù)據(jù)科學(xué)的重要研究內(nèi)容,分類的目的是通過給定的類別和訓(xùn)練數(shù)據(jù)學(xué)會(huì)分類規(guī)則和構(gòu)建分類器,進(jìn)而用于未知數(shù)據(jù)的預(yù)測,其輸出結(jié)果是離散的類別值。如何應(yīng)用數(shù)據(jù)挖掘方法對海量高維數(shù)據(jù)進(jìn)行分析以發(fā)現(xiàn)潛在的數(shù)據(jù)模式,使得管理者能夠更加科學(xué)有效地進(jìn)行決策,減小行動(dòng)風(fēng)險(xiǎn),已成為管理決策中的重要研究內(nèi)容。在互聯(lián)網(wǎng)金融數(shù)據(jù)[1]、網(wǎng)絡(luò)電子消費(fèi)數(shù)據(jù)、圖像與視頻數(shù)據(jù)[2]、醫(yī)療診斷與基因序列[3]分析中,數(shù)據(jù)經(jīng)常以矩陣或高階張量形式呈現(xiàn)。使用矩陣或高階張量直接表達(dá)數(shù)據(jù)可以保留數(shù)據(jù)元素之間的結(jié)構(gòu)信息[4],即數(shù)據(jù)相互間的內(nèi)在關(guān)聯(lián)結(jié)構(gòu),且具有良好的計(jì)算特性和分析表達(dá)能力,特別是在高維度小樣本數(shù)據(jù)上尤為適用。本文關(guān)注矩陣數(shù)據(jù)的分類預(yù)測問題。
常用的分類方法有線性判別分析(LDA)、Logistic 回歸和支持向量機(jī)分類方法。線性判別分析最初是為了解決向量數(shù)據(jù)的特征提取問題,由Fisher在1936年開創(chuàng)性地提出了保證兩類樣本被有效識別的方法,通過最大化類間散點(diǎn)距離與類內(nèi)散點(diǎn)距離的比值實(shí)現(xiàn)。通過假定不同類別數(shù)據(jù)服從具有不同數(shù)字特征的同一類分布,并引入數(shù)據(jù)的先驗(yàn)知識建立分類規(guī)則,線性判別分析也可以很好地處理多分類數(shù)據(jù);Logistic 回歸直接對分類的概率進(jìn)行建模,根據(jù)回歸模型估計(jì)獲得分類決策函數(shù);支持向量機(jī)基于最大距離間隔超平面進(jìn)行建模,并基于二次凸優(yōu)化方法獲得決策平面。然而已有的主要分類工作都是基于向量化方法進(jìn)行的,當(dāng)數(shù)據(jù)以矩陣(張量)呈現(xiàn)時(shí),直接基于矩陣(張量數(shù)據(jù))用向量化方法進(jìn)行建模分析會(huì)導(dǎo)致擬合參數(shù)過多,出現(xiàn)過擬合現(xiàn)象,使估計(jì)精度和預(yù)測分析效果不佳等。
在處理多指標(biāo)面板數(shù)據(jù)、衛(wèi)星圖像數(shù)據(jù)、腦電信號圖像數(shù)據(jù)分析和分類問題時(shí),數(shù)據(jù)自然地表示成三階張量或矩陣數(shù)據(jù)(灰度圖像),以往的工作絕大部分是先對數(shù)據(jù)進(jìn)行向量化,然后應(yīng)用判別分析方法進(jìn)行分類預(yù)測[5—7]。將矩陣或張量數(shù)據(jù)向量化以后不僅破壞了原有數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)性,而且使得參數(shù)的維數(shù)很大,特別是在假定向量化數(shù)據(jù)服從多元正態(tài)分布時(shí),其協(xié)方差的參數(shù)個(gè)數(shù)特別多,會(huì)導(dǎo)致分類識別的準(zhǔn)確率很低。隨著數(shù)據(jù)分析技術(shù)的進(jìn)步和算法算力的提高,目前最流行的一種適用于矩陣數(shù)據(jù)的方法就是直接構(gòu)建矩陣數(shù)據(jù)的分布模型。對于單個(gè)類別數(shù)據(jù)不均勻的情況,Viroli(2011)[8]將Hastie和Tibshirani(1996)[9]提出的混合判別分析模型拓展至矩陣正態(tài)分布,該模型基于觀測矩陣聚類,用于解決有監(jiān)督和無監(jiān)督的矩陣數(shù)據(jù)分類問題。Thompson 等(2020)[10]使用矩陣變量t 分布建模,并提出了一種期望最大化算法求解模型。然而在現(xiàn)實(shí)世界中,對于圖像等存儲(chǔ)結(jié)構(gòu)性信息的矩陣數(shù)據(jù),數(shù)據(jù)之間不僅具有相關(guān)性,而且經(jīng)常表現(xiàn)出低秩特性??紤]數(shù)據(jù)之間的低秩特性有利于提高估計(jì)的精度和分類的準(zhǔn)確率。
本文在矩陣正態(tài)分布假設(shè)下,結(jié)合矩陣的奇異值分解,引入目標(biāo)矩陣的低秩估計(jì)方法,在有監(jiān)督學(xué)習(xí)環(huán)境中解決分類問題。具體地說,本文通過奇異值的正則化來獲得矩陣低秩近似,通過最大化似然函數(shù)來探索數(shù)據(jù)樣本之間的關(guān)系,進(jìn)而獲取模型的參數(shù)估計(jì)。將塊坐標(biāo)下降法和增廣拉格朗日乘子法[11]相結(jié)合,提出了一種求解上述方法的聯(lián)合優(yōu)化方案,并能自動(dòng)獲得秩的估計(jì)。進(jìn)一步結(jié)合線性判別分析方法,獲得矩陣數(shù)據(jù)下的判別規(guī)則。
本文主要研究矩陣正態(tài)分布的自適應(yīng)低秩估計(jì)方法及其在預(yù)測分類中的應(yīng)用。向量可以看成張量的一維形式,矩陣是二階張量,三階以上的多維數(shù)組一般稱為張量。為具有擴(kuò)展性,本文先給出張量正態(tài)分布的定義。
注意到上面定義的張量正態(tài)分布滿足cov[v ec(X)]=ΣJ?…?Σ1,此時(shí)稱隨機(jī)張量X∈?p1×…×pJ具有可分離的協(xié)方差結(jié)構(gòu)。Kronecker可分性能夠大大減少估計(jì)協(xié)方差矩陣所需的自由度數(shù)量。例如,對于隨機(jī)張量X,如果vec(X)服從多元正態(tài)分布,那么協(xié)方差矩陣的自由度為;而如果vec(X)服從張量正態(tài)分布,那么協(xié)方差矩陣的自由度減少為
當(dāng)J=2 時(shí),隨機(jī)矩陣X∈?p1×p2服從矩陣正態(tài)分布,其密度函數(shù)為:
該分布記作Np1,p2(X,Σ1,Σ2)。此時(shí),cov[v ec(X)]=Σ2?Σ1,為使得模型具有識別性,一般假定協(xié)方差陣(Σ1)11=1。
矩陣正態(tài)分布的統(tǒng)計(jì)推斷通常通過似然函數(shù)進(jìn)行。假設(shè)有n個(gè)獨(dú)立的觀測數(shù)據(jù),記參數(shù)為Θ={M,Σ1,Σ2},由式(1)可得到Θ的對數(shù)似然函數(shù)為:
求導(dǎo)后有如下的極大似然估計(jì):
顯然上述協(xié)方差矩陣的極大似然估計(jì)沒有封閉解,Σ1和Σ2之間相互依賴,但可以基于任意正定矩陣(默認(rèn)情況下使用單位矩陣)通過初始化相互交替迭代獲得估計(jì)。在很一般的正則條件下[14(]即對一些正常數(shù)C1、C2,滿 足,可以證明協(xié)方差估計(jì)的相合性:
可以證明均值估計(jì)的漸近正態(tài)性:
假設(shè)矩陣數(shù)據(jù)Xi服從前文的矩陣正態(tài)分布,則Xi亦可寫成如下形式:
其中,Xi是p1×p2的觀測矩陣,M是待估計(jì)的p1×p2的真實(shí)矩陣,Ei是服從矩陣正態(tài)分布Np1,p2(0,Σ1,Σ2)的p1×p2隨機(jī)誤差矩陣。假設(shè)M有如下的奇異值分解:
其中,ur和vr均為單位正交向量,“?”表示向量之間的外積,w1>w2>…≥wmin{p1,p2}≥0 是一列取值下降的奇異值。為減少待估參數(shù)的個(gè)數(shù)進(jìn)而提高預(yù)測推斷能力,假設(shè)M能被少數(shù)前R個(gè)奇異值分解表達(dá),即:
本文將結(jié)合罰函數(shù)方法研究如何獲得低秩估計(jì)。對奇異值向量施加懲罰并通過選取合適的懲罰參數(shù)來縮減奇異值較小的值,進(jìn)而自動(dòng)獲得秩R的最優(yōu)估計(jì)。令w=(w1,…,wR)T,基于上述討論,本文提出如下目標(biāo)函數(shù):
給定Σ1和Σ2,上式關(guān)于參數(shù)M的估計(jì)轉(zhuǎn)化為求解w、U、V的優(yōu)化問題,目標(biāo)函數(shù)如下:
為有效快速地求解式(3),本文基于塊坐標(biāo)下降法獲得易于實(shí)施的估計(jì)算法。
本文使用交替更新方法依次更新ur、vr和wr。對ur,應(yīng)用增廣拉格朗日乘子ADMM 算法可將約束問題式(4)轉(zhuǎn)化為無約束極小問題:
類似地,更新參數(shù)vr,其增廣拉格朗日函數(shù)為:
按照規(guī)則式(6)迭代更新上式參數(shù)和拉格朗日乘子直至收斂。
更新wr,式(4)中與參數(shù)wr有關(guān)的函數(shù)項(xiàng)為:
對上式求偏導(dǎo)并令偏導(dǎo)數(shù)等于零,可以得到:
本文引入軟閾值算法[15]來更新wr,令:
不斷交替迭代式(5)至式(7),直至達(dá)到預(yù)定的估計(jì)誤差精度(ε=10-5)時(shí)停止迭代,得到最終的估計(jì)。使用上述的罰函數(shù)方法能自動(dòng)得到秩的估計(jì),即=‖‖0,其中‖·‖0表示L0范數(shù)。上述模型的初始化和停止規(guī)則設(shè)置為:使用樣本均值初始化均值矩陣M,協(xié)方差矩陣Σ1、Σ2和矩陣U、V初始為單位陣,奇異向量w為全1向量。若滿足相對誤差,則ADMM算法終止。
由于模型的低秩結(jié)果依賴于正則化參數(shù)λ的選取,因此λ過大或是過小都會(huì)影響秩估計(jì)。本文基于貝葉斯信息準(zhǔn)則(BIC,Bayesian Information Criterion)來進(jìn)行模型選擇:
其中,lnL為對數(shù)似然函數(shù)值。最佳的正則化參數(shù)定義為=arg minλBIC(λ)。后文的數(shù)值模擬經(jīng)驗(yàn)表明BIC準(zhǔn)則選擇效果很好。在一定的條件下,也可以證明秩選擇具有相合性,即P(=R0)→1。
注意到,式(2)中低秩表達(dá)在張量情形下就是張量的CP 分解[16],即對于一個(gè)J階張量X∈?p1×…×pJ,其CP 分解定義為:
利用上式,能很容易將本文提出的估計(jì)算法推廣至張量數(shù)據(jù)情形。本文不再贅述。
判別分析是一種常用的分類方法。假設(shè)觀測值有K(K≥2)類,令πk表示一個(gè)隨機(jī)選擇的來自第k類的觀測值,即第k類的先驗(yàn),令fk(X)=P(X|y=k)表示來自第k類的觀測值的密度函數(shù)。由貝葉斯公式可以得到X屬于第k類的后驗(yàn)概率pk(X)=P(y=k|X)。令lkj表示將第j類樣本誤分為第k類樣本的損失,基于后驗(yàn)概率可以得到將樣本分類為第k類的期望損失(即條件風(fēng)險(xiǎn)),貝葉斯判定準(zhǔn)則要求最小化條件風(fēng)險(xiǎn)。在0-1 損失的前提下,Rk(X)=1-pk(X),于是,最小化誤分類概率的貝葉斯分類器將X分配給后驗(yàn)概率最高的類:
通常取對數(shù)運(yùn)算arg maxklnpk(X)=arg maxkln πk fk(X)。值得注意的是,如果πk=1/K,那么極大化后驗(yàn)分布式就等價(jià)于極大化似然函數(shù)。
本文假定不同類別數(shù)據(jù)服從具有不同的均值和相同協(xié)方差的矩陣正態(tài)分布,貝葉斯決策規(guī)則將X分派給第k組,其中:
特別地,當(dāng)考慮二分類問題時(shí),可以得到兩個(gè)類別的決策平面方程為:
當(dāng)式(9)>0 時(shí),將之判別為第二類;否則判別成第一類。實(shí)踐中,基于訓(xùn)練樣本使用提出的方法可估計(jì)得出式(8)和式(9)中的參數(shù)。假設(shè)Dk為訓(xùn)練樣本D中第k類樣本組成的集合,n為樣本總數(shù),nk表示第k類樣本的個(gè)數(shù),那么參數(shù)Mk的極大似然估計(jì)可以通過式(3)在集合Dk上求解,參數(shù)Σ1和Σ2的極大似然估計(jì)分別為:
本文通過大量的數(shù)值模擬來驗(yàn)證低秩模型的有效性。模擬數(shù)據(jù)由以下模型生成:
其中:每個(gè)分量ur∈?p1、vr∈?p2互相獨(dú)立,每個(gè)元素先從標(biāo)準(zhǔn)正態(tài)分布中產(chǎn)生,然后進(jìn)行正交化;wr是從1到100 內(nèi)進(jìn)行隨機(jī)抽樣的值,設(shè)真實(shí)的秩R=5;Ei是隨機(jī)誤差矩陣,Ei~Np1,p2(0,Σ1,Σ2)。
對于矩陣Xi的維度,考慮三種情形:(Ⅰ)(p1,p2)=(8,10);(Ⅱ)(p1,p2)=(20,15) ;(Ⅲ)(p1,p2)=(30,20) 。設(shè)定協(xié)方差陣Σi(i=1,2)為滿足非對角元素為0.2 的標(biāo)準(zhǔn)的復(fù)合對稱協(xié)方差陣。
為衡量模型估計(jì)的精確性,本文使用均方根誤差(Root Mean Square Error,RMSE)來衡量估計(jì)值與真值之間的偏差:
本文報(bào)告樣本容量分別為n=100,200,300時(shí)100次模擬的平均結(jié)果,結(jié)果見表1??梢钥闯?,在同一變量維數(shù)下,隨著樣本容量的增加,RMSE越來越小,說明參數(shù)的估計(jì)精度隨樣本量的增加不斷提高;隨著變量維數(shù)的增加,增大樣本容量依然有不俗的表現(xiàn)。對于矩陣的秩估計(jì),本文統(tǒng)計(jì)了100 次模擬中正確估計(jì)的概率,在不同樣本容量、不同矩陣規(guī)格下模型均能準(zhǔn)確識別秩。在生成樣本數(shù)據(jù)的同時(shí),生成相同容量的獨(dú)立同分布的數(shù)據(jù)以供測試使用,表2 報(bào)告了低秩模型的預(yù)測能力,即比較擬合的均值矩陣與測試數(shù)據(jù)之間的誤差,并將其與非低秩模型進(jìn)行對比。結(jié)果表明,本文所提低秩模型的預(yù)測精度更高,模型在高維情況下仍然保持穩(wěn)定的預(yù)測精度。
表1 模擬1中參數(shù)估計(jì)的RMSE和秩選擇的正確率
表2 模擬1中測試集RMSE預(yù)測情況
以二分類問題為例,隨機(jī)生成A、B兩類數(shù)據(jù),分別服從矩陣正態(tài)分布Np1,p2(MA,Σ1A,Σ2A)和Np1,p2(MB,Σ1B,Σ2B),協(xié)方差陣的設(shè)置與前文類似。同樣地,考慮三種不同維數(shù)情 形:(Ⅰ)(p1,p2)=(8,10);(Ⅱ)(p1,p2)=(20,15) ;(Ⅲ)(p1,p2)=(30,20)。
為衡量分類模型準(zhǔn)確性,本文報(bào)告兩個(gè)重要指標(biāo):誤分類率和綜合評價(jià)指標(biāo)F-Score。誤分類率表示錯(cuò)誤分類的樣本比例。F-Score 是精確率(Precision)和召回率(Recall)的加權(quán)調(diào)和平均,精確率是針對預(yù)測結(jié)果而言的,表示在所有被預(yù)測為A(或B)類的樣本中實(shí)際為A(或B)類樣本的概率;召回率則是針對原樣本而言的,表示在實(shí)際為A(或B)類的樣本被預(yù)測為A(或B)類樣本的概率。F-Score定義為:
選取α=1 時(shí)的F1值,當(dāng)F1較高時(shí)說明模型性能較好。
下頁表3報(bào)告了線性判別分析的相關(guān)分類情況,考察了兩類樣本容量分別為n=100,200,300 時(shí)的分類性能,對應(yīng)各自類別生成了50個(gè)獨(dú)立同分布的測試數(shù)據(jù)進(jìn)行驗(yàn)證。將CP 低秩分解模型與非低秩模型和Logistic 回歸模型進(jìn)行對比,結(jié)果表明,低秩模型能夠降低誤分類率,并且分類性能隨著樣本量的增加而提高,因?yàn)樵谒械哪P驮O(shè)置中,當(dāng)樣本量n增加時(shí)分類錯(cuò)誤率降低。兩類數(shù)據(jù)低秩模型的F1值均大于其他模型,這說明低秩模型是有效的。同時(shí),本文所提的方法明顯優(yōu)于使用Logistic 回歸模型的分類預(yù)測方法。
表3 模擬2中分類預(yù)測情況
本文將低秩模型作為判別分析的工具用于兩個(gè)實(shí)際問題中。
土地利用規(guī)劃是與當(dāng)今人類生產(chǎn)和發(fā)展休戚與共的熱點(diǎn)問題,研究土地利用的動(dòng)態(tài)變化,例如城鎮(zhèn)建設(shè)用地變化、耕地利用情況、草原保護(hù)和草地資源可持續(xù)利用狀況等具有重要意義。土地利用現(xiàn)狀檢測主要運(yùn)用GIS、遙感及現(xiàn)代科學(xué)技術(shù),掌握土地的利用及變化情況,可以為各級政府決策提供準(zhǔn)確及時(shí)的土地?cái)?shù)據(jù)。其中,陸地資源衛(wèi)星影像數(shù)據(jù)是土地利用調(diào)查中最常用的數(shù)據(jù),而采用遙感技術(shù)的多光譜衛(wèi)星圖像允許在一個(gè)空間網(wǎng)格上進(jìn)行多次觀測,從而產(chǎn)生了矩陣觀測值。
本文數(shù)據(jù)集來自UCI機(jī)器學(xué)習(xí)存儲(chǔ)庫主頁,原始陸地資源衛(wèi)星數(shù)據(jù)是由澳大利亞遙感中心從美國宇航局購買的數(shù)據(jù)生成的。該數(shù)據(jù)集由不同光譜波段的4 幅相同場景的數(shù)字圖像組成,其中兩個(gè)在可見區(qū)域(對應(yīng)于可見光譜中的綠色和紅色區(qū)域),兩個(gè)在(近)紅外區(qū)域。衛(wèi)星圖像數(shù)據(jù)由3×3 平方鄰域表示,數(shù)據(jù)集的每一行包含該3×3 區(qū)域內(nèi)每9 個(gè)像素在4個(gè)光譜波段中的像素值,以及一個(gè)代碼數(shù)字(表示中心像素的分類標(biāo)簽)。本文選擇具有較高相似性的兩個(gè)類別:潮濕的灰土(代碼4)和帶植被茬的土壤(代碼5)的圖像。UCI 網(wǎng)站提供了包括訓(xùn)練集(415、470)和測試集(211、237)的數(shù)據(jù)案例。本文對數(shù)據(jù)集進(jìn)行預(yù)處理,將每行數(shù)據(jù)構(gòu)建為一個(gè)維數(shù)為4×9 的矩陣。先驗(yàn)概率為訓(xùn)練集中各類別所占的比例,利用R軟件包MixMatrix 將類別建模為矩陣正態(tài)分布進(jìn)行分類,其誤分類率為0.1004。本文考慮低秩假定的矩陣正態(tài)分布模型,得到的誤分類率為0.0893,施加復(fù)合對稱協(xié)方差結(jié)構(gòu)得到的誤分類率降低至0.0670,此時(shí)估計(jì)的矩陣秩為2。本文進(jìn)一步分析了兩個(gè)分類器具體的預(yù)測結(jié)果(見表4),低秩模型對于兩類土地類型的識別性能均有提高。同時(shí),本文繪制了ROC 曲線(見圖1),可以明顯看出,曲線面積接近于1,說明分類器具有較強(qiáng)的識別能力,且考慮低秩的分類能力更優(yōu)良。
圖1 衛(wèi)星圖像數(shù)據(jù)的ROC曲線
表4 衛(wèi)星圖像數(shù)據(jù)分類結(jié)果
該數(shù)據(jù)集由意大利布雷西亞的Tactile 公司(http://www.tattile.it)創(chuàng)建,并于1994 年捐贈(zèng)給意大利羅馬塞梅恩傳播科學(xué)研究中心(http://www.semeion.it)用于機(jī)器學(xué)習(xí)研究。該數(shù)據(jù)集掃描了大約80 人的1593 個(gè)手寫數(shù)字,將其放在一個(gè)16×16 的矩形框中,灰度值為256;然后使用固定閾值將每個(gè)圖像的每個(gè)像素縮放為布爾(1/0)值。要求每個(gè)人在紙上寫下0到9的所有數(shù)字并寫兩次,第一次以正常的方式寫下數(shù)字(確保精確性),第二次則快速寫下數(shù)字(沒有精確度)。考慮到3、5 和8 具有較高的相似度,本文的目標(biāo)是從測試集中識別出這3 個(gè)數(shù)字。對數(shù)據(jù)進(jìn)行預(yù)處理,使用16×16 大小的矩陣存儲(chǔ)每個(gè)手寫數(shù)字?jǐn)?shù)據(jù),得到共473 例(其中數(shù)字3 和5 均有159例,數(shù)字8 有155 例)數(shù)據(jù)。由于數(shù)據(jù)集未劃分訓(xùn)練集和測試集,故采用5 折交叉驗(yàn)證法劃分?jǐn)?shù)據(jù)集:每次選取4個(gè)子樣本作為訓(xùn)練集,1 個(gè)子樣本用作測試,共重復(fù)5 次實(shí)驗(yàn)。將每個(gè)類的條件概率密度近似為一個(gè)矩陣正態(tài)分布,最小化訓(xùn)練集中的誤分類率,表5 報(bào)告了平均結(jié)果,無論是從誤分類率還是從AUC 值來看,低秩模型分類效果均更好。下頁表6報(bào)告了5次實(shí)驗(yàn)的秩估計(jì)結(jié)果,對于矩陣情形為16×16 的訓(xùn)練數(shù)據(jù),低秩模型使用較小的秩,獲取了手寫數(shù)字圖像的大部分信息,并在測試集上表現(xiàn)出不錯(cuò)的分類性能。
表5 交叉驗(yàn)證平均結(jié)果
表6 秩估計(jì)結(jié)果
本文主要研究了基于矩陣(張量)正態(tài)分布的低秩張量分解模型,給出了基于低秩分解方法的模型參數(shù)估計(jì)方法,并將其作為估計(jì)類概率密度的工具應(yīng)用于判別分析中。模擬研究說明了低秩分解模型的有效性,在模擬的兩類數(shù)據(jù)下與非低秩模型和Logistic回歸模型進(jìn)行了對比分析,實(shí)例數(shù)據(jù)分析進(jìn)一步驗(yàn)證了低秩模型在分類預(yù)測性能上表現(xiàn)更好。盡管本文是在矩陣數(shù)據(jù)情形下討論的估計(jì)算法,但是很容易將方法應(yīng)用于張量數(shù)據(jù)的分類研究中。當(dāng)數(shù)據(jù)中進(jìn)一步含有協(xié)變量信息時(shí),可以進(jìn)一步研究矩陣回歸建模的低秩估計(jì)及其分類方法。此外,當(dāng)數(shù)據(jù)中含有異常值時(shí),可進(jìn)一步研究基于矩陣或張量t分布的低秩估計(jì)及其分類和聚類方法[10,17]。