董娜 趙麗 常建芳 吳愛國
摘? ?要:為了提高宮頸細胞識別速度,以最少的特征數(shù)量獲得最高的識別準確率,運用分類與回歸樹算法(Classification and Regression Trees,CART)進行特征的選擇,并采用粒子群算法(Particle Swarm Optimization,PSO)對分類器支持向量機(Support Vector Machine,SVM)進行優(yōu)化,形成了PSO-SVM分類算法對細胞進行分類. 使用Herlev數(shù)據(jù)集對文中提出的算法進行驗證. 通過CART特征選擇方法,成功地從20個特征中提取出9個更具代表性的特征,并且二分類和七分類的準確率均達到99%以上. 并引入其他幾種宮頸癌細胞的分類識別算法進行仿真比較,結(jié)果表明,本文算法在特征數(shù)目較少的情況下識別準確率依然具有明顯優(yōu)勢,從而驗證了該算法的有效性. 所述方法有效降低了人工特征選擇的難度,在減少了識別用時的情況下,依然保證了細胞的識別準確率與之前幾乎無異,為宮頸癌疾病診斷提供了一套有效的方法框架.
關(guān)鍵詞:特征提取;特征選擇;CART;PSO-SVM;宮頸細胞檢測
中圖分類號:TP18? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標志碼:A
Research on Feature Selection and Classification
Recognition Algorithm of Cervical Cell Image
DONG Na?,ZHAO Li,CHANG Jianfang,WU Aiguo
(School of Electrical Automation and Information Engineering,Tianjin University,Tianjin 300072,China)
Abstract:In order to improve the recognition speed of cervical cell and obtain the highest recognition accuracy with the least number of features,this paper innovatively uses the Classification and Regression Trees(CART) algorithm to select features,and then the Particle Swarm Optimization(PSO) algorithm is used to optimize the Support Vector Machine(SVM). Therefore,the PSO-SVM classification algorithm is formed to classify the cells. This paper uses the Herlev dataset to verify the validity of the proposed algorithm. Through the CART feature selection method,9 representative features are successfully extracted from 20 features,and the accuracy of two classifications and seven classifications are above 99%. Further,this paper introduces several other classification and recognition algorithms of cervical cancer cells for simulation comparison. It can be founds that the recognition accuracy of this algorithm is obviously superior when the number of features is small,which indicates that the proposed algorithm is effective. The method effectively reduces the difficulty of artificial feature selection,and ensures that the recognition accuracy of the cells is almost the same as before when the recognition time is reduced. Thus,the proposed algorithm provides an effective method for the diagnosis of cervical cancer diseases.
Key words:feature extraction;feature selection;CART;PSO-SVM;cervical cell detection
根據(jù)全球的病理報告顯示,宮頸癌的發(fā)病率逐年增加,每年的新增患者達到50多萬. 一些發(fā)達國家定期對婦女進行宮頸篩查,有效地降低了宮頸癌的發(fā)病率[1].目前最傳統(tǒng)的方法是通過人工閱片檢查是否患有宮頸癌,然而這種方法識別效率低,準確率不高. 即使使用圖像處理的方法對宮頸細胞進行識別,也需要提取大量的細胞特征,冗余的特征不僅會造成識別速度緩慢,也容易對識別效果產(chǎn)生影響.
分割是細胞識別的基礎(chǔ),根據(jù)分割結(jié)果可以提取細胞的各類特征. 癌變細胞與正常細胞在顏色、形態(tài)等方面具有很大差異,細胞病理學(xué)專家就是通過觀察細胞的顏色、形狀、大小等特征對細胞進行判定.
細胞的特征主要是依據(jù)細胞病理學(xué)專家的診斷經(jīng)驗來提取的. 因此,選擇的細胞特征,既要滿足醫(yī)師的診斷經(jīng)驗,又要以計算機理解的方式輸入. 文獻[2]對宮頸細胞特征提取進行了詳細的分析,提取了87個細胞特征. 并非所有特征都是有效特征,特征數(shù)量過多或過少,對分類精度都有影響,因此,選出最有用的特征,以最少的特征獲得最高的準確率才是關(guān)鍵[3].
宮頸細胞圖像識別的最終目的是判定該細胞是否為癌細胞,經(jīng)過分類器的訓(xùn)練,可以準確地將細胞分為正常細胞和癌細胞. 盡管現(xiàn)有分類器種類較多,但是SVM因操作簡單,分類準確率高而受到廣大學(xué)者關(guān)注.
為了緩解高維細胞特征導(dǎo)致的欠擬合,并提高宮頸細胞診斷的效率和準確率,本文提出了一種基于CART特征選擇的宮頸細胞分類方法. 首先提取宮頸細胞的顏色特征、形態(tài)特征和紋理特征共20個特征,然后進行特征選擇,選定9個特征進行訓(xùn)練,最后將SVM與 PSO算法結(jié)合起來,形成PSO-SVM分類器,從而實現(xiàn)宮頸細胞的正確分類.
1? ?宮頸細胞的特征提取
特征提取是從細胞圖片中尋找有效的特征. 樣本差異越明顯,則有效特征的差異越明顯. 有些特征可以通過肉眼觀察,如顏色、大小等,有些則需要進行一定的變換,如直方圖、紋理等. 一般情況下主要從以下3個方面提取特征:
1)顏色特征. 主要指細胞核或細胞質(zhì)的顏色. 細胞在染色之后,細胞核和細胞質(zhì)會變成不同的顏色,因此更便于觀察. 一般情況下顏色特征的提取主要是基于RGB 顏色[4-5].此外,HSI 顏色空間也應(yīng)用相對廣泛[6-8]. RGB顏色特征主要是提取Red、Green、Blue 3個顏色空間上的數(shù)值特征,如均值、方差、能量,熵等.
2)形態(tài)特征. 此特征的參數(shù)提取種類較多,
Jantzen等[9]對宮頸細胞進行仔細地觀察后,提出20個特征,其中包括面積、周長[10-11]以及圓形度等. 此外,其他特征用來描述細胞,如核質(zhì)比等[11-12].
3)紋理特征. 在提取細胞的紋理特征時,灰度共生矩陣[13]是常用的方法,該方法提取的特征主要是對比度、能量、熵等. Walker等[14-15]利用灰度共生矩陣實現(xiàn)了宮頸細胞的分類. 趙暉等[16]用灰度共生矩陣求出6個紋理特征,再對其進行歸一化,在細胞分類中取得了較好的結(jié)果. Plissiti等[17]采用局部二進制模式特征,來分析宮頸細胞的紋理特征.
本文算法的流程圖如圖1所示.
綜合以上顏色特征、紋理特征和形態(tài)特征,本文共選擇了20個特征,匯總?cè)绫?所示.
雖然表1所含的20個特征中有部分特征的名稱相同,如顏色特征和紋理特征中的能量和熵,但是兩者意義不同,它們分別從不同的角度來定義,因此各自起著一定作用.
2? ?宮頸細胞的特征選擇
特征選擇即選擇出最具代表性的特征. Liu等[18]對特征選擇做出總結(jié),選擇一組最優(yōu)的特征子集,該特征子集需保證元素個數(shù)最少,既降低特征空間維數(shù),又保證細胞識別的準確率. 因此本文選擇CART算法對數(shù)據(jù)進行降維處理,其本質(zhì)是對特征空間進行二元劃分,即進行二叉樹分裂. 二叉樹分裂有標量屬性分裂和連續(xù)屬性分裂. 標量屬性是指進行分裂的條件為不等于某個值. 連續(xù)屬性是指進行分裂的條件為不大于某個值 ,如 取相鄰兩個屬性中間值. 圖2為標量屬性和連續(xù)屬性進行分裂時的示意圖.
為了保證分類效果,需要確定選擇哪種特征屬性. 為了衡量各個特征的重要性,CART采用Gini指數(shù)觀察分裂時的不純度. Gini指數(shù)計算公式如下:
Gini(t) = 1 - [p(ck|t)]2? ? ? ? ? ?(1)
式中:t為決策樹的節(jié)點;ck為第k個樣本的個數(shù);p為概率.
觀察該計算公式,發(fā)現(xiàn)Gini指數(shù)的實質(zhì)是1與類別ck的概率平方和的差值,即反映了樣本的不確定程度. Gini指數(shù)通過計算特征對每個節(jié)點上觀測值的異質(zhì)性的影響,觀察特征的重要性. 該值越大表示該特征越重要,因此應(yīng)該選擇具有較大Gini指數(shù)的特征. 假設(shè)父節(jié)點對應(yīng)的樣本集合為D,CART選擇特征A分裂為兩個子節(jié)點,對應(yīng)集合為DL與DR,分裂后的Gini指數(shù)定義如下:
G(D,A)=Gini(DL)+Gini(DR)(2)
式中:·表示樣本集合的記錄數(shù)量.
本文采用該算法將20個特征分別進行特征選擇,二分類的比較結(jié)果如圖3所示.
觀察二分類的結(jié)果,可以發(fā)現(xiàn)一共有兩種衡量指標:Mean decrease in accuracy和Mean decrease in Gini index. Mean decrease in accuracy指去掉該特征后實驗結(jié)果準確率的下降量. 假設(shè)把特征20去掉,分類準確率降低11.05%,因此該值越大表示該特征越重要. Mean decrease in Gini index是計算特征對每個節(jié)點觀測值的異質(zhì)性的影響,該值越大也表示該特征越重要.
本文對七分類進行特征選擇,比較結(jié)果如圖4所示.
觀察圖3和圖4,可以發(fā)現(xiàn)七分類的特征性能表現(xiàn)與二分類近乎一致. 對細胞而言無論是二分類還是七分類,正常細胞之間的差異和異常細胞之間的差異是很小的,二分類中正常細胞與異常細胞之間的差異就類似于七分類中正常柱狀上皮細胞與輕度癌變細胞之間的差異,因此特征的表現(xiàn)能力相似.
為了對特征的重要性進行排序,以便觀察每個特征,本文對20個特征的表現(xiàn)能力進行了排序,更為直觀的準確率表示如圖5所示.
觀察圖5可以發(fā)現(xiàn),前6個特征中兩種分類情況的Gini系數(shù)性能表現(xiàn)一致. 七分類中每個特征的Gini系數(shù)比二分類大,因為隨著分類類別數(shù)目的增加,類別之間細微的差異就使得某個特征發(fā)揮了作用. 另外,七分類中特征6的表現(xiàn)能力沒有特征2和4表現(xiàn)好,但是在二分類中其表現(xiàn)能力較好,因此其重要性是可以確定的. 綜合考慮每個特征的表現(xiàn)能力,本文選擇前9個特征送入分類器進行訓(xùn)練.
以下為20個特征在Mean decrease in accuracy的表現(xiàn),具體情況如圖6所示.
圖6中,20個特征在Mean decrease in accuracy和Mean decrease in Gini index中的表現(xiàn)近乎一致. 雖然個別順序有所改變,但整體上特征性質(zhì)改變不大. Gini系數(shù)是CART進行特征選擇的重要依據(jù),因此本文著重分析該系數(shù)的變化. 通過觀察圖6可以發(fā)現(xiàn),特征20所占的比重最大,效果較為明顯,其次是特征16,依次類推. 觀察特征4及之后特征可以發(fā)現(xiàn),這些特征的縮減對Gini系數(shù)的影響并不大,因此綜合兩類情況,本文選擇特征1、2、4、5、6、12、15、16、20共9個特征作為選擇后的特征,即均值,方差,峰態(tài),能量,熵,粗糙度,周長,面積,核質(zhì)比,進行后續(xù)的分類器訓(xùn)練.
3? ?PSO-SVM分類器訓(xùn)練
對于線性不可分的樣本,SVM通過將其映射到一個高維的線性空間,使其線性可分,并且加入了核函數(shù)的使用,既減少了計算的復(fù)雜性,又減少了維數(shù)災(zāi)難[19-20]. 雖然傳統(tǒng)的SVM模型效果不錯,但是求解最優(yōu)化問題依然效果欠佳,如參數(shù)的選取. 本文引入了PSO算法優(yōu)化SVM的超參數(shù),構(gòu)建PSO-SVM模型,通過全局尋優(yōu),尋找更好的分類效果.
PSO的數(shù)學(xué)描述[21]為:假設(shè)搜索空間是M維,粒子數(shù)為n,其中第i個粒子的位置表示為xi = (xi1,xi2,…,xiM),i = 1,2,…,n,把xi帶入目標函數(shù)就可以算出適應(yīng)度值fit,根據(jù)適應(yīng)度值的大小可以判斷該粒子的好壞. 第i個粒子的飛行速度為vi = (vi1,vi2,…,viM),搜索到的最優(yōu)位置為pi = (pi1,pi2,…,piM),所有粒子群搜到的最優(yōu)位置為pg=(pg1,pg2,…,pgM),當兩個最優(yōu)位置都找到時,每個粒子可以根據(jù)更新公式來更新自己的位置和速度.
為了實現(xiàn)全局尋優(yōu),需要將本文的數(shù)據(jù)分為3部分(訓(xùn)練集、測試集和驗證集). 具體的PSO-SVM算法如下:
1)在初始狀態(tài)下根據(jù)經(jīng)驗初步確定懲罰因子c和徑向基函數(shù)參數(shù)σ的取值范圍.
2)PSO初始化. 初始化算法的參數(shù),一般情況下,搜索空間設(shè)置為2維,粒子數(shù)為 20~50. 隨機初始化粒子參數(shù)并形成粒子群,隨機生成粒子的開始速度,并確定參數(shù)pbest和gbest,pbest設(shè)置為粒子的當前位置,gbest為所有粒子中最好的粒子的當前位置.
3)加入訓(xùn)練集訓(xùn)練SVM,用適應(yīng)度函數(shù)計算每個粒子的適應(yīng)度值fit,并隨時更新第i個粒子的最優(yōu)位置pi和所有粒子的最優(yōu)位置pg,如果某個粒子當前適應(yīng)度高于pbest,則新的適應(yīng)度值取代pbest,如果所有粒子當前適應(yīng)度值高于gbest,則當前最優(yōu)位置的適應(yīng)度值取代gbest. 對c和σ進行迭代尋優(yōu),從而獲取最優(yōu)參數(shù)c和σ的值.
4)觀察訓(xùn)練集訓(xùn)練結(jié)果是否滿足精度,是則繼續(xù)向下進行;否則轉(zhuǎn)向步驟3).
5)加入驗證集觀察訓(xùn)練結(jié)果,并計算誤差和適應(yīng)度函數(shù),如果算法達到結(jié)束條件,繼續(xù)向下進行;否則,對粒子的速度和位置進行更新,并返回3)繼續(xù)向下進行. 算法的終止條件是達到分類精度或迭代次數(shù).
6)至此,就可保證得到了適應(yīng)度最優(yōu)的粒子信息,加入測試集進行測試,輸出分類結(jié)果即可.
如圖7所示,為PSO訓(xùn)練SVM的流程圖.
經(jīng)過以上算法,得到使SVM誤差最小的參數(shù)c和σ的最優(yōu)值.
4? ?宮頸細胞的準確率比較
本文采用十折交叉驗證對917張Herlev數(shù)據(jù)集進行訓(xùn)練和測試,即每次選擇數(shù)據(jù)集中的9份作為訓(xùn)練集,剩下的1份作為測試集,共進行10次. 其中分別進行了20個特征和9個特征的分類器訓(xùn)練,訓(xùn)練效果如表2所示.
在二分類中,20個特征的識別準確率為99.89%,9個特征的識別準確率為99.78%. 七分類中,20個特征的識別準確率為99.56%,9個特征的識別準確率為99.35%. 在特征數(shù)目減少的過程中,細胞識別的準確率幾乎沒有發(fā)生變化,識別所消耗的時間卻得到了有效地降低. 二分類的運行時間減少了3 s左右,七分類的識別時間減少了9 s左右.
確定了9個特征后,將9個特征放進PSO-SVM進行二分類和七分類的訓(xùn)練,其準確率如表3和表4所示.
表3中,1個正常細胞被識別為異常細胞,1個異常細胞被識別為正常細胞. 表4中,有4個正常柱狀細胞被識別輕度癌變細胞,2個輕度病變細胞被識別為正常柱狀細胞. 對病人而言,實際意義上的七分類識別錯誤個數(shù)只有2個,將正常細胞識別為癌細胞不會對患者造成真正的傷害,因此識別準確率為99.78%,與二分類幾乎一致.
為了證實所提算法的有效性,本文同時采用了主成分回歸分析(PCR)、主成分分析(PCA)-PSO-SVM、核主成分分析(KPCA)-PSO-SVM、最小冗余最大相關(guān)(MRMR)[22]-PSO-SVM和ReliefF[23]-PSO-SVM共5種方法作為對照. 并且,本文采用均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Average Absolute Error,AAE)和最大絕對誤差(Maximal Absolute Error,MAE)、準確率(Accuracy,ACC)、敏感度(Sensitivity,SEN)和特異度(Specificity,SPE)作為模型性能評價指標,其中RMSE和ACC為主要的評價指標.
RMSE =? ? ? ? (3)
AAE = yi - [y][^]i? ? ? ?(4)
MAE = max(yi - [y][^]i)? ? ? ?(5)
式中:yi為第i個樣本的真實值;[y][^]i為第i個樣本的估計值;N為測試集的樣本個數(shù).
本文在將特征數(shù)降維為9個的基礎(chǔ)上對各個評價指標進行統(tǒng)計,各個算法表現(xiàn)性能如表5、表6所示.
觀察6個評價指標可以發(fā)現(xiàn),在宮頸癌細胞的二分類和七分類研究中,本文提出的特征選擇方法的性能指標最優(yōu),即本文的CART模型具有較高的準確性,且各類性能指標均優(yōu)于對照實驗方法. 本文算法的準確率比KPCA算法高出3%左右,比PCR高出30%,靈敏度和特異度也均為最高.
觀察表5和表6可以發(fā)現(xiàn),本文算法的RMSE和AAE均為最低. 本文的評價指標為均方根誤差和平均絕對誤差,誤差越小,分布越均勻,識別錯誤的可能性越小,識別越穩(wěn)定. MAE為最大絕對誤差,在二分類中,如果識別出現(xiàn)錯誤,MAE值只能為1,在七分類中,該值具有不確定性. 該值越大,證明該算法的不穩(wěn)定性越大,在ReliefF算法中MAE值為5,識別中出現(xiàn)了將第一類正常細胞識別為第六類異常細胞的情況. 而本文MAE值為1,即只在第三類正常細胞和第四類異常細胞之間識別出現(xiàn)誤差,但仍保證了較高的識別精度,因此也體現(xiàn)了本文識別算法的優(yōu)異性.
為了更加全面地驗證本文算法的有效性,本文列舉了其它幾種算法的特征選擇數(shù)目以及分類準確率,具體的比較結(jié)果如表7所示.
在其它6種算法中,文獻[26]識別準確率為98.98%,特征數(shù)為11個,本文識別算法準確率比其高了1%左右,特征數(shù)少用2個,效果較為明顯. 從文獻[9]和[24]中可以看出,特征數(shù)多識別效果不一定高. 文獻[27]和[28]中雖然選擇了相同的9種特征,識別準確率卻比本文算法低了6%和4%,因此特征數(shù)目的選擇不僅要準確反映細胞的差異,還要具有較高的準確率. 綜合7種算法的識別準確率和特征數(shù),本文算法能夠以最少的特征數(shù)實現(xiàn)最高的準確率,識別效果較好,對于人工智能識別癌細胞的推廣具有極大的價值.
5? ?結(jié)? ?論
針對目前宮頸細胞識別過程中出現(xiàn)的特征冗余和準確率低的問題,本文建立了基于CART特征選擇算法的宮頸細胞分類識別模型,從20個特征中選擇了9個有效的特征,建立了PSO-SVM模型進行細胞的分類,使得細胞識別的準確率達到了99%以上. 為了驗證本文算法的有效性,引入了RMSE、AAE等評價指標,并與其它分類方法進行比較,結(jié)果表明,本文算法不僅提取了更加精準有效的特征,而且實現(xiàn)了較高的識別準確率. 該研究結(jié)果有效地提高了二分類和七分類的識別效率,同時對于降低宮頸癌的誤診率有良好的應(yīng)用價值.
參考文獻
[1]? ? FERLAY J,SOERJOMATARAM I,DIKSHIT R,et al. Cancer in cadence and mortality worldwide:sources,methods and major patterns [J]. International Journal of Cancer,2015,136(5):359—386.
[2]? ? 洪繼光,成德信,于光普. 細胞圖像的特征描述[J]. 信息與控制,1983,12(2):28—33,45.
HONG J G,CHENG D X,YU G P. Characteristics of cell image [J]. Information and Control,1983,12(2):28—33,45. (In Chinese)
[3]? ? 段潔,胡清華,張靈均,等. 基于鄰域粗糙集的多標記分類特征選擇算法[J].計算機研究與發(fā)展. 2015,52(1):56—65.
DUAN J,HU Q H,ZHANG L J,et al. Multi-label classification feature selection algorithm based on neighborhood rough set [J]. Computer Research and Development,2015,52(1):56—65. (In Chinese)
[4]? ? NUNOBIKI O,SATO M,TANIGUCHI E,et al. Color image analysis of cervical neoplasia using RGB computer color specification [J]. Analytical and Quantitative Cytology and Histology,2002,24(5):289—294.
[5]? ? VIJAYASHREE R,RAO K. A semi-automated morphometric assessment of nuclei in pap smears using image[J]. Journal of Evolution of Medical and Dental Sciences,2015,4 (53):63—70.
[6]? ? 張勇. 一種有效的白細胞圖像彩色空間序貫分割方法[J]. 西安交通大學(xué)學(xué)報,1998,32(8):52—56.
ZHANG Y. An effective segmentation method for color space of white blood cell image [J]. Journal of Xi′an Jiaotong University,1998,32(8):52—56. (In Chinese)
[7]? ? 花蕾,葉玉坤. 基于知識的肺癌早期細胞診斷系統(tǒng)[J]. 計算機應(yīng)用研究,2000,17(2):90—92.
HUA L,YE Y K. Knowledge-based early cell diagnosis system for lung cancer [J]. Journal of Computer Applications,2000,17(2):90—92. (In Chinese)
[8]? ? 陸新泉,李寧,陳世福. 形態(tài),顏色特征及神經(jīng)網(wǎng)絡(luò)在肺癌細胞識別中的應(yīng)用研究[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2001,13(1):87—92.
LU X Q,LI N,CHEN S F. Application of morphology,color features and neural network in recognition of lung cancer cells [J]. Journal of Computer-Aided Design & Computer Graphics,2001,13(1):87—92. (In Chinese)
[9]? ? JANTZEN J,NORUP J,DOUNIAS G,et al. Pap-smear benchmark data for pattern classification [J]. Nature Inspired Smart Information Systems (NiSIS 2005),2005:1—9.
[10]? HALLINAN J,JACKWAY P. Detection of malignancy associated changes in thionin stained cervical cells [J]. Digital Image Computing and Applications,1995,27(5):426—431.
[11]? PLISSITI M E,NIKOU C. A review of automated techniques for cervical cell image analysis and classification [M]. Netherlands:Biomedical Imaging and Computational Modeling in Biomechanics,2013:1—18.
[12]? CHEN Y F,HUANG P C,LIN K C,et al. Semi-automatic segmentation and classification of pap smear cells [J]. Biomedical and Health Informatics,2014,18(1):94—108.
[13]? HARALICK R M,SHANMUGAM K,DINSTEIN I H. Textural features for image classification [J]. Systems,Man and Cybernetics,1973, 12(6):610—621.
[14]? WALKER R F, JACKWAY P, LOVELL B,et al. Classification of cervical cell nuclei using morphological segmentation and textural feature extraction[C]//Conference on Intelligent Information Systems. New Zealand:IEEE, 1994:297—301.
[15]? WALKER R F, JACKWAY P T, LOVELL B. Cervical cell classification via co-occurrence and Markov random field features[C]//Proceedings of Digital Image Computing:Techniques and Applications. Australia Brisbane:IEEE, 1995:294—299.
[16]? 趙暉,鮑莉,梁光明,等. 基于綜合灰度共生矩陣的顯微細胞圖像紋理研究[J].自動化技術(shù)與應(yīng)用,2005,23(10):27—29.
ZHAO H, BO L, LIANG G M,et al. Research on microscopic cell image texture based on integrated gray level co-occurrence matrix [J]. Automation Technology and Application, 2005, 23(10):27—29. (In Chinese)
[17]? PLISSITI M E,NIKOU C,CHARCHANTI A. Automated detection of cell nuclei in Pap smear images using morphological reconstruction and clustering [J]. Information Technology in Biomedicine, 2011, 15(2):233—241.
[18]? LIU H,MOTODA H. Feature selection for knowledge discovery and data mining[M]. Netherlands:Kluwer Academic Publishers, Springer Science & Business Media,1998:1—15.
[19]? 孫磊,陳陽,黃洋文,等. 支持向量機算法對鼻咽癌與正常鼻咽細胞株拉曼光譜分析[J],光譜學(xué)與光譜分析,2013,33(6):1566—1569.
SUN L, CHEN Y, HUANG Y W,et al. Raman spectroscopy analysis of nasopharyngeal carcinoma and normal nasopharyngeal cell line by support vector machine algorithm[J]. Spectroscopy and Spectral Analysis, 2013, 33 (6):1566—1569. (In Chinese)
[20]? 張問銀,金寧德,劉印鋒,等. 基于支持向量機的CD4細胞圖像識別方法[J].計算機工程與科學(xué),2009,31(7):150—152.
ZHANG W Y, JIN N D, LIU Y F,et al. Image recognition method based on support vector machine for CD4 cells [J]. Computer Engineering and Science,2009,31(7):150—152. (In Chinese)
[21]? 張英杰,許偉,湯龍波,等. 基于滾動時間窗的PSO-LSSVM的通信基站能耗建模[J]. 湖南大學(xué)學(xué)報(自然科學(xué)版), 2017, 44(2):122—128.
ZHANG Y J, XU W, TANG L B,et al. Modeling of communication base station energy consumption based on PSO-LSSVM based on rolling time window [J].Journal of Hunan University (Natural Sciences),2017,44(2):122—128. (In Chinese)
[22]? PENG H, LONG F, DING C. Feature selection based on mutual information criteria of max-dependency,max-relevance,and min- redundancy[J]. Pattern Analysis & Machine Intelligence IEEE Transactions, 2005, 27(8):1226—1238.
[23]? KONONENKO I,?IMEC E,ROBNIK-?IKONJA M. Overcoming the myopia of inductive learning algorithms with relieff [J]. Applied Intelligence,1997,7(1):39—55.
[24]? EDWIN J M, ALLWIN S. Nominated texture based cervical cancer classification[J]. Computational and Mathematical Methods in Medicine,2015,2015:1—10.
[25]? KANGKANA B, MANISH CB, LIPI B. Automated classification of Pap smear images to detect cervical dysplasia [J]. Computer Methods and Programs in Biomedicine,2017,138:31—47.
[26]? ZHAO M,WU A G. Automatic screening of cervical cells using block image processing[J]. BioMedical Engineering OnLine, 2016,15(1):14—33.
[27]? SAJEENA T A,JEREESH A S. Automated cervical cancer detection through RGVF segmentation and SVM classification[C]// International Conference on Computing & Network Communications. Kauai,Hawai:IEEE,2016:16—19.
[28] CHANKONG T,THEERA-UMPON N,AUEPHANWIRIYANKUL S. Automatic cervical cell segmentation and classification in Pap smears[J]. Computer Methods Programs in Biomedicine,2014, 113(2):539—556.