神經(jīng)網(wǎng)絡(luò)領(lǐng)域最早是由心理學(xué)家和神經(jīng)學(xué)家開創(chuàng)的,旨在尋求開發(fā)和檢驗神經(jīng)的計算模擬。神經(jīng)網(wǎng)絡(luò)是一組連接的輸入/輸出單元,其中每一個連接都與一個權(quán)重相關(guān)聯(lián)。神經(jīng)網(wǎng)絡(luò)可以分為兩個階段,第一個階段是學(xué)習(xí)階段,通過調(diào)整權(quán)重,使得能夠預(yù)測輸入元祖的正確類標(biāo)號,第二階段為預(yù)測階段,使用生成好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測[1]。
神經(jīng)網(wǎng)絡(luò)的優(yōu)勢包括其對噪聲數(shù)據(jù)的高承受能力,以及對未訓(xùn)練的數(shù)據(jù)的模式分類能力,劣勢在于可解釋性差。
Clementine軟件采用可視化編程思想,提供了大量的人工智能、統(tǒng)計分析的模型,可將數(shù)據(jù)挖掘流程轉(zhuǎn)化為一個數(shù)據(jù)流,每個數(shù)據(jù)流由一系列結(jié)點組成,為每個結(jié)點指定操作,就可以完成數(shù)據(jù)流的執(zhí)行[2]。結(jié)點被劃分為七個欄,分別為源、記錄選項、字段選項、圖形、建模、輸出和導(dǎo)出。
校園貸預(yù)測模型建立可分為兩個過程,首先是神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程,其次是使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測[3]。下面分別從這兩個過程分析模型的建立步驟。
1.神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程
步驟1 在軟件Clementine中選擇源結(jié)點中用于讀取Excel數(shù)據(jù)(訓(xùn)練集)的結(jié)點并配置數(shù)據(jù)來源;
步驟2 在字段選項中選擇類型結(jié)點,并配置數(shù)據(jù)列的類型和方向;
步驟3 在建模選項下選擇神經(jīng)網(wǎng)絡(luò)結(jié)點并配置參數(shù);
步驟4 連接新建立的3個結(jié)點并執(zhí)行數(shù)據(jù)流,數(shù)據(jù)流如圖1所示,生成的神經(jīng)網(wǎng)絡(luò)模型如圖2所示。
2.使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測
步驟1在軟件Clementine中選擇源結(jié)點中用于讀取Excel數(shù)據(jù)(測試集)的結(jié)點并配置數(shù)據(jù)來源;
步驟2在字段選項中選擇類型結(jié)點,并配置數(shù)據(jù)列的類型和方向;
步驟3 選擇訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型;
步驟4 選擇輸出選項中的表結(jié)點;
步驟5 連接新建立的4個結(jié)點,形成的數(shù)據(jù)流如圖3所示。
圖1 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練數(shù)據(jù)流圖
圖2 神經(jīng)網(wǎng)絡(luò)模型圖
圖3 神經(jīng)網(wǎng)絡(luò)模型預(yù)測數(shù)據(jù)流圖
將樣本分為訓(xùn)練集和測試集兩部分,訓(xùn)練集占80%,測試集占20%。使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型在測試集上預(yù)測,將得到的結(jié)果進(jìn)行處理,取閾值為1.7,將小于閾值的歸為會使用網(wǎng)貸類,將大于等于閾值的歸為不會使用網(wǎng)貸類,將實際值與預(yù)測值匯總,得到的結(jié)果如表1所示。
表1 預(yù)測分類與實際分類圖
表1續(xù) 預(yù)測分類與實際分類圖
經(jīng)計算預(yù)測準(zhǔn)確度達(dá)到88.9%,達(dá)到了較好的預(yù)測效果。
文章以重慶工程職業(yè)技術(shù)學(xué)院范圍內(nèi)得到的調(diào)查問卷為基礎(chǔ),利用Clementine軟件建立了神經(jīng)網(wǎng)絡(luò)模型,并在測試集上對模型的預(yù)測效果進(jìn)行驗證,測試結(jié)果顯示準(zhǔn)確度達(dá)88.9%,證明使用神經(jīng)網(wǎng)絡(luò)模型預(yù)測大學(xué)生是否會使用校園貸是可行的。