国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大模型視角下的中高職困難生大數(shù)據(jù)識別技術(shù)應(yīng)用及實證分析

2024-12-14 00:00:00黃海寧羅偉泰林振程
廣西糖業(yè) 2024年6期
關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò)中高職教育公平

摘要:我國教育領(lǐng)域?qū)щy生的認(rèn)定工作給予了極大的關(guān)注和重視,特別是在中等和高等職業(yè)教育中,已將困難生的認(rèn)定及相應(yīng)的資助措施,作為實現(xiàn)教育公平和正義的關(guān)鍵環(huán)節(jié)之一。文章以廣西地區(qū)的中等和高等職業(yè)院校(以下簡稱中高職)學(xué)生為研究對象,通過查閱文獻(xiàn)、設(shè)計并發(fā)放調(diào)查問卷,結(jié)合項目實施,運用大數(shù)據(jù)分析和人工智能(AI)技術(shù),尤其是深度神經(jīng)網(wǎng)絡(luò)技術(shù),深入探討數(shù)據(jù)挖掘技術(shù)在困難生識別方面的應(yīng)用潛力;構(gòu)建基于深度神經(jīng)網(wǎng)絡(luò)的困難生識別(TabNet-Stacking)模型,并通過實證分析驗證該模型在查準(zhǔn)率、召回率和F1值3個關(guān)鍵指標(biāo)上的表現(xiàn)。結(jié)果表明,TabNet-Stacking模型能準(zhǔn)確無誤地識別出困難生,為實現(xiàn)精準(zhǔn)識別和資助提供了創(chuàng)新方法;提出在中等和高等職業(yè)教育中實施困難生大數(shù)據(jù)識別技術(shù)應(yīng)用與發(fā)展的策略,包括加強數(shù)據(jù)整合工作、優(yōu)化算法模型、完善資助體系、加強監(jiān)管評估及推動技術(shù)創(chuàng)新,旨在確保困難生資助工作的精準(zhǔn)性和有效性,進而促進教育公平,讓每個學(xué)生均有平等接受教育的機會。

關(guān)鍵詞:中高職;困難生;數(shù)據(jù)識別;深度神經(jīng)網(wǎng)絡(luò);教育公平

中圖分類號:TP391.4" " " " " " " " " " 文獻(xiàn)標(biāo)志碼:A 文章編號:2095-820X(2024)06-0493-08

0 引言

困難生指的是生活必需資源不足導(dǎo)致個人生活水平未達(dá)到社會平均發(fā)展水平、生存狀態(tài)被排除在正常生活方式和社會活動之外的學(xué)生[1]。困難生認(rèn)定工作對我國教育事業(yè)高質(zhì)量發(fā)展的影響不容忽視,因此一直受到教育界的高度重視,并將教育扶貧作為解決相對困難問題的主要路徑。在中等和高等職業(yè)教育領(lǐng)域,困難生的經(jīng)濟狀況和生活條件引起了社會各界的廣泛關(guān)注[2-4],其相對困難主要體現(xiàn)在日常生活、學(xué)術(shù)追求及人際交往等方面相較于其他同學(xué)或同齡人面臨更多的差異與挑戰(zhàn)。查閱大數(shù)據(jù)識別技術(shù)應(yīng)用與教育公平相關(guān)的文獻(xiàn)發(fā)現(xiàn),通過大數(shù)據(jù)技術(shù)的應(yīng)用,可更公平地分配教育資源,促進教育公平。張茜[5]研究認(rèn)為,在中等和高等職業(yè)院校(以下簡稱中高職)困難生扶貧工作中,傳統(tǒng)的困難生認(rèn)定方法存在依賴于單一、簡單的機器學(xué)習(xí)模型及“隱形困難”和疑似“虛假困難”問題,而從促進教育公平角度出發(fā),建立基于深度學(xué)習(xí)技術(shù)的智能化困難生認(rèn)定模型,可智能化識別真正需經(jīng)濟援助的中高職困難生,從而提升資助工作的效率和針對性,促進教育公平。李秋蕓[6]開展廣西高職院校貧困生感恩教育研究發(fā)現(xiàn),隨著人工智能(AI)技術(shù)的不斷進步及數(shù)據(jù)挖掘技術(shù)的應(yīng)用,我國高校在困難生資助工作的精準(zhǔn)化研究方面取得了新進展。從大模型視角出發(fā),利用大數(shù)據(jù)和AI技術(shù)可顯著提升困難生資助工作的精確度。劉海燕[7]研究表明,在面對中等和高等職業(yè)教育中困難生識別的挑戰(zhàn)時,借助大數(shù)據(jù)分析和AI技術(shù),通過綜合考量學(xué)生的家庭經(jīng)濟狀況、個人能力和未來發(fā)展?jié)摿Φ榷嗑S度信息,可實現(xiàn)對困難生的精確識別和資助。上述研究結(jié)果表明,深度學(xué)習(xí)技術(shù)的充分利用及以大數(shù)據(jù)為支撐構(gòu)建精準(zhǔn)識別模型,對提升高校困難生資助工作精確度具有重要意義,特別在識別學(xué)生基本經(jīng)濟狀況方面,可為資源相對匱乏的學(xué)生群體提供有力支持。但目前在大模型視角下將大數(shù)據(jù)識別技術(shù)應(yīng)用于困難生認(rèn)定以解決教育公平問題的研究仍顯不足。文章以廣西中高職學(xué)生為研究對象,通過大量查閱文獻(xiàn)、問卷調(diào)查及《大數(shù)據(jù)背景下中高職院校家庭經(jīng)濟困難學(xué)生精準(zhǔn)資助路徑研究》項目實施,探討數(shù)據(jù)挖掘技術(shù)在困難生識別上應(yīng)用的可行性,并提出在中等和高等職業(yè)教育中實施困難生大數(shù)據(jù)識別技術(shù)應(yīng)用與發(fā)展的策略,以確保困難生資助工作精準(zhǔn)、有效,為構(gòu)建和諧校園、促進教育公平貢獻(xiàn)力量。

1 數(shù)據(jù)來源及分析方法

近年來,智能識別技術(shù)已受到社會廣泛關(guān)注,其應(yīng)用領(lǐng)域不斷拓展,其中,圖像識別、語音識別和自然語言處理等技術(shù)尤為引人矚目。作為智能識別技術(shù)的關(guān)鍵應(yīng)用領(lǐng)域之一,自然語言處理隨著社交媒體和在線客服平臺的廣泛使用而得到普及。同時,自然語言處理技術(shù)不斷取得進步,處理效率和語義理解能力持續(xù)提升。

1.1 數(shù)據(jù)來源

以廣西中高職全體在校學(xué)生為研究對象,從識別相對困難生的角度,收集影響其家庭年度可支配收入、學(xué)生個人年度收入及在?;旧畋U现С龅纫蛩氐臄?shù)據(jù),構(gòu)建一個包含相對困難生數(shù)據(jù)集的大模型[8],在構(gòu)建模型過程中,引入深度神經(jīng)網(wǎng)絡(luò)(一種包含多個隱藏層的神經(jīng)網(wǎng)絡(luò),亦稱為深度前饋網(wǎng)絡(luò)或多層感知機),以提升模型的表達(dá)能力。根據(jù)神經(jīng)網(wǎng)絡(luò)層的不同功能,可將其劃分為信息輸入層、信息隱藏層和特征輸出層。在特征信息提取過程中,以輸出層為起點,通過前向傳播算法對輸入向量執(zhí)行一系列線性和激活運算,最終獲得輸出結(jié)果。當(dāng)輸出信息與預(yù)期特征不符時,深度神經(jīng)網(wǎng)絡(luò)通過損失函數(shù)的梯度迭代不斷優(yōu)化自身,以確定與隱藏層、輸出層適合的對應(yīng)偏倚向量b和線性系數(shù)矩陣W,確保所有訓(xùn)練樣本的輸入盡可能地與標(biāo)簽相匹配。通過深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)圖(圖1)可清晰地識別深度神經(jīng)網(wǎng)絡(luò)模型主要由輸入層、隱藏層和輸出層構(gòu)成,各層次間形成一個完整的全連接網(wǎng)絡(luò)結(jié)構(gòu)[9]。其中,輸入層承載影響中高職困難生識別的關(guān)鍵因素,輸出層對應(yīng)于中高職相對困難生的認(rèn)定標(biāo)準(zhǔn),該標(biāo)準(zhǔn)進一步細(xì)化為非困難、一般困難、中度困難和特別困難4個等級。深度神經(jīng)網(wǎng)絡(luò)之所以能顯著提升中高職相對困難生信息特征的提取效率,核心在于其非線性結(jié)構(gòu)。新型激活函數(shù)Xwish定義如下:

f(x)=x[arctan(βx)+0.5π]/π

式中,β表示可修正參數(shù),在實數(shù)范圍內(nèi)是光滑的,在β=0、Xwish成為線性函數(shù)f(x)=x的情況下,Xwish趨近于[0~1]函數(shù)值(類似于ReLU函數(shù))。

1.2 分析方法

通過運用大數(shù)據(jù)分析技術(shù)、循環(huán)神經(jīng)網(wǎng)絡(luò)及其他先進的智能技術(shù),致力于構(gòu)建一套專門針對高校學(xué)生經(jīng)濟困難狀況的識別模型。①搜集一系列影響家庭年度可支配收入、學(xué)生個人年度收入及在校基本生活保障支出的因素。這些因素包括但不限于家庭經(jīng)濟狀況、學(xué)生的學(xué)習(xí)成績及課外活動參與度等。②運用詞頻分析法對各因素進行深入分析,篩選出與困難狀況關(guān)聯(lián)性較高的關(guān)鍵因素,并將其作為建立困難生認(rèn)定標(biāo)準(zhǔn)指標(biāo)體系的基礎(chǔ)。③以循環(huán)神經(jīng)網(wǎng)絡(luò)模型為核心,將識別出的困難生相關(guān)指標(biāo)作為輸入層數(shù)據(jù),以楊釙等[1]提出的困難生認(rèn)定標(biāo)準(zhǔn)為輸出層數(shù)據(jù),通過模型判定學(xué)生的經(jīng)濟困難狀況。所構(gòu)建的基于大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的高校學(xué)生經(jīng)濟困難認(rèn)定模型,不僅能滿足鄉(xiāng)村振興戰(zhàn)略對困難生資助的新要求,而且能解決當(dāng)前高校在困難生認(rèn)定準(zhǔn)確性方面存在的問題,從而為高校提供一個更科學(xué)、合理的困難生資助決策支持系統(tǒng)。

在中等和高等職業(yè)教育領(lǐng)域,準(zhǔn)確識別相對困難生本質(zhì)上是一個多類別的分類問題,可進一步細(xì)化為若干個二分類問題進行詳細(xì)闡述。因此,可通過運用多個二分類問題的混淆矩陣來具體展示分類結(jié)果,并通過整合這些二分類問題的評價指標(biāo)來全面評估困難生識別模型的效能。由困難生識別的混淆矩陣(表1~表4)可知,TP(真正例)、FP(假正例)、FN(假負(fù)例)和TN(真負(fù)例)等指標(biāo)能幫助量化模型在識別困難生時的準(zhǔn)確性、召回率(Recall)及F1分?jǐn)?shù)等關(guān)鍵性能指標(biāo),從而為模型的優(yōu)化和調(diào)整提供數(shù)據(jù)支持。

基于困難生識別混淆矩陣,采用查準(zhǔn)率(Accuracy)、召回率和F1-Score的宏平均值來對比評價困難生識別模型的性能。

Macro-Recall=1/n[t=1nTP]/(TP+FN)

Macro-Precision=1/n[t=1nTP]/(TP+FN)

Macro-Fl=1/n[t=1n(2]?Preciosion?Recall)/(Precision+Recall)

式中,Macro表示宏量概念(通常指一個較大的、宏觀的量度或一個整體的度量標(biāo)準(zhǔn)),Precision表示精確度(描述測量或計算結(jié)果的精確程度,即結(jié)果與真實值的接近程度),n表示樣本數(shù)量、次數(shù)或其他計數(shù)相關(guān)的數(shù)值,i表示索引(用于區(qū)分不同元素或迭代過程的步驟),F(xiàn)1表示特定函數(shù)或特定參數(shù)。

2 中高職困難生相對困難的識別及大數(shù)據(jù)識別技術(shù)應(yīng)用的實證分析

2.1 困難生相對困難的智能識別

2.1.1 數(shù)據(jù)采集與預(yù)處理

在AI應(yīng)用領(lǐng)域,數(shù)據(jù)采集與預(yù)處理環(huán)節(jié)扮演著至關(guān)重要的角色。通過運用各種先進技術(shù)手段,如各類傳感器和網(wǎng)絡(luò)爬蟲,能采集原始數(shù)據(jù)。但原始數(shù)據(jù)通常不能直接用于機器學(xué)習(xí)算法,必須經(jīng)過一系列細(xì)致的預(yù)處理步驟,確保數(shù)據(jù)能適應(yīng)特定的格式要求,才能滿足機器學(xué)習(xí)算法的需求。預(yù)處理工作通常涵蓋數(shù)據(jù)清洗、特征提取及數(shù)據(jù)變換等關(guān)鍵步驟。在數(shù)據(jù)清洗過程中,專注于排除那些可能影響數(shù)據(jù)質(zhì)量的異常值、缺失值和重復(fù)值,從而顯著提升數(shù)據(jù)的整體質(zhì)量和可信度。本研究遵循一套嚴(yán)格的困難生認(rèn)定標(biāo)準(zhǔn),將家庭年度可支配收入、學(xué)生個人年度收入及在?;旧畋U现С鲎鳛楹诵淖R別指標(biāo)。為了高效解析、遍歷和維護HTML文本,利用Python編程語言中的lxml庫,特別是其中的xpath語言,對鏈接進行分類匯總,并進一步爬取正文內(nèi)容,最終將這些內(nèi)容按類別保存至文件中。在解析爬取的HTML文本時,同樣使用lxml庫中的xpath語言,以便從中提取出所需要的信息。

2.1.2 相對困難生資料關(guān)鍵詞提取

本研究通過網(wǎng)絡(luò)爬蟲技術(shù)搜集了91000篇文本資料,經(jīng)過關(guān)鍵詞挖掘和詞頻統(tǒng)計分析,采用詞頻—逆向文件頻率(TF-IDF)算法(一種高效的文本分析技術(shù)),從中篩選出53479個詞匯。計算公式為:

TFij=nij /[n]j

IDFi=log[D] / [j:ti?dj]

TF-IDF=TF?IDF=nij /[n]j?log[D] / [j:ti?dj]

式中,TF表示詞頻(特定詞條在文檔中出現(xiàn)的次數(shù)),IDF表示逆向文檔頻率(反映詞條在語料庫中的分布情況),nij表示特定文本dj中某個字詞出現(xiàn)的次數(shù),nj表示文本dj中所有字詞出現(xiàn)次數(shù)的總和,j表示語料庫中的文件總數(shù),D表示語料庫中的文件總數(shù),[j:ti?dj]表示在語料庫中包含特定詞語ti的文本總數(shù)。一個詞語在語料庫中分布越稀疏,則其IDF就越大,說明該詞語具有較高的區(qū)分度。

TF-IDF算法已廣泛應(yīng)用于文本挖掘、信息檢索和搜索引擎優(yōu)化等領(lǐng)域[10]。TF-IDF算法得出的TF-IDF值既考慮了詞條在文本中出現(xiàn)的頻率,又考慮了詞條在整個語料庫中的分布情況,通過計算每個詞條的TF-IDF值,可對文本中的詞匯進行排序和篩選,從而提取出最具文本內(nèi)容代表性的關(guān)鍵詞匯。隨著自然語言處理技術(shù)的不斷發(fā)展,TF-IDF算法也在不斷優(yōu)化和改進。如一些研究者提出基于詞向量的TF-IDF變體,通過考慮詞匯間的語義關(guān)系來進一步提高文本表示的準(zhǔn)確性,使TF-IDF算法在處理大規(guī)模、復(fù)雜文本數(shù)據(jù)時更得心應(yīng)手。IDF中包含ti的文本總數(shù)越少,則IDF越大,說明詞語[ti]在該語料庫中具備較好的文本區(qū)分能力。TF與IDF作為文本分析中的2個基礎(chǔ)而重要的指標(biāo),為理解文本內(nèi)容、挖掘文本價值提供了有力的工具。

2.2 模型構(gòu)建與訓(xùn)練

模型構(gòu)建與訓(xùn)練階段是機器學(xué)習(xí)流程中不可或缺的核心環(huán)節(jié),在機器學(xué)習(xí)領(lǐng)域扮演著至關(guān)重要的角色,要求精心挑選適當(dāng)?shù)乃惴翱茖W(xué)確定模型架構(gòu),并運用多種策略以全面提升模型效能,確保模型能精確地捕捉輸入數(shù)據(jù)的特征,并在面對測試集時表現(xiàn)出卓越的性能。一旦模型經(jīng)過嚴(yán)格的訓(xùn)練和全面評估,便能應(yīng)用于實際情境有效解決各類機器學(xué)習(xí)問題。

2.2.1 中高職相對困難生識別指標(biāo)體系的構(gòu)建

通過利用Python的Gensim庫實現(xiàn)TF-IDF算法,構(gòu)建相對困難因素集合U,因素集U={u1,u2,…,um}。相對困難因素集可劃分為2個層次:第一層為三大相對困難影響因素,記為U={u1,u2,u3},其中,u1表示家庭年度可支配收入,u2表示學(xué)生個人年度收入,u3表示學(xué)生在?;旧畋U现С?;第二層為子目標(biāo)因素集,每個一級指標(biāo)均由若干個二級指標(biāo)構(gòu)成,二級指標(biāo)是每個一級指標(biāo)的具體子指標(biāo)。

TF-IDF算法獲取的關(guān)鍵詞顯示,涉及家庭年度可支配收入因素的主要方面為相對困難家庭父母的職業(yè)和就業(yè)狀況、家庭所在地、上學(xué)人口數(shù)、勞動人口數(shù)及父母學(xué)歷,分別記為u1={u11,u12,u13,u14,u15,u16};涉及學(xué)生個人年度收入因素的主要方面為學(xué)生性別、獎助學(xué)金、獲獎、校內(nèi)勤工儉學(xué)和社會資助,分別記為u2={u21,u22,u23,u24,u25};涉及學(xué)生在?;旧畋U现С鲆蛩氐闹饕矫鏋閷W(xué)生在校一卡通消費次數(shù)、工作日在校就餐次數(shù)、周末節(jié)假日在校就餐次數(shù)、校內(nèi)消費單價最高前30個地點的消費次數(shù)、在線支付交易次數(shù)、圖書館預(yù)期繳費次數(shù)、學(xué)雜費預(yù)期繳費次數(shù)和助學(xué)金貸款金額,分別記為u3={u31,u32,u33,u34,u35,u36,u37,u38,u39}。最終,提取到1584個關(guān)鍵詞,剔除對研究相對困難無明顯作用的高頻干擾詞匯后,篩選出900多個與風(fēng)險相關(guān)的詞匯。經(jīng)過進一步篩選,選取詞頻最高的268個詞匯代表中高職學(xué)生最關(guān)注的困難領(lǐng)域。運用扎根理論對中高職學(xué)生面臨的困難影響因素進行深入分析,通過開放性編碼、主軸編碼和選擇性編碼對這些因素進行系統(tǒng)歸納和闡述。在理論飽和度得到驗證后,構(gòu)建中高職學(xué)生相對困難影響指標(biāo)體系(表5)。

在提取中高職相對困難生識別的影響因素時,大多數(shù)指標(biāo)為類別變量,在計算特征間距時可能會出現(xiàn)不合理的特征間距。因此,需對反映家庭年度可支配收入、學(xué)生個人年度收入和在校基本生活保障支出等特征的指標(biāo)進行適當(dāng)?shù)木幋a處理。針對同一指標(biāo)所描述的不同客戶性質(zhì),將指標(biāo)按照A、B、C和D進行編碼,最終以特征向量形式綜合反映中高職相對困難生影響因素特征指標(biāo)。如家庭父母的職業(yè)可細(xì)分為農(nóng)民務(wù)農(nóng)、農(nóng)民兼營小生意、城鎮(zhèn)農(nóng)民工、個體工商戶、離退休人員、下崗待業(yè)人員、下崗再就業(yè)人員、無業(yè)人員及其他職業(yè),對此9種職業(yè)進行編碼后轉(zhuǎn)化為特征向量,以確保數(shù)據(jù)處理的科學(xué)性和準(zhǔn)確性。

2.2.2 中高職相對困難生的認(rèn)定

經(jīng)過細(xì)致的比較分析,將學(xué)生家庭經(jīng)濟狀況與教育成本間的差異或比例作為關(guān)鍵參考指標(biāo),從多個角度、全面地精準(zhǔn)識別經(jīng)濟條件相對困難的學(xué)生群體,充分考慮了困難生群體的實際情況及教育公平的深層含義。在評估經(jīng)濟困難生準(zhǔn)確性的支出法、收入法及綜合收入與支出雙指標(biāo)比值法中,綜合收入與支出雙指標(biāo)比值法具有明顯優(yōu)勢,其構(gòu)建的經(jīng)濟生活困難指數(shù)能綜合考量家庭年度可支配收入與學(xué)生個人年度收入及在?;旧畋U现С鲩g的比例關(guān)系,為精準(zhǔn)識別和幫助經(jīng)濟困難生提供科學(xué)依據(jù)。進一步通過聚類分析法,將構(gòu)建的相對困難生指數(shù)進行無監(jiān)督學(xué)習(xí),從而劃分出非困難、一般困難、中度困難和特別困難4種困難生類別[相對貧困生認(rèn)定=(家庭年度可支配金額+學(xué)生個人年度收入)/學(xué)生基本生活保障支出]作為模型的輸出層,最終完成基于深度神經(jīng)網(wǎng)絡(luò)的困難生識別(TabNet-Stacking)模型構(gòu)建。

2.3 大數(shù)據(jù)識別技術(shù)應(yīng)用的實證分析

本研究選取樸素貝葉斯模型、支持向量機(SVM)分類模型和隨機森林模型作為基準(zhǔn),對TabNet-Stacking模型進行效能評估。通過應(yīng)用困難生識別分類模型,并利用廣西中高職學(xué)生數(shù)據(jù)構(gòu)建的學(xué)生數(shù)據(jù)集,將相關(guān)特征項的值輸入深度神經(jīng)網(wǎng)絡(luò)分類模型,以完成分類任務(wù)。最終,根據(jù)模型輸出結(jié)果判定困難生的類別,從而為困難生認(rèn)定工作提供技術(shù)支持。

從圖2可看出,各困難生識別模型對困難生識別的查準(zhǔn)率均表現(xiàn)出色,其中,TabNet-Stacking模型表現(xiàn)更優(yōu)秀,對困難生的查準(zhǔn)率達(dá)82.0%,對一般困難生的查準(zhǔn)率為79.8%,對中度困難生的查準(zhǔn)率為80.0%,對特別困難生的查準(zhǔn)率為77.7%,均明顯高于樸素貝葉斯模型、支持向量機分類模型和隨機森林模型相應(yīng)的困難生查準(zhǔn)率。

從圖3可看出,TabNet-Stacking模型對非貧困生、一般貧困生、中度貧困生和特別貧困生識別的召回率分別為80.7%、78.1%、77.6%和77.4%,說明該模型識別出各類別困難生的數(shù)量明顯多于樸素貝葉斯模型、支持向量機分類模型和隨機森林模型,即在查全性能上優(yōu)于樸素貝葉斯模型、支持向量機分類模型和隨機森林模型。經(jīng)計算,TabNet-Stacking模型對非貧困生、一般貧困生、中度貧困生和特別貧困生識別準(zhǔn)確的F1值均達(dá)82.00%,明顯高于樸素貝葉斯模型、支持向量機分類模型和隨機森林模型識別準(zhǔn)確的F1值。此外,在本研究構(gòu)建的2層TabNet-Stacking模型中,TabNet-XGBoost模型所挑選的TOP15特征在模型分類過程中表現(xiàn)優(yōu)于隨機森林模型,進一步證實TabNet-XGBoost模型在特征抽取方面的卓越能力,同時,也凸顯F1值作為衡量模型查準(zhǔn)率與召回率綜合性能的核心指標(biāo)的重要性。

3 應(yīng)用與發(fā)展中高職困難生大數(shù)據(jù)識別技術(shù)的策略

本研究引入深度神經(jīng)網(wǎng)絡(luò)技術(shù)[11],通過運用網(wǎng)絡(luò)爬蟲技術(shù)和文本分析方法,從多個視角對分析流程進行梳理,并從多維度挖掘特征指標(biāo)體系構(gòu)建的TabNet-XGBoost模型,實現(xiàn)了數(shù)據(jù)挖掘技術(shù)在中高職困難生判定上的有效應(yīng)用。通過構(gòu)建的TabNet-XGBoost模型,能更準(zhǔn)確地識別真正需要幫助的學(xué)生,提高資助資源的使用效率。本研究還開發(fā)了一套涵蓋學(xué)生經(jīng)濟狀況、學(xué)習(xí)表現(xiàn)、心理狀態(tài)及家庭背景等方面的綜合評估體系,通過多維度的評估,可更全面地了解學(xué)生的實際情況,從而提供更個性化的困難生支持方案。在實際應(yīng)用中發(fā)現(xiàn),盡管大數(shù)據(jù)和AI技術(shù)在困難生識別方面具有巨大潛力[12],但也面臨數(shù)據(jù)隱私保護、算法透明度及模型泛化能力等方面的挑戰(zhàn)。因此,建議在實際應(yīng)用中應(yīng)加強數(shù)據(jù)安全和隱私保護措施[13-14],以確保學(xué)生信息安全;加強對算法的解釋,以便相關(guān)利益方能更好地理解和信任模型的決策過程。在鄉(xiāng)村振興和教育公平的大背景下,將TabNet-XGBoost模型應(yīng)用于幫助地理位置偏遠(yuǎn)農(nóng)村地區(qū)學(xué)生獲得優(yōu)質(zhì)教育資源,可提高教育的公平性,促進鄉(xiāng)村振興戰(zhàn)略實施,為農(nóng)村地區(qū)的發(fā)展提供人才支持和智力保障。

在大模型視角下,針對中高職困難生的大數(shù)據(jù)識別技術(shù)應(yīng)用與發(fā)展,提出有利于開展鄉(xiāng)村振興與教育公平研究的策略。①整合數(shù)字資源,構(gòu)建一個完整的困難生資助數(shù)據(jù)平臺,在此基礎(chǔ)上建立一個全面整合困難生橫向和縱向數(shù)據(jù)的統(tǒng)一數(shù)據(jù)庫,并通過不同部門聯(lián)網(wǎng)來確認(rèn)學(xué)生數(shù)據(jù)的真實性和有效性。②注重數(shù)據(jù)的及時更新,保障數(shù)據(jù)的時效性;因不同級別用戶對數(shù)據(jù)的訪問權(quán)限不同,需對數(shù)據(jù)的備份和共享進行分級管理[15],以防數(shù)據(jù)泄露和濫用,確保困難生的隱私安全。③未來針對中高職困難生的研究可關(guān)注如何通過大數(shù)據(jù)分析,挖掘困難生貧困背后的原因和特點,以便制定更有效的教育政策和幫扶措施。④在實施上述策略時,需考慮倫理和法律問題,如確保數(shù)據(jù)收集和處理過程的合法性,以及如何在不侵犯學(xué)生隱私的前提下合理利用數(shù)據(jù)資源;同時,在技術(shù)應(yīng)用過程中需對教師和學(xué)生進行適當(dāng)?shù)呐嘤?xùn),以提高其對新技術(shù)的接受度和使用能力。通過實施上述策略,有望更好地識別和幫助中高職困難生,為困難生提供更多發(fā)展機會,使其能更好地融入社會,實現(xiàn)自身價值[16],有助于構(gòu)建一個更公正和包容的教育環(huán)境,推動鄉(xiāng)村振興與教育公平實現(xiàn)。

4 結(jié)語

在中高職學(xué)生群體中,許多學(xué)生出身于經(jīng)濟條件較困難的家庭,其生活環(huán)境和經(jīng)濟狀況通常不盡如人意,因此,迫切需得到社會各界的關(guān)注和援助。本研究通過運用大數(shù)據(jù)分析和AI技術(shù),對傳統(tǒng)的困難生識別方法進行優(yōu)化與創(chuàng)新,構(gòu)建了一個TabNet-XGBoost模型,能在簡化資助流程的同時,有效避免“虛假困難”現(xiàn)象的發(fā)生,確保困難生獲得更精準(zhǔn)的資助,為中高職困難生的精準(zhǔn)識別和資助提供新的視角和方法,為實現(xiàn)教育公平和鄉(xiāng)村振興戰(zhàn)略實施提供重要技術(shù)支撐。未來需探討構(gòu)建針對中高職困難生的大數(shù)據(jù)識別技術(shù)應(yīng)用與發(fā)展的動態(tài)實時監(jiān)測識別系統(tǒng),以進一步利用海量數(shù)據(jù)進行深入分析和預(yù)測,發(fā)展形成一個按需、實時、動態(tài)的精準(zhǔn)資助新模式,從而提高困難生的資助效率和效果,確保資源的合理分配和使用。此外,還應(yīng)探究將AI技術(shù)與教育大數(shù)據(jù)相結(jié)合的可能性,為高校提供更科學(xué)合理的資助決策支持,從而更好地服務(wù)于困難生群體。

參考文獻(xiàn):

[1] 楊釙,金紅昊,劉海驊. 相對困難視域下“雙一流”建設(shè)高校貧困生識別策略研究[J]. 中國高教研究,2022(3):45-51.

[2] 陳麗君,林偉婷. 高職院校擴招視角下家庭與人力資本對中高職貧困生就業(yè)質(zhì)量的影響研究[J]. 高等職業(yè)教育探索,2020,19(5):38-44.

[3] 畢鶴霞. 國內(nèi)外高校貧困生認(rèn)定與研究述評[J]. 比較教育研究,2009,31(1):62-66.

[4] 黃海寧,羅偉泰,林振程. 鄉(xiāng)村振興戰(zhàn)略背景下中高職院校困難生智能識別與精準(zhǔn)幫扶策略分析[J]. 廣西糖業(yè),2024,44(5):391-396.

[5] 張茜. 多維貧困視角下中國農(nóng)村困難家庭的識別研究[D]. 北京:首都經(jīng)濟貿(mào)易大學(xué),2018.

[6] 李秋蕓. 廣西高職院校貧困生感恩教育研究[D]. 南寧:廣西師范學(xué)院,2014.

[7] 劉海燕. 心理資本視角下高職貧困生心理扶貧路徑研究[J]. 文存閱刊,2021(21):179-180.

[8] 王麗. 高職院校貧困學(xué)生挫折教育探析[D]. 濟南:山東師范大學(xué),2010.

[9] 劉艷,李純斌. 對高職學(xué)院貧困生倫理關(guān)懷的實證研究[J]. 企業(yè)家天地(下半月刊),2014(3):116-117.

[10] 蔣承,張智鑫,李笑秋. 貧困生認(rèn)定與本科生發(fā)展差異研究——基于首都高校的問卷調(diào)查[J]. 復(fù)旦教育論壇,2016,14(6):61-66.

[11] 林彬彬. 試論我國高校貧困生認(rèn)定工作中存在的問題及對策[J]. 佳木斯教育學(xué)院學(xué)報,2011(8):64-65.

[12] 吳斌珍,李宏彬,孟嶺生,等. 大學(xué)生貧困及獎助學(xué)金的政策效果[J]. 金融研究,2011(12):47-61.

[13] 楊釙,劉霄. 研究生收費前貧困資助政策的瞄準(zhǔn)和減貧效果分析——以首都高校研究生為例[J]. 教育與經(jīng)濟,2019(2):78-87.

[14] 戴海輝. 基于Hadoop的校園卡數(shù)據(jù)挖掘的研究與實現(xiàn)[D]. 南昌:南昌航空大學(xué),2017.

[15] 蒲飛,趙正輝,涂旭東,等. 基于校園一卡通數(shù)據(jù)的貧困學(xué)生消費異常數(shù)據(jù)檢測分析[J]. 電子測試,2018(6):58-60.

[16] 王衛(wèi)星,李斌. 智慧校園下利用機器學(xué)習(xí)算法實現(xiàn)高校貧困生的預(yù)測[J]. 三門峽職業(yè)技術(shù)學(xué)院學(xué)報,2019,18(1):133-140.

(責(zé)任編輯 思利華)

黃海寧,羅偉泰,林振程. 大模型視角下的中高職困難生大數(shù)據(jù)識別技術(shù)應(yīng)用及實證分析[J]. 廣西糖業(yè),2024,44(6):493-500.

DOI:10.3969/j.issn.2095-820X.2024.06.015

收稿日期:2024-10-09

基金項目:廣西教育科學(xué)“十四五”規(guī)劃學(xué)生資助專項《大數(shù)據(jù)背景下中高職院校家庭經(jīng)濟困難學(xué)生精準(zhǔn)資助路徑研究》(2022ZJY2615)

通訊作者:羅偉泰(1983-),男,博士研究生,高級工程師,主要從事信息技術(shù)研究工作,E-mail:548580230@qq.com

第一作者:黃海寧(1972-),男,高級講師,主要從事職業(yè)教育與思想政治教育研究工作,E-mail:115259816@qq.com

猜你喜歡
深度神經(jīng)網(wǎng)絡(luò)中高職教育公平
試論基于深度神經(jīng)網(wǎng)絡(luò)的汽車車型識別問題
深度神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀
中高職業(yè)英語教學(xué)大綱對比與銜接
考試周刊(2016年84期)2016-11-11 23:23:26
對特殊學(xué)生的全納教育理論與實踐研究
基于教育公平視角的少數(shù)民族義務(wù)教育發(fā)展
我國義務(wù)教育資源配置的公平問題研究
人間(2016年26期)2016-11-03 17:18:07
基于深度神經(jīng)網(wǎng)絡(luò)的身份識別研究
中高職服裝設(shè)計專業(yè)一體化課程體系建設(shè)研究
成才之路(2016年25期)2016-10-08 10:24:37
中高職一體化課程體系建設(shè)的探索與實踐
成才之路(2016年25期)2016-10-08 10:20:01
基于深度學(xué)習(xí)的目標(biāo)反饋識別系統(tǒng)
文昌市| 三亚市| 泸州市| 孝义市| 湖南省| 宜章县| 西平县| 伊通| 青田县| 扶沟县| 霸州市| 钟山县| 建宁县| 靖远县| 赫章县| 邵阳市| 太保市| 利辛县| 绥宁县| 安庆市| 三门峡市| 嘉禾县| 吉安县| 上饶县| 丰镇市| 哈密市| 竹溪县| 门头沟区| 威信县| 玉屏| 福泉市| 惠州市| 常州市| 长沙市| 镇原县| 铁岭市| 普兰县| 繁峙县| 垦利县| 依兰县| 固安县|