摘 要:本研究引入一種新的跨學科知識整合方法,即KIDDT(Knowledge Integration for Diverse Disciplinary Teams)算法,并通過一系列試驗評估其在多模態(tài)學習環(huán)境中的性能。采用3種不同的模型,分別使用K-Means聚類算法、主成分分析和支持向量機、以及深度學習神經網絡(CNN),對比它們的準確率和生成時間,深入研究了算法在不同條件下的表現(xiàn)。試驗結果表明,在不同數(shù)據(jù)塊數(shù)量和突變概念飄移影響下,3種模型展現(xiàn)出不同的性能特征。使用CNN的模型三在準確率方面表現(xiàn)出色,尤其在突變概念飄移的環(huán)境中更穩(wěn)定,由于生成時間較長,因此在實際應用中需要在準確性和效率之間進行權衡。
關鍵詞:人工智能;多模態(tài)數(shù)據(jù);跨學科
中圖分類號:G 202" " " " " 文獻標志碼:A
人工智能(AI)技術已經滲透到各個領域中。隨著知識圖譜和跨學科研究的興起,如何在多模態(tài)學習環(huán)境中整合跨學科知識成為一個備受關注的課題。在這個背景下引用相關文獻,更好地理解并探討多模態(tài)學習環(huán)境中的跨學科知識整合。過去的研究已經在知識圖譜的構建、學科教學知識構建和跨庫知識整合等方面取得了一系列重要成果。曾曉玲等[1]研究了基于黃河資源整合共享的知識圖譜,為資源整合方面提供了啟示。劉冬萍等[2]在課堂切片與診斷方面的研究以及王素月等[3]對教師整合人工智能的學科教學知識建構的研究為后續(xù)提供了寶貴的經驗,有一定參考價值。
1 知識整合
1.1 算法概述
KIDDT(Knowledge Integration and Dynamic-Teaching Algorithm for Domain Transfer)算法的核心思想是自適應學習和語義關聯(lián)的融合。該算法構建1個多維知識空間來整合不同學科的知識。這個多維知識空間中的每個維度都對應一個特定的學科。用K來表示這個多維知識空間,其中Kij表示第i個學科和第j個知識維度的關聯(lián)。其大小為m×n,其中m表示學科的數(shù)量,n表示知識的維度。
在自適應學習過程中,引入一個自適應學習矩陣W,其目的是在知識整合的過程中自動調整權重,使不同學科的知識能夠得到合理整合。Wij的計算過程如公式(1)所示。
(1)
式中:Wij為自適應學習矩陣中的元素;i和j分別為學科的索引。Kik和 Kkj分別為學科i和學科j在知識空間中的向量表示的元素。求和符號表示對所有知識維度k進行求和。
公式(1)的核心思想是通過計算知識空間中不同學科之間的余弦相似度來更新權重。在更新過程中,相似度較高的學科之間的權重會得到提高,而相似度較低的學科之間的權重則會相應降低。這樣,KIDDT算法就能夠根據(jù)知識空間的動態(tài)變化自適應地調整權重,從而對知識進行有效整合。
1.2 多模態(tài)信息關聯(lián)
在多模態(tài)學習環(huán)境中面對的不是單一類型的數(shù)據(jù)或信息,而是多種模態(tài)的混合體。將視覺、聽覺和文字等多模態(tài)信息表示為向量V、A、T,它們分別對應視覺、聽覺和文字學科的知識。為了進行信息關聯(lián),定義1個關聯(lián)矩陣R,其目的是捕捉不同模態(tài)之間的語義關聯(lián)。關聯(lián)矩陣的更新過程如公式(2)所示。
(2)
式中:Rij為模態(tài)i和模態(tài)j之間的關聯(lián)。tanh是一種常見的非線性激活函數(shù)。它能夠更好地捕捉信息之間的復雜關系,通常用于神經網絡中。TVA為視覺模態(tài)V與聽覺模態(tài)A之間的交互。
通過內積運算,它捕捉了視覺信息和聽覺信息之間的相關性。TAT為聽覺模態(tài)A和文字模態(tài)T之間的交互。通過內積運算,它衡量了聽覺信息和文字信息之間的關聯(lián)程度。TTV為文字模態(tài)T和視覺模態(tài)V之間的交互。通過內積運算,它描述了文字信息和視覺信息之間的相關性。
在多模態(tài)學習中,各種信息之間的關系往往是非線性的,因此引入非線性映射是必要的。
在這類領域的相關研究中,更多研究也探討了基于知識庫的知識整合與知識管理。盧利農等討論了知識庫整合與知識指紋設計[4]。張喜征等對碎片化知識整合的知識圖譜構建進行分析[5]?;诖?,在多模態(tài)學習環(huán)境中,理解和整合不同模態(tài)之間的關聯(lián)是至關重要的,而KIDDT算法提供了一個有效的工具來實現(xiàn)該目標。
1.3 復雜性分析
時間復雜度衡量的是算法運行所需的時間與輸入規(guī)模之間的關系。在KIDDT算法中,學科數(shù)量、知識維度和模態(tài)數(shù)量都會影響算法的運行時間。KIDDT 算法的時間復雜度如公式(3)所示。
OTC=O(mn2+pn2)" " " " " " " " (3)
式中: OTC為時間復雜度;O為復雜度;m為學科數(shù)量;n為知識維度;p為模態(tài)數(shù)量。這個公式涵蓋了算法中的不同計算部分,包括自適應學習矩陣的更新、多模態(tài)信息的關聯(lián)等。從公式(3)可以看出,算法的時間復雜度與學科數(shù)量、知識維度和模態(tài)數(shù)量的平方成正比。說明隨著這些參數(shù)增加,算法的運行時間也會相應增加??臻g復雜度則衡量了算法所需存儲空間的大小。在KIDDT算法中,需要存儲自適應學習矩陣、關聯(lián)矩陣以及不同模態(tài)的向量表示等信息??臻g復雜度如公式(4)所示。
OSC=O(mn+pn) (4)
式中:OSC為時間復雜度;m為學科數(shù)量;n為知識維度;p為模態(tài)數(shù)量。
公式(4)包括了自適應學習矩陣、關聯(lián)矩陣以及不同模態(tài)向量表示所需的存儲空間??臻g復雜度與學科數(shù)量、知識維度和模態(tài)數(shù)量的線性關系成正比。這類知識管理體系對實踐應用相關知識來說有重要價值,例如李占雷等對知識管理能力的差異性和企業(yè)商業(yè)模式創(chuàng)新影響進行分析[6]?;诖?,相應復雜度分析結果也說明隨著這些參數(shù)增加,算法所需的存儲空間也會相應增加。
2 測試結果
2.1 測試用模型
為了評估KIDDT算法在多模態(tài)學習環(huán)境中的性能,在試驗環(huán)境中對其進行測試。為了全面了解多模態(tài)數(shù)據(jù)經過進一步降維過程的差別,采用3種不同的模型進行測試。模型一基于K-Means聚類算法,它是一種無監(jiān)督學習方法,通過迭代尋找數(shù)據(jù)的簇中心,將數(shù)據(jù)點劃分到不同的簇。這種方法在知識整合的初步階段非常有效,能夠幫助人們了解數(shù)據(jù)的內在結構和模式。通過K-Means聚類,可以將多模態(tài)數(shù)據(jù)劃分為若干個簇,每個簇代表一個知識領域或主題。模型二結合了主成分分析和支持向量機的方法。主成分分析(PCA)是一種降維技術,它通過線性變換將原始特征轉換為新的特征集合,新特征按照方差從大到小的順序排列。這樣做的目的是提取數(shù)據(jù)的主要特征,去除冗余和無關的信息,使數(shù)據(jù)更加簡潔和易于處理。而支持向量機(SVM)則是一種分類算法,用于識別數(shù)據(jù)中的模式和分類任務。通過結合PCA和SVM,模型二能夠利用多模態(tài)信息,考慮數(shù)據(jù)的降維處理,進行有效分類和模式識別。模型三采用深度學習神經網絡,特別是卷積神經網絡(CNN)。深度學習算法在圖像識別、語音識別和自然語言處理等領域廣泛應用。 因為CNN能夠自動學習數(shù)據(jù)的特征表示,所以特別適合處理圖像等多模態(tài)數(shù)據(jù)。通過訓練,CNN可以識別出圖像中的邊緣、紋理等低級特征以及更高級別的抽象特征。模型三利用深度學習網絡實現(xiàn)了更復雜的語義關聯(lián),能夠更準確地整合多模態(tài)知識。
2.2 準確率對比
為了直觀地展示不同模型在多模態(tài)學習環(huán)境中的準確率,進行對比試驗。試驗結果如圖1所示。
從圖1中可以看出,模型一在數(shù)據(jù)塊較小的情況下,與模型二的表現(xiàn)相似。因為數(shù)據(jù)規(guī)模較小,所以模型一和模型二都能夠較好地處理數(shù)據(jù)并提取有效信息。隨著數(shù)據(jù)塊數(shù)量增加,模型一的準確率逐漸穩(wěn)定,表現(xiàn)出對更大規(guī)模數(shù)據(jù)的適應能力。這說明K-Means聚類算法處理大規(guī)模多模態(tài)數(shù)據(jù)時仍能保持較好的性能。模型二在數(shù)據(jù)塊數(shù)量較小的情況下表現(xiàn)稍好,但在大規(guī)模數(shù)據(jù)下準確率趨于穩(wěn)定。模型二對中等規(guī)模的數(shù)據(jù)塊來說有更好的適應性。結合主成分分析和支持向量機的模型二能夠更全面地利用多模態(tài)信息,因此在大規(guī)模數(shù)據(jù)下仍能保持一定的準確率。模型三在整個試驗過程中都表現(xiàn)出最高的準確率。尤其在大規(guī)模數(shù)據(jù)下,模型三的性能與其他模型相比更出色。這可能是因為深度學習神經網絡能夠自動學習多模態(tài)數(shù)據(jù)的特征表示,所以能更好地捕捉不同模態(tài)之間的復雜關系。深度學習網絡通過訓練能夠提取更高級別的特征表示,從而提高了知識整合的準確性。試驗結果表明,KIDDT算法在多模態(tài)學習環(huán)境中能夠有效整合不同模態(tài)的信息,并在更大規(guī)模的數(shù)據(jù)塊下最大程度地提高性能。模型三的準確率優(yōu)勢可能源于其更復雜的語義關聯(lián)模型,能夠更好地捕捉多模態(tài)信息之間的復雜關系。
2.3 生成時間對比
除了準確率,生成時間也是評估算法性能的重要指標之一。為了全面了解KIDDT算法在多模態(tài)學習環(huán)境中的生成時間表現(xiàn),對此進行試驗,并記錄當數(shù)據(jù)塊數(shù)量不同時,模型一、模型二和模型三的生成時間,如圖2所示。從圖2可以看出,模型一的生成時間隨數(shù)據(jù)塊數(shù)量增加逐漸增加。與模型二和模型三相比,模型一在所有數(shù)據(jù)塊數(shù)量下的生成時間都較短。這可能是因為模型一是一種相對簡單和高效的算法,采用K-Means聚類算法對數(shù)據(jù)塊的生成速度較快。模型二在初始數(shù)據(jù)塊數(shù)量下的生成時間較快。隨著數(shù)據(jù)塊數(shù)量增加,生成時間逐漸延長,且趨勢比模型一更顯著。因為模型二結合了主成分分析和支持向量機的方法,所以需要進行更多計算和數(shù)據(jù)處理,生成時間相對較長。模型三在所有數(shù)據(jù)塊數(shù)量下都展現(xiàn)出最長的生成時間。在較大規(guī)模數(shù)據(jù)下,其生成時間的增長趨勢也更明顯。因為模型三采用深度學習神經網絡,需要進行復雜的特征學習和模式識別,所以增加了計算成本,延長生成時間。從生成時間的結果可以看出,模型三在準確率上表現(xiàn)出了顯著的優(yōu)勢,但同時生成時間也更長。在實際應用中,須根據(jù)具體需求來權衡模型的準確性和生成時間。在某些對實時性要求較高的場景中,模型一或模型二可能更合適;而在對知識整合精度要求較高的情況下,模型三則能夠提供更好的性能。
2.4 考慮突變概念飄移的準確率對比
突變概念飄移是指當學習系統(tǒng)中的數(shù)據(jù)分布發(fā)生明顯變化時的現(xiàn)象。在學習過程中,如果訓練數(shù)據(jù)的統(tǒng)計特性發(fā)生顯著改變,那么學習模型可能會失效,導致性能下降。這種變化是由外部因素、數(shù)據(jù)源變更和環(huán)境演變等因素引起的,模型在新的數(shù)據(jù)分布下難以適應。由于市場需求變化、新技術的引入或環(huán)境變遷,因此學習系統(tǒng)可能面臨各種概念的快速變化。為了保證模型在不同情境下的穩(wěn)健性,測試突變概念飄移是至關重要的。同時,對突變概念飄移進行測試有助于增強學習系統(tǒng)的魯棒性。魯棒的系統(tǒng)能夠處理未知的數(shù)據(jù)變化,從而更好地適應新的任務和環(huán)境。本文在引入突變概念飄移的基礎上進一步進行測試,結果如圖3所示。
在突變概念飄移的影響下,模型一的準確率整體呈上升趨勢。盡管初始準確率相對較低,但是隨著數(shù)據(jù)塊數(shù)量增加,模型逐漸適應了突變概念飄移。模型二在突變概念飄移下的準確率相對較高,但是當數(shù)據(jù)塊數(shù)量增加時,準確率波動較大。模型二可能對突變概念飄移的適應性有一定局限。模型三在所有數(shù)據(jù)塊數(shù)量下的準確率均為最高。尤其在突變概念飄移的情況下,與其他模型相比,模型三表現(xiàn)更穩(wěn)定。試驗結果表明,KIDDT算法在突變概念飄移影響下仍能有效整合不同模態(tài)的信息,并在更大規(guī)模數(shù)據(jù)塊下取得更好的性能。模型三在突變概念飄移的環(huán)境中的穩(wěn)定性更強,說明其對概念變化的適應性更好。
3 結論
本研究引入KIDDT算法,成功探索了在多模態(tài)學習環(huán)境中跨學科知識整合的新途徑。試驗證明,利用該算法能夠更好地整合不同學科領域的知識,為學習者提供更豐富、全面的學習體驗。在教育領域,為未來人工智能在多領域應用中的發(fā)展提供有益的經驗和思路。本研究的成果能夠促進跨學科研究的合作,推動人工智能技術在教育和其他領域的創(chuàng)新應用。未來將繼續(xù)改進算法,提高對突變概念飄移的適應性,以更好地滿足實際應用的需求。這項研究為跨學科合作、人工智能教育和知識整合領域的發(fā)展提供有益的指導。
參考文獻
[1]曾曉玲,張弓.基于黃河資源整合共享的知識圖譜研究和應用[J].人民黃河,2021,43(增刊2):282-284.
[2]劉冬萍,張海,崔宇路,等.課堂切片與診斷:基于TPACK“六邊模型”的圖譜分析新視角[J].遠程教育雜志,2021,39(2):95-102.
[3]王素月,羅生全.教師整合人工智能的學科教學知識建構[J].湖南師范大學教育科學學報,2021,20(4):68-74.
[4]盧利農,祝忠明,張旺強,等.基于Lingo3G聚類算法的機構知識庫跨庫知識整合與知識指紋服務實現(xiàn)[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2021,5(5):127-132.
[5]張喜征,羅文,蔡月月.基于知識圖譜的用戶生成內容平臺中碎片化知識整合研究[J].科技管理研究,2019,39(5):159-165.
[6]李占雷,霍帆帆,霍朝光.商業(yè)模式創(chuàng)新男女有別?——基于知識管理視角[J].華東經濟管理,2017,31(10):128-135.