摘要:識別學(xué)科交叉研究的前沿主題,并對演化趨勢進行分析,有助于揭示學(xué)科交叉融合的方向,為未來創(chuàng)新性、突破性研究提供參考。首先,基于引文視角構(gòu)建測度論文學(xué)科交叉性的指標,識別具有學(xué)科交叉性的研究論文;其次,通過BERT-LDA模型識別研究主題,利用余弦相似度計算主題之間的相似度,構(gòu)建主題演化路徑;最后,基于新穎度、增長性、關(guān)注度、影響力構(gòu)建前沿主題識別指標體系,識別具有前沿性的學(xué)科交叉研究主題。以圖書情報學(xué)(Library and Information Science,LIS)為例展開研究,研究結(jié)果顯示,2004—2023年該學(xué)科領(lǐng)域的交叉研究主題呈現(xiàn)出逐漸細化和深入的特點,主要集中在信息挖掘與知識發(fā)現(xiàn)、互聯(lián)網(wǎng)信息行為、醫(yī)療信息學(xué)3個方面;現(xiàn)階段學(xué)科交叉研究前沿主題為醫(yī)療數(shù)據(jù)模型、輿情治理與情感分析、機器學(xué)習(xí)與深度學(xué)習(xí);基于信息技術(shù)的研究方法和其在不同領(lǐng)域的應(yīng)用研究具有良好的應(yīng)用前景,有可能成為未來LIS領(lǐng)域的核心研究主題。
關(guān)鍵詞:研究前沿;主題演化;學(xué)科交叉;BERT-LDA;主題識別;圖書情報學(xué);信息科學(xué);圖書館學(xué)
中圖分類號:G353.1 DOI:10.3772/j.issn.1673-2286.2024.09.001
引文格式:袁毅,孟盈. 基于BERT-LDA的國外LIS領(lǐng)域?qū)W科交叉研究演化分析與前沿主題識別[J]. 數(shù)字圖書館論壇,2024,20(9):1-15.
學(xué)科交叉的概念可以追溯到20世紀初,目前學(xué)界普遍接受的是2004年美國國家科學(xué)院提出的定義,它強調(diào)將不同學(xué)科領(lǐng)域的知識、方法和理論相結(jié)合,以解決那些超出單一學(xué)科范圍或研究實踐領(lǐng)域的問題,推動科學(xué)進步[1]。復(fù)旦大學(xué)校長、中國科學(xué)院院士金力[2]在報告中提到,百余年來的諾貝爾獎獲獎?wù)哂?1.02%屬于交叉學(xué)科,尤其是21世紀以來,跨學(xué)科成果占半數(shù)以上。學(xué)科交叉已經(jīng)成為科學(xué)研究范式變革的一個重要基礎(chǔ),不僅成為領(lǐng)域顛覆性技術(shù)的重要源頭,還形成了諸多前沿研究熱點。主題識別和演化分析有助于從微觀角度識別和挖掘這些研究熱點,幫助研究人員了解各領(lǐng)域研究的發(fā)展全貌和演變趨勢,并通過研究前沿識別預(yù)測未來研究的發(fā)展走向。
圖書情報學(xué)(Library and Information Science,LIS)作為一門學(xué)科形成于20世紀70年代,由傳統(tǒng)圖書館學(xué)(Library Science)和源自文獻學(xué)(Documentation)的信息科學(xué)(Information Science)融合而成[3]。LIS與我國的圖書情報學(xué)科有較大程度的重合。2022年9月,“圖書情報與檔案管理”一級學(xué)科正式更名為“信息資源管理”。信息資源管理學(xué)科的發(fā)展本身就是不同學(xué)科交叉融合的結(jié)果,學(xué)科的交叉融合為信息資源管理學(xué)科的研究帶來了更先進的理論、方法與技術(shù)支持[4]。識別國外LIS領(lǐng)域?qū)W科交叉研究的前沿主題并分析研究主題的演化趨勢,對于我國信息資源管理學(xué)科的跨學(xué)科發(fā)展具有一定啟示意義。因此,本文提出以下研究問題。
(1)國外LIS領(lǐng)域的研究論文與哪些學(xué)科產(chǎn)生交叉?交叉融合的發(fā)展趨勢有什么特征?
(2)國外LIS領(lǐng)域的學(xué)科交叉研究主題有哪些?呈現(xiàn)出怎樣的演化趨勢?
(3)國外LIS領(lǐng)域的學(xué)科交叉研究前沿是什么?如何理解前沿主題的融合模式以提供學(xué)科發(fā)展的思路和方向?
為了解決以上問題,本研究選取2004—2023年國外LIS領(lǐng)域的學(xué)科交叉研究為數(shù)據(jù)來源,分析其與各學(xué)科交叉程度的變化趨勢;同時基于BERT-LDA方法識別學(xué)科交叉研究主題,提供更加豐富的語義表示,量化分析研究主題的演化特征,并構(gòu)建新穎度、增長性、關(guān)注度、影響力4個指標來識別研究前沿,以期幫助研究人員了解領(lǐng)域內(nèi)的研究發(fā)展趨勢和脈絡(luò),促進跨學(xué)科的交流合作。
1 相關(guān)研究
1.1 LIS領(lǐng)域?qū)W科交叉研究
學(xué)術(shù)界圍繞LIS領(lǐng)域的學(xué)科交叉開展了大量研究。馬巖等[5]通過對中外LIS領(lǐng)域期刊論文研究方法的研究,發(fā)現(xiàn)研究方法的跨學(xué)科性逐漸明顯,為圖書館學(xué)和情報學(xué)研究提供了更為多元和豐富的研究路徑;Chang等[6]采用直接引用、數(shù)目耦合、共同作者分析3種文獻計量方法識別1978—2007年LIS領(lǐng)域研究的學(xué)科交叉演化情況,該項研究表明LIS領(lǐng)域跨學(xué)科性正在增強;Figuerola等[7]使用LDA主題建模方法分析1978—2014年LIS領(lǐng)域的研究進展,揭示出19個重要研究主題,并將其歸納為過程、技術(shù)、圖書館和特定領(lǐng)域的信息應(yīng)用4個主要范疇,同時發(fā)現(xiàn)LIS領(lǐng)域越來越呈現(xiàn)出多學(xué)科特征,與特定領(lǐng)域(商業(yè)、醫(yī)療、法律、教育)相結(jié)合的研究論文數(shù)量呈現(xiàn)顯著增長的趨勢,使LIS領(lǐng)域比原先更寬泛也更深入;Huang等[8]使用直接引用法和合作者分析法比較了1978—2007年信息科學(xué)的跨學(xué)科演變過程,發(fā)現(xiàn)信息科學(xué)學(xué)者引用最多的是LIS領(lǐng)域出版物,其共同作者主要也來自LIS領(lǐng)域;宋艷輝等[9]使用關(guān)鍵詞分析北美LIS領(lǐng)域和中國LIS領(lǐng)域博士學(xué)位論文的學(xué)科交叉特征,研究表明北美LIS領(lǐng)域與信息管理相關(guān)的主題頻次呈現(xiàn)上升態(tài)勢,而與傳統(tǒng)圖書館學(xué)相關(guān)的主題頻次增長放緩。
通過梳理文獻發(fā)現(xiàn),國內(nèi)外學(xué)者關(guān)于LIS領(lǐng)域?qū)W科交叉的研究成果較為豐富,但仍存在一定的局限性。在研究方法上,現(xiàn)有關(guān)于研究主題識別的研究多停留在文獻外部特征(如關(guān)鍵詞等)層面,較少通過機器學(xué)習(xí)和深度學(xué)習(xí)等算法考慮語義關(guān)聯(lián)關(guān)系,進而深入抽取文獻潛在的核心內(nèi)容;在研究對象上,由于國內(nèi)外的LIS領(lǐng)域并不是完全等同的關(guān)系,做對比研究時會存在一定偏差;在研究內(nèi)容上,雖然學(xué)科交叉主題識別的研究成果較為豐富,但少有研究涉及研究主題的演化分析及研究前沿的識別。
1.2 主題識別方法
當前主題識別的方法主要有關(guān)鍵詞識別法、引文分析法、文本挖掘法。在基于關(guān)鍵詞的研究主題識別中,研究人員通常通過詞頻分析[10]、關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)[11]、關(guān)鍵詞聚類[12]等方法,從關(guān)鍵詞之間的關(guān)聯(lián)關(guān)系中發(fā)現(xiàn)研究主題,挖掘深層次的知識價值。引文分析法通過分析學(xué)術(shù)文獻中的引用關(guān)系來揭示文獻之間的交互作用和影響,根據(jù)引用關(guān)系類型的不同可分為共被引分析[13]、文獻耦合分析[14]和直接引用分析[15]3種。美國科學(xué)情報研究所推出的ESI(Essential Science Indicators)數(shù)據(jù)庫使用共被引分析法,成功將全球科技文獻劃分為22個專業(yè)領(lǐng)域進行前沿分析,被多國廣泛用于跟蹤學(xué)科發(fā)展的動態(tài)趨勢[16]。我國公開發(fā)布的研究前沿報告,如中國工程院的《全球工程前沿》、中國科學(xué)院的《研究前沿》、中國農(nóng)業(yè)科學(xué)院的《全球農(nóng)業(yè)研究熱點前沿》等,同樣以共被引分析為核心方法來識別文獻主題。在大數(shù)據(jù)和人工智能技術(shù)的加持下,文本挖掘法作為數(shù)據(jù)挖掘的一個重要分支,逐漸在信息檢索、自然語言處理等領(lǐng)域取得顯著進展。相較于傳統(tǒng)的關(guān)鍵詞識別法,文本挖掘法不僅能夠捕捉和處理豐富的語義信息,理解詞匯之間的關(guān)聯(lián)、語境及深層含義,也彌補了引文分析法時間滯后性的不足,為研究主題的識別提供了新的思路和方法。文本挖掘法中主題概率模型最具代表性,如:范云滿等[17]基于LDA主題模型探測文檔集中的新興主題;馮佳[18]將LDA主題模型與主題強度、新穎度指標相結(jié)合,為大數(shù)據(jù)環(huán)境下的研究前沿的識別提供了方法借鑒。雖然LDA模型已在主題建模領(lǐng)域被學(xué)者們廣泛應(yīng)用,但也存在一些劣勢,即LDA模型假設(shè)文檔是由詞袋表示的,忽略了單詞之間的順序和上下文信息,無法捕捉到單詞之間的語義關(guān)聯(lián)。已有研究證明BERT模型在捕捉上下文語義關(guān)聯(lián)上的能力[19],將BERT模型的詞向量作為輸入,可以為LDA模型提供更豐富的語義表示,提高主題建模的準確性[20]。
本研究擬通過BERT-LDA方法識別國外LIS領(lǐng)域的學(xué)科交叉研究主題,提高主題識別結(jié)果的準確性。
2 研究設(shè)計
本研究提出一個學(xué)科交叉研究前沿主題識別框架(見圖1),核心內(nèi)容包括如下5個部分:學(xué)科交叉論文界定、數(shù)據(jù)預(yù)處理、學(xué)科交叉研究主題識別、學(xué)科交叉研究主題演化分析、學(xué)科交叉研究前沿主題識別。
2.1 學(xué)科交叉論文界定
引用與被引用關(guān)系是學(xué)科間知識流動最直接的體現(xiàn),國內(nèi)外學(xué)者常利用引文分析法對不同領(lǐng)域和學(xué)科間的知識流動情況、規(guī)律或趨勢展開研究[21]。因此,選擇從引文視角識別學(xué)科交叉論文。Stirling提出學(xué)科交叉多樣性測量的3個維度,即豐富性(Variety)、平衡性(Balance)和差異性(Disparity),被認為是比較成熟的測度指標[22]。其中:豐富性用于衡量論文引文涵蓋的學(xué)科廣度,學(xué)科數(shù)量越多,論文本身的學(xué)科交叉性越強;平衡性用于衡量各學(xué)科的貢獻均衡度,使用香農(nóng)均勻度來表示;差異性用來計算論文引文中不同學(xué)科之間的差異程度,通常使用學(xué)科之間的相似系數(shù)來計算,如果學(xué)科間的相似系數(shù)較?。ㄈ缟虡I(yè)和農(nóng)學(xué)),那么認為學(xué)科之間的差異性較大,學(xué)科交叉程度更高。Leydesdorff等[23]在此基礎(chǔ)上設(shè)計了一個新指標DIV來測量學(xué)科交叉多樣性。相對豐富性、平衡性、差異性和DIV的計算公式如式(1)~式(4)所示。
2.4 研究前沿指標體系構(gòu)建
普萊斯(D. J. Price)于1965年首次提出了研究前沿這一概念,認為引文網(wǎng)絡(luò)中最近的、被廣泛引用的文獻集合就是活躍的研究前沿[24-25]。前沿主題識別的研究中產(chǎn)生了諸多測量的指標,如新穎度、增長性、關(guān)注度、影響力等,研究者為這些指標制定了具體的測度方法,如新穎度是通過評估某主題的參考文獻及其引用的知識基礎(chǔ)的發(fā)表時間來界定的[26]。本研究綜合考慮學(xué)術(shù)界的普遍認知,將研究前沿定義為那些蘊含巨大發(fā)展?jié)摿?、正處于興起階段且未來可能吸引廣泛注意力的研究主題或領(lǐng)域,通常具有前瞻性、影響力、成長性[27]。為了更精準地衡量研究主題的前沿性,結(jié)合本研究數(shù)據(jù)源的獨特性質(zhì),從以下4個維度對研究主題的前沿性進行測度。
3 數(shù)據(jù)采集與結(jié)果分析
3.1 數(shù)據(jù)獲取
根據(jù)2023年版JCR(JournaI Citation Reports)的Information Science Library Science分區(qū),選擇影響因子排名前21的外文期刊為數(shù)據(jù)來源,期刊信息如表1所示。獲取WOS數(shù)據(jù)庫中2004—2023年發(fā)表在這21種期刊上的所有論文,經(jīng)過對數(shù)據(jù)的處理和篩選,去除無摘要、重復(fù)、空白、不符合要求的數(shù)據(jù)后,共獲得24 206篇有效論文。
為了得到論文參考文獻所屬學(xué)科信息,從WOS數(shù)據(jù)庫下載文獻的題錄數(shù)據(jù),包含標題、作者、摘要、參考文獻等,使用Leydesdroff[28]開發(fā)的WOS文獻題錄信息處理程序isi.exe對每篇論文的參考文獻信息進行提取,以得到參考文獻所在期刊信息。由于isi.exe提取的參考文獻信息是期刊名稱的縮寫,需要借助WOS的ESI數(shù)據(jù)庫進行全稱與縮寫的對照。
得到論文參考文獻所在期刊后,還需要對每篇參考文獻的所屬學(xué)科進行識別。JCR數(shù)據(jù)庫提供了收錄的期刊信息,涵蓋期刊名稱、ISSN、語言、所屬學(xué)科等,使用自編程序關(guān)聯(lián)信息后,最終得到論文、參考文獻、期刊全稱、學(xué)科類別對照表,示例如表2所示。
3.2 LIS領(lǐng)域?qū)W科交叉論文確定
為了進一步識別研究主題及演化趨勢,將所收集到的數(shù)據(jù)劃分為4個時間窗口:2004—2008年、2009—2013年、2014—2018年、2019—2023年?;谑剑?)~式(4)編寫Python程序,分別計算每篇論文的相對豐富性、平衡性、差異性、DIV指標,其中學(xué)科間的距離由Chavarro等[29]構(gòu)建的學(xué)科相似度矩陣得到。LIS領(lǐng)域的論文學(xué)科交叉測度結(jié)果如表3所示。根據(jù)學(xué)科交叉論文遴選原則,將綜合指標數(shù)值排名數(shù)據(jù)集前50%的論文作為學(xué)科交叉論文。
根據(jù)學(xué)科交叉論文識別結(jié)果,參考Biglan[30]提出的學(xué)科分類框架,將LIS領(lǐng)域論文的參考文獻劃分至19個具體領(lǐng)域(不包含LIS),分別為數(shù)學(xué)、物理學(xué)、生物學(xué)、計算機科學(xué)、工程學(xué)、醫(yī)學(xué)、環(huán)境科學(xué)、藝術(shù)學(xué)、歷史學(xué)、語言學(xué)、哲學(xué)、人文地理、人類學(xué)、心理學(xué)、社會學(xué)、管理學(xué)、經(jīng)濟學(xué)、法學(xué)、教育學(xué)。
在學(xué)科交叉論文遴選的基礎(chǔ)上,進一步對參考文獻所屬學(xué)科進行引用重要程度統(tǒng)計,計算不同學(xué)科類別的參考文獻數(shù)量在每篇論文參考文獻中的占比,以更清楚地了解LIS領(lǐng)域研究的學(xué)科交叉情況。結(jié)果顯示,計算機科學(xué)、管理學(xué)、經(jīng)濟學(xué)、醫(yī)學(xué)、心理學(xué)、社會學(xué)、工程學(xué)、人文地理、環(huán)境科學(xué)是LIS領(lǐng)域的核心交叉學(xué)科。為了深入了解學(xué)科交叉隨時間變化的趨勢,選取上述9個學(xué)科進行演化分析,計算該學(xué)科類別所有參考文獻占比的平均值作為該年度的學(xué)科引用占比,分析結(jié)果如圖2所示??梢钥闯?,計算機科學(xué)始終是LIS領(lǐng)域的重要研究主題,為LIS領(lǐng)域研究提供技術(shù)支撐,促進了“問題域-方法論”交叉模式的形成[31]。同時,在信息規(guī)模不斷擴大的趨勢下,各個領(lǐng)域的信息內(nèi)容越來越容易獲取,LIS領(lǐng)域的研究范式和理論方法可以更廣泛地用于解決其他應(yīng)用領(lǐng)域的研究問題,LIS與心理學(xué)、社會學(xué)、工程學(xué)、環(huán)境科學(xué)的交叉研究越來越受到重視[32]。隨著研究問題的不斷深入和拓展,結(jié)合實踐發(fā)展的需求,“方法論-問題域”交叉模式將有望轉(zhuǎn)變成“問題域-問題域”,促進新興交叉學(xué)科的形成[33]。
3.3 LIS領(lǐng)域?qū)W科交叉研究主題識別
在識別學(xué)科交叉研究主題方面,將論文的標題和摘要作為分析內(nèi)容,經(jīng)過一系列數(shù)據(jù)預(yù)處理步驟后使用BERT-LDA模型進行主題識別及抽取,通過困惑度計算最佳主題數(shù)量,進行K-means聚類提取核心研究主題。對于每一個識別出的研究主題,選擇概率排名前10的詞作為該主題的主題詞,最終在4個時間窗口分別識別出了80、80、120、140個主題詞,并依據(jù)這些主題詞的含義總結(jié)歸納得到8、8、12、14個研究主題。為了更直觀地展示和理解這些主題,進一步深入分析主題詞含義和該主題下的代表性論文,結(jié)合每個主題詞在相應(yīng)主題中的權(quán)重,對每一個主題進行命名,如表4所示。
為了驗證本研究所使用方法的科學(xué)性,進一步利用主題一致性對BERT-LDA模型效果做出檢驗,同時對比單獨使用LDA、BERT進行學(xué)科交叉研究主題識別的效果,3種建模方法的識別效果對比如表5所示。可以看出BERT-LDA方法的一致性值為0.552,優(yōu)于其他兩種方法,意味著本研究所使用的建模方法在學(xué)科交叉研究主題識別方面有較好的效果。
3.4 LIS領(lǐng)域?qū)W科交叉的演化分析
為了深入探討LIS領(lǐng)域?qū)W科交叉研究主題的演化路徑,通過Python程序計算相鄰時間窗口主題之間的相似度,將所有主題間相似度的平均值作為篩選的閾值,選擇具有高相似度的主題進行可視化分析,演化路徑如圖3所示。
基于主題識別得到的研究主題分布和演化路徑可以看出,LIS領(lǐng)域4個時間窗口內(nèi)的學(xué)科交叉研究主題之間存在著緊密的聯(lián)系。健康信息服務(wù)、健康信息分析、醫(yī)療數(shù)據(jù)模型等主題聚焦于醫(yī)療領(lǐng)域的信息應(yīng)用,且技術(shù)手段隨著時間的推移不斷升級,推動了醫(yī)療服務(wù)的信息化、數(shù)字化、智能化發(fā)展。從信息處理的角度出發(fā),科學(xué)計量、知識抽取、技術(shù)識別與預(yù)測、機器學(xué)習(xí)與深度學(xué)習(xí)研究主題的演變代表了信息挖掘與知識發(fā)現(xiàn)的核心研究方向,研究目標聚焦于利用技術(shù)手段從海量數(shù)據(jù)中提取有價值的信息和知識,助力LIS領(lǐng)域發(fā)展。此外,從T1的搜索引擎、信息檢索與用戶行為到T4的社交媒體、輿情治理與情感分析,可以看出互聯(lián)網(wǎng)的信息行為也始終是研究的核心主題,學(xué)者們通過研究特定話題下的信息行為、情感表達和社會關(guān)系揭示互聯(lián)網(wǎng)信息傳播的規(guī)律和事件觀點,進而提出營造網(wǎng)絡(luò)信息環(huán)境和治理網(wǎng)絡(luò)輿情的相關(guān)建議。因此,2004—2023年LIS領(lǐng)域?qū)W科交叉研究主題的核心研究方向可歸納為信息挖掘與知識發(fā)現(xiàn)、互聯(lián)網(wǎng)信息行為和醫(yī)療信息學(xué)。其中:信息挖掘與知識發(fā)現(xiàn)是計算機科學(xué)、統(tǒng)計學(xué)等領(lǐng)域的研究方法在信息處理方面的研究應(yīng)用,方法體系的不斷完善使其可以對各個領(lǐng)域的信息進行處理;由于網(wǎng)絡(luò)信息涉及的領(lǐng)域范圍較廣,目前關(guān)于信息傳播與分析的研究已擴展至政治、醫(yī)學(xué)、金融、環(huán)境等多個領(lǐng)域,即通過信息行為的研究范式為不同背景下的信息傳播提供應(yīng)對策略;醫(yī)療信息學(xué)則是學(xué)科交叉背景下產(chǎn)生的新興交叉學(xué)科,研究人員通過分析和討論醫(yī)學(xué)領(lǐng)域的信息數(shù)據(jù)為其提供解決方案,目前已形成較為成熟的研究體系。
(1)信息挖掘與知識發(fā)現(xiàn)。此類論文主要是LIS與計算機技術(shù)、統(tǒng)計學(xué)、應(yīng)用數(shù)學(xué)的交叉,研究對象包括科研論文、專利數(shù)據(jù)、網(wǎng)絡(luò)信息等。各階段的研究主題演化圖如圖4所示。以科學(xué)和技術(shù)層面的信息挖掘為例,在T1階段,科學(xué)計量和科學(xué)出版與影響力評估是研究的重點,研究主要集中在對科學(xué)論文的計量、分析以及科研成果的評估上。知識圖譜作為一種基于圖的數(shù)據(jù)結(jié)構(gòu),被廣泛應(yīng)用于科學(xué)知識的展示和分析[34]。進入T2階段,研究重心逐漸轉(zhuǎn)向科學(xué)計量與算法的結(jié)合,算法的發(fā)展為科學(xué)計量提供了更強大的分析工具,使得研究人員能夠更精確地分析科學(xué)數(shù)據(jù),揭示科學(xué)發(fā)展的內(nèi)在規(guī)律[35]。同時,算法的應(yīng)用也開始在政策制定和科技發(fā)展領(lǐng)域發(fā)揮重要作用[36]。T3階段,在信息技術(shù)的加持下,研究者們開始利用數(shù)據(jù)挖掘技術(shù),從海量的數(shù)據(jù)中提取有價值的信息和模式,以揭示用戶行為、知識傳播、技術(shù)創(chuàng)新等蘊含的潛在特征和演變趨勢[37-38]。而在T4階段,越來越多的學(xué)者嘗試將機器學(xué)習(xí)、深度學(xué)習(xí)等應(yīng)用于產(chǎn)學(xué)研項目(論文、專利、基金)的研究,以識別科研發(fā)展趨勢,提高模型準確率;技術(shù)預(yù)測也進一步拓展至金融[39]、市場[40]、地理[41]、醫(yī)療[42]等領(lǐng)域,信息挖掘的應(yīng)用領(lǐng)域愈發(fā)多元化,如LSTM與ST-ResNet算法的結(jié)合被用來預(yù)測時空流量,為城市發(fā)展和交通管理提供了更加精準和有效的解決方案[43]??傮w而言,隨著計算機技術(shù)的不斷發(fā)展,計算機科學(xué)領(lǐng)域的相關(guān)方法為LIS領(lǐng)域的研究提供了愈發(fā)高效和精準的技術(shù)工具,推進LIS領(lǐng)域研究范式變革與知識升級。
(2)互聯(lián)網(wǎng)信息行為。此核心主題的研究路徑可概括為“信息系統(tǒng)用戶行為—行為動機與信息策略—社交媒體信息行為—網(wǎng)絡(luò)輿情傳播與治理”,各階段的研究主題演化圖如圖5所示。在T1階段,信息檢索與用戶行為、信息技術(shù)與信息服務(wù)是研究的重點,研究者普遍關(guān)注如何更有效地從海量信息中檢索到所需的內(nèi)容,探索更有效的信息組織和可視化方法,以提升用戶體驗和信息展示的效果,便于獲取信息。到T2階段,研究重點擴展至搜索引擎與排名推薦,研究者開始關(guān)注各種情景下用戶的心理和行為特征,試圖基于信息行為領(lǐng)域的研究范式分析用戶意圖、心理機制和行為動機,以更準確地滿足用戶的個性化需求。T3階段,信息傳播的重要渠道從搜索引擎轉(zhuǎn)變成社交媒體,以推特為代表的社交媒體平臺上的內(nèi)容開始受到廣泛關(guān)注。用戶行為的相關(guān)研究逐漸轉(zhuǎn)向社交媒體平臺上的輿情傳播、情感分析等研究問題,分析社交媒體上的信息流動和用戶行為能夠揭示公眾的觀點和情感傾向,便于輿情治理[44]。在T4階段,輿情仍然是研究的熱點,研究人員也愈發(fā)關(guān)注輿情傳播過程中與傳播后的治理策略,期望改善信息傳播環(huán)境[45]。隨著研究范圍的不斷擴展、學(xué)科間的深入交叉融合,相關(guān)研究主題也逐漸擴展至政治選舉新聞、科技政策發(fā)布、氣候變化、金融發(fā)展等領(lǐng)域,交叉模式有望從“方法論-問題域”轉(zhuǎn)向“問題域-問題域”,促進新興交叉學(xué)科的產(chǎn)生[46]。研究人員通過情感分析對博文、推文、新聞等社交媒體內(nèi)容進行深入洞察,以了解公眾對于氣候變化、政治政策變化等熱點話題的情感態(tài)度和看法[47-48],為政策制定者、企業(yè)等提供更加精準和有價值的參考??傮w而言,在互聯(lián)網(wǎng)信息行為這一主題的核心演化路徑上,學(xué)科交叉研究呈現(xiàn)出研究領(lǐng)域和研究問題逐漸多元化的特點,研究人員發(fā)現(xiàn)了LIS領(lǐng)域的方法論在其他領(lǐng)域應(yīng)用的可能性,且這種研究范式的應(yīng)用有望促成新的交叉學(xué)科領(lǐng)域產(chǎn)生。
(3)醫(yī)療信息學(xué)。隨著公眾對健康問題的日益重視和健康需求的不斷增長,LIS領(lǐng)域的研究范疇逐漸擴展到健康信息領(lǐng)域,研究問題聚焦于健康醫(yī)療信息系統(tǒng)的開發(fā)、健康大數(shù)據(jù)的深入分析以及健康信息行為模式的探索。從圖6可以看出,T1階段的健康信息服務(wù)主題在T2階段轉(zhuǎn)向具體的應(yīng)用領(lǐng)域,如醫(yī)療信息系統(tǒng)、健康信息分析。醫(yī)療信息系統(tǒng)是提升醫(yī)療服務(wù)和決策效率的信息化工具[49],電子健康記錄作為其重要的組成部分,實現(xiàn)了患者信息的電子化存儲、傳輸和共享,使得醫(yī)療信息的存儲、檢索和使用變得更為便捷和高效,為醫(yī)療服務(wù)提供了更加全面和準確的數(shù)據(jù)支持。到了T3階段,健康信息分析的研究和應(yīng)用進一步深化,同時在線醫(yī)療社區(qū)逐漸興起,平臺上的信息內(nèi)容成為健康信息行為研究的重要依據(jù)。以技術(shù)為媒介的在線醫(yī)療社區(qū)為患者和醫(yī)生提供了更加便捷的交流和互動平臺,使患者能夠更加方便地獲取健康知識和醫(yī)療建議,進一步縮小了城鄉(xiāng)健康差距[50]。進入T4階段,在機器學(xué)習(xí)等算法模型的支持下,研究者開始廣泛利用電子健康記錄或醫(yī)療健康系統(tǒng)中的數(shù)據(jù)進行建模,以此評估患者風(fēng)險和識別疾病特征,預(yù)測患者可能出現(xiàn)的健康風(fēng)險,形成系統(tǒng)的醫(yī)療解決方案,為醫(yī)生提供決策支持[51-53]。區(qū)塊鏈技術(shù)的應(yīng)用則為醫(yī)療信息資源的組織、管理、傳播和利用帶來了更高的安全性和可靠性,通過去中心化、分布式存儲和加密機制,確保了數(shù)據(jù)的完整性和隱私性。如Zou等[54]提出了一種基于區(qū)塊鏈技術(shù)的電子醫(yī)療系統(tǒng),在推動跨機構(gòu)數(shù)據(jù)共享的同時加強了隱私保護,提高診斷和治療的準確性和效率。
3.5 LIS領(lǐng)域?qū)W科交叉的前沿主題識別
為了進一步識別LIS領(lǐng)域內(nèi)具有前沿性的研究主題,依據(jù)前文2.4節(jié)所構(gòu)建的研究前沿指標體系,根據(jù)每個主題下的論文計算主題的新穎度、增長性、關(guān)注度、影響力,選擇各項指標得分均高于平均值的主題為研究前沿主題,最終識別出4個階段的研究前沿主題,如表6所示。
根據(jù)識別結(jié)果,T1階段的前沿主題主要聚焦于信息技術(shù)和信息服務(wù)領(lǐng)域,主要交叉學(xué)科為計算機科學(xué)、心理學(xué),研究者們普遍關(guān)注信息技術(shù)如何賦能信息服務(wù)領(lǐng)域。T2階段的前沿主題進一步聚焦于科學(xué)計量、算法優(yōu)化、政策與技術(shù)發(fā)展。算法是數(shù)據(jù)處理和分析的核心工具,其研究和發(fā)展對于推動領(lǐng)域進步具有關(guān)鍵作用,在分類、聚類、引文分析、影響力評估等方面幫助科研人員更精確地分析科學(xué)數(shù)據(jù)[55]。除了研究數(shù)據(jù)外,政策支持下的技術(shù)發(fā)展同樣是研究者們重點關(guān)注的課題,技術(shù)發(fā)展往往與經(jīng)濟發(fā)展密切相關(guān),如何挖掘科技文本中的關(guān)鍵信息以推動科技創(chuàng)新與社會進步是相關(guān)學(xué)者廣泛關(guān)注的問題,相關(guān)研究拓寬了LIS領(lǐng)域研究方法論的應(yīng)用視角[56]。
T3階段的前沿主題更加多元化,包括社交媒體、健康信息分析、科學(xué)計量。研究信息行為的情境逐漸從傳統(tǒng)轉(zhuǎn)向各種社交媒體,社交媒體情境下的研究涉及用戶行為、信息傳播機制等多個方面,研究話題分布于政治、政策、環(huán)境、健康等多個領(lǐng)域,結(jié)合心理學(xué)相關(guān)理論和知識收集并分析用戶發(fā)表的網(wǎng)絡(luò)信息有助于了解公眾信息感知和信息行為的成因和影響因素,從而方便相關(guān)主體采取干預(yù)措施[57-58]。電子健康記錄記載著患者個人信息、病歷信息等,為疾病診斷和預(yù)測提供了豐富的研究數(shù)據(jù),研究人員通常需要使用信息技術(shù)對電子健康記錄中的信息進行深入挖掘和處理分析,以進一步完成疾病檢測、臨床預(yù)測、藥物劑量檢測等研究工作,為醫(yī)學(xué)領(lǐng)域的信息服務(wù)質(zhì)量提升提供支持,促進交叉學(xué)科研究的進一步深入[59]。
T4階段的前沿主題聚焦于醫(yī)療數(shù)據(jù)模型、輿情治理與情感分析、機器學(xué)習(xí)與深度學(xué)習(xí)。相比前一階段的研究前沿,規(guī)模逐漸增長的海量醫(yī)學(xué)信息為醫(yī)療數(shù)據(jù)模型的建立提供了數(shù)據(jù)基礎(chǔ),促進其在醫(yī)療數(shù)據(jù)的挖掘與分析、健康管理系統(tǒng)的構(gòu)建、疾病預(yù)測與診斷等方面的應(yīng)用,使醫(yī)療數(shù)據(jù)模型逐漸成為推動健康信息學(xué)領(lǐng)域決策與創(chuàng)新的強大引擎[42]。輿情分析仍是此階段的研究前沿,相關(guān)研究大多基于信息行為的研究范式,利用新興算法模型對公眾意見和情感進行監(jiān)測和分析,如何及時發(fā)現(xiàn)并監(jiān)測特定領(lǐng)域和特定話題下的網(wǎng)絡(luò)輿情、降低輿情給公眾的負面影響是研究者正在關(guān)注和重視的問題,交叉學(xué)科更加多元化[45]。機器學(xué)習(xí)和深度學(xué)習(xí)作為人工智能領(lǐng)域的重要分支,在信息檢索、文本挖掘、趨勢預(yù)測、信息抽取等方面展現(xiàn)出了巨大的應(yīng)用潛力[43],為LIS領(lǐng)域的信息計量、行為分析、情報分析提供了新的方法。
綜合以上識別結(jié)果,可以看到數(shù)據(jù)挖掘、機器學(xué)習(xí)和深度學(xué)習(xí)等研究正在不斷突破技術(shù)大關(guān),研究粒度不斷細化,研究方法逐漸深入,為LIS領(lǐng)域的數(shù)據(jù)處理、信息分析和知識發(fā)現(xiàn)提供了新的思路和方法。同時,以網(wǎng)絡(luò)輿情研究為代表的信息分析推動了LIS與計算機科學(xué)、醫(yī)學(xué)、經(jīng)濟學(xué)、地理學(xué)等更多學(xué)科的深度融合,方法論所應(yīng)用的研究領(lǐng)域正在不斷豐富。此外,醫(yī)療健康與信息分析的結(jié)合也正在促使健康信息學(xué)這一交叉學(xué)科的形成,推動LIS領(lǐng)域向縱深拓展,幫助解決人民健康的實際問題。
4 結(jié)語
本研究以WOS數(shù)據(jù)庫中LIS領(lǐng)域內(nèi)2004—2023年的學(xué)術(shù)論文為數(shù)據(jù)源,借助學(xué)科交叉測度指標篩選出具有跨學(xué)科特征的論文數(shù)據(jù),采用BERT-LDA主題模型識別LIS領(lǐng)域的研究主題,同時借助主題相似度計算各階段主題的相似性,繪制演化路徑,并在此基礎(chǔ)上基于新穎度、增長性、關(guān)注度、影響力4個指標計算研究主題的前沿性,得出如下研究結(jié)論:①從學(xué)科交叉情況來看,LIS與其他學(xué)科的交叉研究主要集中于計算機科學(xué)、管理學(xué)、經(jīng)濟學(xué)、醫(yī)學(xué)、心理學(xué)、社會學(xué)、工程學(xué)、人文地理、環(huán)境科學(xué)等學(xué)科,計算機科學(xué)始終是LIS領(lǐng)域研究的技術(shù)支撐,且LIS與其他學(xué)科領(lǐng)域的交叉研究正在不斷拓展和延伸;②2004—2023年LIS領(lǐng)域?qū)W科交叉研究有3條主要的演化路徑,分別是信息挖掘與知識發(fā)現(xiàn)、互聯(lián)網(wǎng)信息行為、醫(yī)療信息學(xué),且研究呈現(xiàn)出“整合—分裂”的模式,學(xué)科方法論的應(yīng)用領(lǐng)域正在逐漸細化;③現(xiàn)階段的學(xué)科交叉研究的前沿主題主要聚焦于3個方面,即醫(yī)療數(shù)據(jù)模型、輿情治理與情感分析、機器學(xué)習(xí)與深度學(xué)習(xí)??偟膩碚f,當前LIS領(lǐng)域的學(xué)科交叉研究主題正在不斷突破技術(shù)大關(guān),基于信息技術(shù)的研究方法和其在不同領(lǐng)域的應(yīng)用將是未來一段時間內(nèi)研究者首要關(guān)注的方向。
本研究選擇國外LIS領(lǐng)域的重要期刊論文作為研究對象,識別核心交叉學(xué)科,分析學(xué)科交叉研究前沿主題和演化路徑,可以為國內(nèi)信息資源管理領(lǐng)域的研究發(fā)展提供創(chuàng)新思路和應(yīng)用指導(dǎo)。
參考文獻
[1] National Academy of Sciences. Facilitating interdisciplinary research[M]. Washington,DC:National Academies Press,2005.
[2] 金力. 金力:學(xué)科交叉已成為高水平科研與頂尖人才的重要特征[EB/OL]. [2024-03-10]. https://fddi.fudan.edu.cn/c9/8c/ c18965a444812/page.htm.
[3] 于良芝,樊振佳. 信息處理進路:LIS學(xué)科獨特性再探究[J]. 情報資料工作,2020,41(5):5-13.
[4] 馬捷,何美慧,馮文,等. 交叉與邊界:論信息資源管理跨學(xué)科發(fā)展策略[J]. 數(shù)字圖書館論壇,2024(1):1-12.
[5] 馬巖,鄭建明,劉佳靜. 2023年LIS期刊論文研究方法應(yīng)用態(tài)勢[J]. 圖書館論壇,2024,44(8):8-13.
[6] CHANG Y W,HUANG M H. A study of the evolution of interdisciplinarity in library and information science:using three bibliometric methods[J]. Journal of the American Society for Information Science and Technology,2012,63(1):22-33.
[7] FIGUEROLA C G,GARCíA MARCO F J,PINTO M. Mapping the evolution of library and information science(1978–2014)using topic modeling on LISA[J]. Scientometrics,2017,112(3):1507-1535.
[8] HUANG M H,CHANG Y W. A study of interdisciplinarity in information science:using direct citation and co-authorship analysis[J]. Journal of Information Science,2011,37(4):369-378.
[9] 宋艷輝,朱李,舒非,等. 中美圖情學(xué)博士學(xué)位論文主題跨學(xué)科發(fā)展比較研究[J]. 情報學(xué)報,2022,41(5):536-548.
[10] CHEN C M. CiteSpace II:detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the American Society for Information Science and Technology,2006,57(3):359-377.
[11] CALLON M,COURTIAL J P,TURNER W A,et al. From translations to problematic networks:an introduction to coword analysis[J]. Social Science Information,1983,22(2):191-235.
[12] 郝晉清,王珺. 主題-時序視域下中國圖書館學(xué)會年會主題分布及演化分析[J]. 圖書情報工作,2019,63(2):107-119.
[13] SMALL H. Co-citation in the scientific literature:a new measure of the relationship between two documents[J]. Journal of the American Society for Information Science,1973,24(4):265-269.
[14] KESSLER M M. Bibliographic coupling between scientific papers[J]. American Documentation,1963,14(1):10-25.
[15] GARFIELD E. Citation indexes in sociological and historical research[J]. American Documentation,1963,14(4):289-291.
[16] 王小梅,鄧啟平,李國鵬,等. ESI研究前沿的科學(xué)圖譜及在納米領(lǐng)域的應(yīng)用[J]. 圖書情報工作,2017,61(12):106-112.
[17] 范云滿,馬建霞. 基于LDA與新興主題特征分析的新興主題探測研究[J]. 情報學(xué)報,2014,33(7):698-711.
[18] 馮佳. 研究前沿識別與分析方法研究[D]. 長春:吉林大學(xué),2017.
[19] 王秀紅,高敏. 基于BERT-LDA的關(guān)鍵技術(shù)識別方法及其實證研究:以農(nóng)業(yè)機器人為例[J]. 圖書情報工作,2021,65(22):114-125.
[20] 趙月華,朱思成,蘇新寧. 面向網(wǎng)絡(luò)虛假醫(yī)療信息的識別模型構(gòu)建研究:一種基于預(yù)訓(xùn)練的BERT模型[J]. 情報科學(xué),2021,39(12):165-173.
[21] 范晴晴,李長玲,榮國陽,等. 跨學(xué)科輸入知識對學(xué)科發(fā)展的影響力分析:以圖書情報學(xué)科為例[J]. 情報科學(xué),2023,41(2):79-85.
[22] 韓正琪,劉小平,徐涵. 基于Rao-Stirling指數(shù)的學(xué)科交叉文獻發(fā)現(xiàn):以納米科學(xué)與納米技術(shù)為例[J]. 圖書情報工作,2018,62(1):125-131.
[23] LEYDESDORFF L,WAGNER C S,BORNMANN L. Interdisciplinarity as diversity in citation patterns among journals:Rao-Stirling diversity,relative variety,and the Gini coefficient[J]. Journal of Informetrics,2019,13(1):255-269.
[24] PRICE D J D S. Networks of scientific papers:the pattern of bibliographic references indicates the nature of the scientific research front[J]. Science,1965,149(3683):510-515.
[25] 張雪,張志強,曹玲靜,等. 學(xué)科領(lǐng)域研究前沿識別方法研究進展[J]. 圖書情報工作,2022,66(12):139-151.
[26] GUO H N,WEINGART S,B?RNER K. Mixedindicators model for identifying emerging research areas[J]. Scientometrics,2011,89(1):421-435.
[27] 陳穩(wěn),陳偉. 科學(xué)與技術(shù)對比視角下的前沿主題識別與演化分析[J]. 情報雜志,2022,41(1):67-73,163.
[28] LEYDESDROFF L. Words and co-words as indicators of intellectual organization[J]. Research Policy,1989,18(4):209-223.
[29] CHAVARRO D,TANG P,RAFOLS I. Interdisciplinarity and research on local issues:evidence from a developing country[J]. Research Evaluation,2014,23(3):195-209.
[30] BIGLAN A. The characteristics of subject matter in different academic areas[J]. Journal of Applied Psychology,1973,57(3):195-203.
[31] 馬費成,張帥. 我國圖書情報領(lǐng)域新興交叉學(xué)科發(fā)展探析[J]. 中國圖書館學(xué)報,2023,49(2):4-14.
[32] STACHOFSKY J,SCHAUPP L C,CROSSLER R E. Measuring the effect of political alignment,platforms,and fake news consumption on voter concern for election processes[J]. Government Information Quarterly,2023,40(3):101810.
[33] DWIVEDI Y K,HUGHES L,KAR A K,et al. Climate change and COP26:are digital technologies and information management part of the problem or the solution?an editorial reflection and call to action[J]. International Journal of Information Management,2022,63:102456.
[34] ORTEGA J L,AGUILLO I F. Visualization of the Nordic academic web:link analysis using social network tools[J]. Information Processing Management,2008,44(4):1624-1633.
[35] BRANDTZ?G P B. Social networking sites:their users and social implications—a longitudinal study[J]. Journal of Computer-Mediated Communication,2012,17(4):467-488.
[36] CHEN Y L,CHIU Y T. An IPC-based vector space model for patent retrieval[J]. Information Processing Management,2011,47(3):309-322.
[37] VALVERDE-REBAZA J C,ROCHE M,PONCELET P,et al. The role of location and social strength for friendship prediction in location-based social networks[J]. Information Processing Management,2018,54(4):475-489.
[38] REKIK R,KALLEL I,CASILLAS J,et al. Assessing web sites quality:a systematic literature review by text and association rules mining[J]. International Journal of Information Management,2018,38(1):201-216.
[39] YANG Y,QIN Y,F(xiàn)AN Y Y,et al. Unlocking the power of voice for financial risk prediction:a theory-driven deep learning design approach[J]. MIS Quarterly,2023,47(1):63-96.
[40] PEREIRA M M,F(xiàn)RAZZON E M. A data-driven approach to adaptive synchronization of demand and supply in omnichannel retail supply chains[J]. International Journal of Information Management,2021,57:102165.
[41] SAEEDIMOGHADDAM M,STEPINSKI T F. Automatic extraction of road intersection points from USGS historical map series using deep convolutional neural networks[J]. International Journal of Geographical Information Science,2020,34(5):947-968.
[42] ZHANG Z Q,YAN C,ZHANG X M,et al. Forecasting the future clinical events of a patient through contrastive learning[J]. Journal of the American Medical Informatics Association,2022,29(9):1584-1592.
[43] REN Y B,CHEN H F,HAN Y,et al. A hybrid integrated deep learning model for the prediction of citywide spatio-temporal flow volumes[J]. International Journal of Geographical Information Science,2020,34(4):802-823.
[44] TURCOTTE J,YORK C,IRVING J,et al. News recommendations from social media opinion leaders:effects on media trust and information seeking[J]. Journal of ComputerMediated Communication,2015,20(5):520-535.
[45] LIU J,LIU L Y,TU Y,et al. Multi-stage Internet public opinion risk grading analysis of public health emergencies:an empirical study on microblog in COVID-19[J]. Information Processing Management,2022,59(1):102796.
[46] PAPAGIANNIDIS S,MARIKYAN D. Environmental sustainability:a technology acceptance perspective[J]. International Journal of Information Management,2022,63:102445.
[47] UPADHYAYA A,F(xiàn)ISICHELLA M,NEJDL W. Towards sentiment and temporal aided stance detection of climate change tweets[J]. Information Processing Management,2023,60(4):103325.
[48] WILSON C. The socialization of civic participation norms in government?:assessing the effect of the open government partnership on countries’ e-participation[J]. Government Information Quarterly,2020,37(4):101476.
[49] MENON N M,YAYLACICEGI U,CEZAR A. Differential effects of the two types of information systems:a hospitalbased study[J]. Journal of Management Information Systems,2009,26(1):297-316.
[50] GOH J M,GAO G G,AGARWAL R. The creation of social value:can an online health community reduce rural-urban health disparities?[J]. MIS Quarterly,2016,40(1):247-263.
[51] LIU X K,CHUBAK J,HUBBARD R A,et al. SAT:a surrogate-assisted two-wave case boosting sampling method,with application to EHR-based association studies[J]. Journal of the American Medical Informatics Association,2022,29(5):918-927.
[52] WEIR C R,TABER P,TAFT T,et al. Feeling and thinking:can theories of human motivation explain how EHR design impacts clinician burnout?[J]. Journal of the American Medical Informatics Association,2021,28(5):1042-1046.
[53] LIU S R,SCHLESINGER J J,MCCOY A B,et al. New onset delirium prediction using machine learning and long short-term memory(LSTM)in electronic health record[J]. Journal of the American Medical Informatics Association,2022,30(1): 120-131.
[54] ZOU R P,LV X X,ZHAO J S. SPChain:blockchain-based medical data sharing and privacy-preserving eHealth system[J]. Information Processing Management,2021,58(4):102604.
[55] YANG P,GAO W,TAN Q,et al. A link-bridged topic model for cross-domain document classification[J]. Information Processing Management,2013,49(6):1181-1193.
[56] SOURBATI M. The digital switchover as an information society initiative:the role of public policy in promoting access to digital ICTs[J]. Telematics and Informatics,2011,28(4):295-302.
[57] YANG J,ROJAS H,WOJCIESZAK M,et al. Why are“others” so polarized?perceived political polarization and media use in 10 countries[J]. Journal of Computer-Mediated Communication,2016,21(5):349-367.
[58] YAQUB U,CHUN S A,ATLURI V,et al. Analysis of political discourse on twitter in the context of the 2016 US presidential elections[J]. Government Information Quarterly,2017,34(4):613-626.
[59] XIAO C,CHOI E,SUN J M. Opportunities and challenges in developing deep learning models using electronic health records data:a systematic review[J]. Journal of the American Medical Informatics Association,2018,25(10):1419-1428.
作者簡介
袁毅,女,博士,教授,博士生導(dǎo)師,研究方向:信息計量、互聯(lián)網(wǎng)信息資源管理。
孟盈,女,碩士研究生,通信作者,研究方向:信息組織,E-mail:1123517193@qq.com。
Evolutionary Analysis and Frontier Identification of Interdisciplinary Research in Foreign LIS Field Based on BERT-LDA
YUAN Yi MENG Ying
(School of Economics and Management, East China Normal University, Shanghai 200062, P. R. China)
Abstract: Identifying interdisciplinary research frontier topics and analyzing evolutionary trends can help reveal the direction of interdisciplinary integration, and provide references for future innovative and breakthrough research. Firstly, based on the perspective of citation, we construct indicators to measure the interdisciplinary nature of research papers, and identify research papers with interdisciplinary nature. Secondly, we use the BERT-LDA model to identify research topics, calculate the similarity between topics using cosine similarity, and construct topic evolution paths. Finally, we construct a research frontier topic identification index system that includes topic novelty, topic growth, topic attention, and topic influence to identify interdisciplinary research topics with cutting-edge characteristics. This paper takes the Library and Information Science (LIS) discipline as an example to conduct research. The results show that interdisciplinary research topics in this field from 2004 to 2023 have gradually become more refined and in-depth, mainly focusing on information mining and knowledge discovery, Internet information behavior, and medical informatics. At present, the interdisciplinary topics of medical data model, public opinion governance and sentiment analysis, and machine learning and deep learning have cutting-edge characteristics. Research methods based on information technology and their applications in different fields have good application prospects and may become the core research topics in the future field of LIS.
Keywords: Research Frontier; Topic Evolution; Interdisciplinarity; BERT-LDA; Topic Identification; LIS; Information Science; Library Science
(責任編輯:王瑋)