苑秋辰,楊浩杰,麻盛淼,沈晨,梁濤
(中國醫(yī)學科學院 北京協(xié)和醫(yī)學院 護理學院,北京 100144)
2021年我國工業(yè)和信息化部提出要加強基礎學科和前沿學科建設,促進新興交叉學科發(fā)展以提高社會建設水平[1],因此“醫(yī)工交叉”已成為推進護理學科發(fā)展的新思路和必然趨勢[2]。美國早在1988年和2008年分別開展護理信息學和護理工程學培養(yǎng)計劃[3],是第一個落實護理交叉學科培養(yǎng)的國家。美國國家科學基金會(National Science Foundation,NSF)的資助領域覆蓋廣,在推動美國科學發(fā)展中扮演關(guān)鍵角色[4],因此其資助項目能反映美國科學研究的政策引領和發(fā)展方向,同時,促進跨學科研究也是NSF的重要優(yōu)先事項[5]。近年來Python已成為最受歡迎的編程語言之一,其代表性的網(wǎng)絡爬蟲、機器學習和數(shù)據(jù)挖掘等技術(shù)已初步應用到醫(yī)療衛(wèi)生領域中[6-7]。本研究旨在以創(chuàng)新的研究方法借助Python的網(wǎng)絡爬蟲和自然語言處理技術(shù)對NSF中護理-信息-工程學科相關(guān)資助項目進行分析,探索護理-信息-工程學未來的發(fā)展趨勢,為后續(xù)研究提供參考。
1.1 數(shù)據(jù)來源 計算機檢索NSF官網(wǎng)(https://nsf.gov/awardsearch/advancedSearch.jsp),選擇高級檢索,在補充信息中按關(guān)鍵詞分別檢索“nursing”“nurse”“care”“caring”,選擇活躍資助和到期資助,不設時間范圍。納入標準:(1)項目主題與護理領域相關(guān);(2)項目使用了信息學或工程學相關(guān)的技術(shù)。排除標準:(1)項目主題為動物或植物;(2)所得數(shù)據(jù)的關(guān)鍵字段(項目編號、項目標題、摘要等)有缺失值。
1.2 研究工具 Python是一種易于學習,功能強大,免費、開源、靈活的解釋型編程語言[8]。網(wǎng)絡爬蟲是指通過編程實現(xiàn)程序模擬人操作瀏覽器上網(wǎng),并在網(wǎng)站中批量獲取數(shù)據(jù)信息的過程[9]。隱含狄利克雷分布(latent Dirichlet allocation,LDA)是一類貝葉斯層次主題模型,屬于無監(jiān)督機器學習算法中的一種[10],作為高效的自然語言處理模型之一,在醫(yī)療衛(wèi)生領域已被應用于社交媒體平臺中相關(guān)主題的文本分析[11-12]。
1.3 研究方法
1.3.1 數(shù)據(jù)采集與存儲及篩選 使用Python的requests模塊對上述網(wǎng)站的公開數(shù)據(jù)進行采集,包括每個項目的編號、標題、NSF資助機構(gòu)、摘要、開始日期、項目負責人、資助金額等;使用csv模塊將爬取的數(shù)據(jù)保存至本地。根據(jù)納入和排除標準對數(shù)據(jù)進行篩選。
1.3.2 數(shù)據(jù)清洗及格式規(guī)范 使用Python的pandas模塊讀取csv文件,將每個項目的標題和摘要拼接,用re模塊中的正則表達式去掉數(shù)據(jù)中的網(wǎng)頁標簽,將字符串類型的數(shù)據(jù)全部轉(zhuǎn)換為小寫,將復數(shù)詞和動詞轉(zhuǎn)化為原形。使用python的jieba模塊對拼接后的數(shù)據(jù)進行分詞,并去除停用詞。
1.3.3 詞袋模型建立及主題數(shù)量確定 使用Python中g(shù)ensim模塊的corpora和doc2bow方法將每個項目數(shù)據(jù)的分詞列表轉(zhuǎn)化為詞袋模型[13]。使用gensim、math和matplotlib模塊根據(jù)傳入的詞袋模型繪制困惑度(perplexity,P)-主題數(shù)量(number of topic,NT)關(guān)系圖以確定主題數(shù)量,當主題數(shù)量為某一值時P出現(xiàn)極大值拐點,且此后P-NT曲線逐步趨于平緩,則認為此時的這個值為該詞袋模型的最佳主題數(shù)量[13]。
1.3.4 LDA模型建立及可視化分析 使用Python中g(shù)ensim模塊的LDAmodel方法對上述詞袋模型進行主題聚類分析,并使用LDAvis模塊繪制主題間距離圖進行可視化效果評估,圖中灰色氣泡表示該主題的詞袋,氣泡越大則詞袋中單詞數(shù)量越多,當各氣泡間均無重疊區(qū)域時,認為此LDA模型達最優(yōu)效,主題的相關(guān)性(relevance,r)最好。
1.3.5 各主題代表詞數(shù)量確定 借助文獻計量學方法中的齊夫定律[14]選定詞袋中高頻詞的數(shù)量。
2.1 NSF資助項目概況 經(jīng)檢索和篩選,共資助護理-信息-工程學項目265項,時間跨度為1988年至2023年,累計資助金額約合6.87億元人民幣。每年立項數(shù)量及資助金額整體呈上升趨勢,詳見圖1。統(tǒng)計NSF資助金額最高的前10個項目,涵蓋護理管理、老年護理、社區(qū)護理、孕產(chǎn)婦護理等,技術(shù)層面包括增強現(xiàn)實、自動化分析、智能互聯(lián)、活動感知分析、可穿戴設備、新型引流裝置等,詳見表1。NSF資助學部方面,分別有科技創(chuàng)新與合作學部(91項,34.3%),計算機信息科學與工程學部(81項,30.5%),社會行為與經(jīng)濟學部(54項,20.3%),工程學部(27項,10.1%),科學、技術(shù)、工程和醫(yī)藥(science, technology, engineering and medicine,STEM)教育學部(3項,1.1%),教育與人力資源學部(3項,1.1%),主任辦公室(3項,1.1%),生物科學學部(2項,0.7%),數(shù)學與物理科學學部(1項,0.3%)。
表1 NSF資助護理-信息-工程項目金額前10個項目
圖1 NSF每年資助項目數(shù)量和資助金額
2.2 主題數(shù)量確定 使用Python建立詞袋模型并繪制P-NT關(guān)系圖。當NT為6時P出現(xiàn)明顯的極大值拐點,且此后P-NT曲線變化逐漸減小且逐步趨于平緩;使用Python繪制主題間距離圖如圖2所示,發(fā)現(xiàn)當NT為6時,各灰色氣泡間均無重疊區(qū)域。因此本研究將模型擬抽取的最終主題數(shù)量定為6個。
Topic 1:智能技術(shù)在患者安全管理中的研究;Topic 2:面向患者的護理大數(shù)據(jù)系統(tǒng)的研發(fā);Topic 3:護士健康及輔助決策工具的研發(fā);Topic 4:虛擬現(xiàn)實技術(shù)在護理教育中的應用;Topic 5:傳感器和無線輔助設備的研發(fā);Topic 6:機器人在醫(yī)院工作流程中的應用
2.3 各主題命名及所含高頻詞 使用Python對本研究詞袋中出現(xiàn)的詞進行統(tǒng)計,共涌現(xiàn)2153個詞,依據(jù)上述齊夫定律公式計算得出,前65個出現(xiàn)頻次最多的詞為高頻詞,由于本研究已確定分6個主題,因此平均每個主題納入出現(xiàn)頻次最多的前11個詞,詳見表2。
表2 各主題名稱及所含高頻詞
3.1 NSF資助護理-信息-工程學項目力度整體上升 本研究顯示,NSF資助護理-信息-工程學項目數(shù)量和資助金額整體呈上升趨勢。美國馬里蘭大學最早于1988年成立護理信息學碩士培養(yǎng)類型[3],自此護理-信息交叉項目資助開始起步,而2008年麻省大學阿默斯特分校創(chuàng)立護理工程學博士培養(yǎng)類型后[3],護理-工程學交叉項目融入NSF資助計劃中。2019年至今,隨著范德堡大學、約翰霍普金斯大學等先后開展護理工程學博士或碩士培養(yǎng)類型后[3],NSF對于護理-信息-工程學項目資助力度也隨之達到高峰,4年間資助項目93項(35%),資助金額3600余萬美金(36%)。在NSF資助學部方面,科技創(chuàng)新與合作學部和計算機信息科學與工程學部共涵蓋172項,占比達65%,同時工程學部單獨立27項,反映出計算機信息技術(shù)為工程學技術(shù)在護理領域中的初步發(fā)展提供了基礎。建議我國護理領域保持信息化技術(shù)發(fā)展的同時,不斷拓寬視野,與工程學專業(yè)人員合作,借助現(xiàn)有信息化技術(shù)和平臺搭載相關(guān)工程技術(shù),為護理專業(yè)的高水平快速發(fā)展提供幫助。
3.2 NSF資助護理-信息-工程學項目對我國的啟示
3.2.1 護理信息化改善護理服務質(zhì)量 護理信息平臺和健康干預App已然改善了護理服務質(zhì)量[15-16]。如遠程會診平臺能帶給患者長期信任并為護理干預提供支持[17],健康干預App能促進患者的健康行為,同時減輕護士工作壓力,改善護理服務質(zhì)量[15]。但與此同時,護理信息平臺不可避免地為患者信息安全帶來挑戰(zhàn)[17],健康干預App的設計缺少臨床專家的直接參與也是一大問題[18]。Jaensson等[19]基于“信息技術(shù)-電子健康-護理專家”的跨學科團隊開發(fā)了一種用于患者術(shù)后恢復監(jiān)測和評估的網(wǎng)絡應用程序,為患者的使用提供了便利,提高了護士評估患者術(shù)后恢復水平的效率和質(zhì)量。此外,Sara的項目(#2026577)提出了一個獲取患者護理相關(guān)數(shù)據(jù)的新機制以保護患者隱私,并提出一種異步通信工具將家庭健康助理與護理團隊的成員直接關(guān)聯(lián),通過多時空維度的數(shù)據(jù)收集和反饋機制實現(xiàn)協(xié)同護理工作。Ephraim和Sylvia的項目(#0428420、#0703692、#1035565)也加入了隱私保護程序,維持了患者基本隱私問題和健康需求的相互平衡。建議今后加大護理學與信息科學的合作力度,從患者隱私安全等實際問題入手,鼓勵臨床護理專家直接參與平臺設計以促進護理信息平臺的建設,改善護理服務質(zhì)量。
3.2.2 計算機圖形優(yōu)化虛擬現(xiàn)實場景革新護理教育范式 虛擬現(xiàn)實(virtual reality,VR)至今已發(fā)展至沉浸交互的仿真技術(shù),VR的出現(xiàn)讓一種跨時空的網(wǎng)絡虛擬學習空間正初步形成[20],推動了醫(yī)學教育事業(yè)的發(fā)展[21]。研究[22-23]證實,VR在護理教育中是可行的,并且能顯著提升護生和護士的學習、認知和精神活動水平以及護理技能熟練度、應對事件時的自信心和同理心。但在虛擬場景中,學生缺少了對現(xiàn)實患者真實痛苦感受的人文關(guān)懷[21]。Ephraim的項目(#1564065)開發(fā)了一種物理虛擬病床,使用動態(tài)計算機圖形及各種傳感器將出汗、呼吸、脈搏跳動、身體各部分溫暖或寒冷的感覺表現(xiàn)出來,將虛擬患者的靈活性與人體模型的物理性相結(jié)合,使人類特征充分融入到VR模型中,讓護生更好地感受患者所感。Ephraim的項目(#0803652)提出了混合現(xiàn)實人類,集成觸覺、物理對象和生理監(jiān)控以形成虛擬患者,提高護生對于患者隱私部位(乳房、骨盆、前列腺)的護理評估和人際溝通技巧。建議今后學院教師-臨床護理人員-VR技術(shù)廠家三方通力合作,針對不同疾病特點,結(jié)合臨床經(jīng)驗總結(jié)不同疾病患者的臨床真實感受,構(gòu)建更加真實和個性化的虛擬患者模型,讓護生更加全面、真實地學習不同場景下的操作和溝通技巧。
3.2.3 智能輔助設備優(yōu)化護理資源配置與護理決策效率 在護士短缺的背景下,智能輔助設備協(xié)助護士解決臨床問題的發(fā)展思路愈發(fā)受到重視[24]。智能輔助機器人多存在于醫(yī)院和老年護理機構(gòu)中,能幫助患者進行轉(zhuǎn)移、行走、力量練習等,高效減輕護士的工作負擔,降低護士職業(yè)相關(guān)疾病發(fā)生風險,逐步發(fā)展為護士的潛在合作伙伴[25-26]。護理決策需要護士收集患者信息,綜合分析后做出判斷,而護理團隊的年輕化和臨床繁重的工作加重了護理決策的困難[27]。這樣的背景下,以輔助機器人為代表的智能輔助設備可以監(jiān)測患者實時行為,一定程度上降低了護士的工作量和職業(yè)相關(guān)疾病的患病風險,但其無法監(jiān)測患者所處環(huán)境的狀態(tài),由此非接觸式環(huán)境智能傳感技術(shù)應運而生,更加全面地協(xié)助護士滿足患者需求[28],達到不良事件預警的作用。Sara的項目(#2026498)開發(fā)了一款環(huán)境智能監(jiān)控設備,包括開發(fā)硬件(相機、深度傳感器和麥克風)捕獲患者受隱私保護的數(shù)據(jù)、開發(fā)算法識別患者臨床活動行為的程度、醫(yī)護人員輸入互動信息、臨床實驗探究設備可用性。建議護理專業(yè)人員聯(lián)合科技部門人員協(xié)同研究,以更優(yōu)的算法處理從環(huán)境中監(jiān)測到的冗雜臨床數(shù)據(jù),為優(yōu)質(zhì)護理決策提供保障,實現(xiàn)患者-環(huán)境-護士一體化的智能護理路徑,通過智能技術(shù)賦能提升護理資源配置與決策效率。
3.3 本研究的局限性 本研究基于Python語言實現(xiàn)了對NSF中護理-信息-工程學科相關(guān)立項的數(shù)據(jù)采集和分析,同時存在一定的局限性:(1)NSF中每個檢索詞最多只開放3000條檢索結(jié)果,這可能導致數(shù)據(jù)采集不完整。(2)截至目前,尚未有護理學專用的中英文停用詞表和分詞庫,英文文本的分詞多數(shù)是以空格和連接符為區(qū)分,可能會導致分詞結(jié)果存在部分偏倚。(3)LDA模型多用于對文本的情感得分進行分析,但對于政策類文本數(shù)據(jù)的分類效果有待納入更大樣本的數(shù)據(jù)進一步驗證。
本研究使用Python語言的網(wǎng)絡爬蟲和機器學習技術(shù)對NSF資助的護理-信息-工程學項目進行分析,從資助項目概況和項目主題兩方面進行論述,為促進我國護理-信息-工程學科發(fā)展提供參考。在后續(xù)研究中,護理學者可根據(jù)國家最新政策,結(jié)合國情不斷拓寬護理-信息-工程學交叉發(fā)展的深度和廣度,推動我國護理事業(yè)的發(fā)展。