李雙遠(yuǎn),呂彥昌
(1.吉林化工學(xué)院 信息化建設(shè)辦公室,吉林 吉林 132022;2.吉林化工學(xué)院 信息與控制工程學(xué)院,吉林 吉林 132022)
2020年疫情改變了全世界,但同時也改變了中國人工智能市場的格局,AI人工智能被提升到國家戰(zhàn)略,這是對我國人工智能領(lǐng)域的極大利好,提振了人工智能市場的信心[1];國家及地方也積極發(fā)布多項政策,全力支持人工智能的發(fā)展與應(yīng)用.2020年2月19日,工信部發(fā)布的《關(guān)于運(yùn)用新一代信息技術(shù)支撐服務(wù)疫情防控和復(fù)工復(fù)產(chǎn)工作的通知》提出利用人工智能、大數(shù)據(jù)、5G等技術(shù),加快病毒檢測診斷、疫苗新藥研發(fā)、防控救治等速度,提高抗疫效率.由此可見利用人工智能進(jìn)行疫情防控,增加抗疫效率得到了基本的認(rèn)同,因此學(xué)界開始深入探索人工智能技術(shù)給疫情防控帶來的變化,例如,使用人工智能技術(shù)對佩戴口罩進(jìn)行自動檢測[2].基于此,利用CiteSpace軟件分析系統(tǒng)分析國內(nèi)與國外口罩目標(biāo)檢測的相關(guān)論文,以期深度理解國內(nèi)外口罩佩戴檢測的研究現(xiàn)狀、差異、熱點(diǎn)話題和發(fā)展趨勢[3].
所需文獻(xiàn)數(shù)據(jù)來源于CNKI和Web of Science數(shù)據(jù)庫,檢索對象為2020年以來刊發(fā)的相關(guān)論文(2020年1月—2021年12月).在CNKI中使用高級檢索功能,以“口罩檢測”為主題進(jìn)行搜索,手動剔除掉會議、圖書等無效記錄,實際獲得有效樣本159份.同時,在Web of Science數(shù)據(jù)庫中以“Object detection”or“Mask”為主題進(jìn)行檢索,最終得到199份有效樣本.
1.2.1 研究工具
選取CiteSpace 5.8R3為研究工具.CiteSpace是Citation Space的簡稱,由陳超美博士及其團(tuán)隊開發(fā),是一款運(yùn)行在JAVA環(huán)境下著眼于分析科學(xué)文獻(xiàn)中蘊(yùn)含的潛在知識的圖譜工具.其突出特征在于將某個研究領(lǐng)域中浩瀚的文獻(xiàn)數(shù)據(jù),以一種多元、分時、動態(tài)的可視化語言通過巧妙的布局,將該領(lǐng)域的發(fā)展歷程集中展現(xiàn)在一幅可視化圖譜上;并將圖譜上的節(jié)點(diǎn)文獻(xiàn)以及研究前沿?zé)狳c(diǎn)話題自動標(biāo)識,顯示出圖譜自身的可解讀性,讓讀者可以輕松了解該領(lǐng)域的詳細(xì)信息[4].
1.2.2 研究方法
首先,采用文獻(xiàn)計量法從發(fā)文時間、發(fā)文數(shù)量、研究機(jī)構(gòu)三方面對CNKI和Web of Science數(shù)據(jù)庫所搜索到的文獻(xiàn)進(jìn)行分析,得到在不同時間、不同國家的研究情況及發(fā)文的數(shù)量關(guān)系、變化規(guī)律及分布結(jié)構(gòu)[5].最后,利用CiteSpace軟件對搜索到的國內(nèi)外文獻(xiàn)分別進(jìn)行可視化分析,得到關(guān)鍵詞共現(xiàn)、關(guān)鍵詞聚類等可視化圖譜,進(jìn)而可以展現(xiàn)出國內(nèi)外在人工智能領(lǐng)域進(jìn)行口罩檢測的知識脈絡(luò)與研究現(xiàn)狀.在上述基礎(chǔ)上,深入分析核心文獻(xiàn),系統(tǒng)地梳理國內(nèi)外在利用人工智能領(lǐng)域口罩識別方面的差異與發(fā)展趨勢.
首先對Web of Science數(shù)據(jù)庫所檢索到的199篇文獻(xiàn)進(jìn)行可視化分析,可以得出國際上利用人工智能進(jìn)行口罩佩戴檢測研究論文產(chǎn)出的國家分布極不均衡,一些國家占了很大比例.對發(fā)文量排名前10的國家進(jìn)行匯總,如圖1所示.
圖1 2020—2022排名前10國家發(fā)文量
由圖1可以得出,在過去的兩年里,中國的論文產(chǎn)出量為99篇,位列第一;排名第二的為美國,發(fā)文量21篇;印度發(fā)文量17篇,位居第三.隨著人工智能技術(shù)的興起,各個國家也在奮力研究,因此,排名前10的國家大多為發(fā)達(dá)國家.而中國作為發(fā)展中國家可在國際中躋身前列,足以體現(xiàn)我國在利用人工智能技術(shù)進(jìn)行疫情防控方面做出了巨大貢獻(xiàn).
采用同樣方法,對CNKI所檢索到的159篇文獻(xiàn)進(jìn)行可視化分析,可以清楚地獲得在過去的兩年里各種主題的文獻(xiàn)數(shù),在多類主題中主要針對發(fā)文量排名前20的主題進(jìn)一步探討.如圖2所示,可以發(fā)現(xiàn)“口罩檢測”、“卷積神經(jīng)網(wǎng)絡(luò)”、“YOLOv5”等主題文章數(shù)量較多,因此可進(jìn)一步說明我國在利用人工智能進(jìn)行口罩檢測方面做出了很大的貢獻(xiàn).
圖2 主要主題文獻(xiàn)分布
由于發(fā)文機(jī)構(gòu)分布較為廣泛,因此針對發(fā)文數(shù)量排名前20的機(jī)構(gòu)進(jìn)行統(tǒng)計分析,具體分布如圖3所示.由圖可得,在發(fā)文排名前20的機(jī)構(gòu)中大多為我國知名高校,其中以青島大學(xué)為主,在過去的兩年中發(fā)文數(shù)量為5篇;新疆大學(xué)等三所高校并列第二,發(fā)文數(shù)量為4篇;貴州大學(xué)等5所高校發(fā)文數(shù)量均為3篇,位居第三.由此可得,在疫情防控中,我國高校充分發(fā)揮科研優(yōu)勢在人工智能領(lǐng)域奉獻(xiàn)自己的力量,進(jìn)而更好地發(fā)揮人工智能在我國防疫工作上的優(yōu)勢.
圖3 主要研究機(jī)構(gòu)文獻(xiàn)分布
運(yùn)用CiteSpace軟件,以年為單位進(jìn)行時間切片選擇,閾值設(shè)為50,選擇方法為“g-index,k=25”,其他節(jié)點(diǎn)值為默認(rèn)[6].為保證研究的有效性,分別對CNKI和Web of Science數(shù)據(jù)庫所搜索到的文獻(xiàn)進(jìn)行可視化分析,得到關(guān)鍵詞共現(xiàn)圖譜以及關(guān)鍵詞聚類圖譜,從而更直觀地分析國內(nèi)外在疫情常態(tài)化中利用人工智能進(jìn)行口罩檢測的現(xiàn)狀.
作者分析可以為讀者揭示更多通常會被單點(diǎn)指標(biāo)掩蓋的科研人員數(shù)據(jù)和細(xì)節(jié),同時被引參考文獻(xiàn)深度分析不僅可以幫助有相關(guān)需求的科研人員了解引用參考文獻(xiàn)的目的,也有助于發(fā)現(xiàn)對該篇文獻(xiàn)影響較大的參考文獻(xiàn)及相關(guān)文獻(xiàn)[7].使用CiteSpace軟件,將T節(jié)點(diǎn)設(shè)置為“Author”,分別繪制國內(nèi)外所檢索到的文獻(xiàn)作者關(guān)聯(lián)圖譜如圖4、5所示.
圖4 國內(nèi)文獻(xiàn)作者關(guān)聯(lián)圖譜
圖5 國外文獻(xiàn)作者關(guān)聯(lián)圖譜
由國內(nèi)文獻(xiàn)作者關(guān)聯(lián)圖譜可得,發(fā)文量最多的是劉明、儲珺和李瑞,以上3位作者在過去的兩年中發(fā)文均為4篇.在合作方面,劉明、張心月與劉蓉存在合作關(guān)系,除此之外,丁洪偉和楊志軍等多組作者合作也較為密切.通過對國外文獻(xiàn)作者關(guān)聯(lián)圖譜得到發(fā)文量最多的為LU ZHANG,共發(fā)表4篇相關(guān)文章,其次KAMRAN JAVED發(fā)文量為3篇,排名第二,位居第三的為QIXIANG YE和SEHO BAE等多名作者,發(fā)文數(shù)量為2篇.在分析文獻(xiàn)作者合作關(guān)系時,發(fā)現(xiàn)國內(nèi)外文獻(xiàn)作者合作均不密切,有待加強(qiáng)合作,進(jìn)而取得更多學(xué)術(shù)成果.
關(guān)鍵詞是計算機(jī)系統(tǒng)標(biāo)引論文內(nèi)容特征的詞語,便于信息系統(tǒng)匯集,往往可以展示一篇文章的核心內(nèi)容.在關(guān)鍵詞共現(xiàn)可視化圖譜中,節(jié)點(diǎn)代表關(guān)鍵詞,節(jié)點(diǎn)的大小代表關(guān)鍵詞出現(xiàn)的頻次,節(jié)點(diǎn)越大表示關(guān)鍵詞頻次越高,節(jié)點(diǎn)的連線表示關(guān)鍵詞之間的聯(lián)系[8].分別對CNKI和Web of Science數(shù)據(jù)庫所搜索到的文獻(xiàn)進(jìn)行可視化分析,得到關(guān)鍵詞共現(xiàn)圖譜,如圖6、7所示.
圖6 CNKI中關(guān)鍵詞共現(xiàn)圖譜
圖7 Web of Science數(shù)據(jù)庫中關(guān)鍵詞共現(xiàn)圖譜
通過對圖7分析可得,關(guān)鍵詞共現(xiàn)圖譜中出現(xiàn)66個節(jié)點(diǎn),116條連線,網(wǎng)絡(luò)密度為0.054 1;圖7中有144個節(jié)點(diǎn),519條連線,網(wǎng)絡(luò)密度為0.050 4.可以看出,國外文獻(xiàn)數(shù)量雖然遠(yuǎn)大于國內(nèi),但網(wǎng)絡(luò)密度卻較小.因此,可以得出國內(nèi)針對口罩檢測的研究較為集中.基于CiteSpace軟件可視化分析的結(jié)果,獲得在人工智能領(lǐng)域口罩檢測技術(shù)頻次位于前10的關(guān)鍵詞,如表1所示.
表1 人工智能技術(shù)口罩檢測高頻關(guān)鍵詞
首先利用CiteSpace軟件對所檢索得到的國內(nèi)外文獻(xiàn)分別進(jìn)行聚類分析,得到國內(nèi)外文獻(xiàn)聚類圖譜,如圖8、9所示.
圖8 國內(nèi)文獻(xiàn)關(guān)鍵詞聚類圖譜
圖9 國外文獻(xiàn)關(guān)鍵詞聚類圖譜
其次利用對數(shù)似然率算法(Log-Likelihood Rate) 對相關(guān)文獻(xiàn)的關(guān)鍵詞進(jìn)行聚類分析,由可視化圖譜可得國內(nèi)聚類文獻(xiàn)中聚類模塊值即Q值為0.605,聚類平均輪廓值即S值為0.800 4;國外文獻(xiàn)中Q值為0.423 1,S值為0.809 2.一般地,Q>0.3表示聚類結(jié)構(gòu)較好;S>0.7代表所得聚類信度高[9].綜上,所得國內(nèi)外關(guān)鍵詞聚類圖譜合理,可進(jìn)行進(jìn)一步分析.
由圖8顯示,國內(nèi)研究共分為8個聚類,分別為“損失函數(shù)”、“人臉識別”、“深度學(xué)習(xí)”、“口罩佩戴”、“口罩識別”、“智慧樓宇”、“目標(biāo)識別”、“目標(biāo)定位”.國外研究共分為8個聚類,分別是“instance segmentation(實例分割)”、“predictive models(預(yù)測模型)”、“image edge detection(圖像邊緣檢測)”、“attention mechanism(注意力機(jī)制)”、“unmanned aerial vehicles(無人機(jī))”、“deep neural network(深度神經(jīng)網(wǎng)絡(luò))”、“three-dimensional displays(三維顯示)”、“salient object detection(顯著目標(biāo)檢測)”.
對生成的關(guān)鍵詞聚類圖譜進(jìn)行深入分析,首先是國內(nèi)文獻(xiàn)關(guān)鍵詞聚類圖譜,其中聚類#0損失函數(shù).損失函數(shù)是將隨機(jī)事件或其有關(guān)隨機(jī)變量的取值映射為非負(fù)實數(shù)以表示該隨機(jī)事件的“風(fēng)險”或“損失”的函數(shù)[10].損失函數(shù)是卷積神經(jīng)網(wǎng)絡(luò)必不可少的部分,通過計算網(wǎng)絡(luò)模型輸出與真實類別之間的某種距離,可以衡量整個網(wǎng)絡(luò)模型的好壞,此外,在訓(xùn)練階段,損失函數(shù)也決定了網(wǎng)絡(luò)模型參數(shù)的更新過程.聚類#1人臉識別.人臉識別是采用攝像頭等電子設(shè)備采集含有人臉的圖像或視頻,然后自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部識別技術(shù).人臉識別技術(shù)具有非強(qiáng)制性、非接觸性、直觀性、簡易性等優(yōu)點(diǎn)[11],并且已經(jīng)得到了廣泛的重視和研究.聚類#2深度學(xué)習(xí).深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,而機(jī)器學(xué)習(xí)是實現(xiàn)人工智能的必經(jīng)路徑.研究深度學(xué)習(xí)的目的主要在于建立模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),可利用其模仿人腦的機(jī)制來解釋數(shù)據(jù),例如圖像、聲音和文本等[12].聚類#4口罩識別.人臉佩戴口罩識別是一種人臉屬性識別,它包括人臉檢測技術(shù)和口罩佩戴分類技術(shù)兩部分.由于人臉的特殊性,在目標(biāo)檢測技術(shù)的基礎(chǔ)上發(fā)展了一系列的人臉檢測算法,而口罩佩戴識別可通過目標(biāo)分類技術(shù)來實現(xiàn).
其次是國外文獻(xiàn)關(guān)鍵詞聚類圖譜,其中圖譜#0instance segmentation(實例分割).圖像實例分割是在對象檢測的基礎(chǔ)上進(jìn)一步細(xì)化和提升,分離對象的前景與背景,實現(xiàn)像素級別的對象分離.圖像實例分割在目標(biāo)檢測、人臉檢測、表情識別、醫(yī)學(xué)圖像處理與疾病輔助診斷、視頻監(jiān)控與對象跟蹤、零售場景的貨架空缺識別等場景下均有應(yīng)用[13].圖譜#1predictive models(預(yù)測模型).預(yù)測模型通常是用于預(yù)測的,采用數(shù)學(xué)語言或公式所描述的事物間的數(shù)量關(guān)系,并且在一定程度上揭示了事物間的內(nèi)在規(guī)律性[14].目前基于機(jī)器學(xué)習(xí)相關(guān)算法的預(yù)測模型在諸多領(lǐng)域已經(jīng)取得廣泛應(yīng)用.圖譜#5deep neural network(深度神經(jīng)網(wǎng)絡(luò)).深度神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)領(lǐng)域中一種技術(shù)框架,同時也具備至少一個隱層的神經(jīng)網(wǎng)絡(luò).與淺層神經(jīng)網(wǎng)絡(luò)類似,深度神經(jīng)網(wǎng)絡(luò)也能夠為復(fù)雜非線性系統(tǒng)提供建模,但多出的層次為模型提供了更高的抽象層次,因而提高了模型的能力[15].圖譜#7salient object detection(顯著目標(biāo)檢測).顯著目標(biāo)檢測主要是識別圖像的主體,本質(zhì)是一種分割任務(wù),首先算顯著圖,然后合并分割顯著對象.通過顯著性檢測可以快速有效地提取出場景中有用的區(qū)域,從而進(jìn)一步分析.
自新冠疫情暴發(fā)以來,我國在疫情防控阻擊戰(zhàn)中取得階段性勝利,但變異毒株奧密克戎再次襲來,佩戴口罩為阻斷病毒傳播途徑的有效手段[16],因此需要加強(qiáng)對公共場所出入人員是否佩戴口罩的檢測.采用文獻(xiàn)計量學(xué)方法,使用 CiteSpace可視化軟件對CNKI和Web of Science數(shù)據(jù)庫關(guān)于人工智能領(lǐng)域口罩佩戴檢測相關(guān)論文進(jìn)行分析,可以更加直觀地看出國內(nèi)外對于口罩檢測的研究現(xiàn)狀,在疫情背景下國內(nèi)外學(xué)者對于人工智能領(lǐng)域口罩佩戴檢測的研究呈現(xiàn)上升趨勢,而且受到越來越多的國內(nèi)外學(xué)者的關(guān)注和重視,在共現(xiàn)圖譜中可以得出國內(nèi)外高頻關(guān)鍵詞均出現(xiàn)“deep learning(深度學(xué)習(xí))”、“object detection(目標(biāo)檢測)”.其中,深度學(xué)習(xí)是一類機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的變革者已經(jīng)眾人皆知了,尤其是計算機(jī)視覺領(lǐng)域.與深度學(xué)習(xí)在圖形分類領(lǐng)域碾壓傳統(tǒng)模型類似,深度學(xué)習(xí)模型現(xiàn)在也是目標(biāo)檢測領(lǐng)域最好的方法[17].目標(biāo)檢測的主要任務(wù)是從輸入圖像中定位感興趣的目標(biāo),然后準(zhǔn)確地判斷每個感興趣目標(biāo)的類別.而從聚類圖譜中可得國內(nèi)外作者在口罩識別方向略有差異,國內(nèi)作者主要研究目標(biāo)檢測方向涉及的函數(shù),注重一些智能識別模型研究,建設(shè)智慧樓宇[18].而國外作者更側(cè)重圖像分割技術(shù)的研究,利用人工智能圖像處理結(jié)合三維呈現(xiàn)工具更好地展示所檢測的目標(biāo).因此國內(nèi)外作者在科研方面若是進(jìn)行通力合作可以在自身擅長領(lǐng)域進(jìn)行結(jié)合,從而能更好地促進(jìn)目標(biāo)檢測口罩的研究與發(fā)展.通過目標(biāo)檢測技術(shù)在公共場所檢測是否佩戴口罩,不僅會節(jié)約大量的人力物力,而且還能提高監(jiān)管效率以及覆蓋率.從而使疫情出現(xiàn)的概率大大降低,為防控疫情管理、口罩佩戴提供很好的監(jiān)督作用,進(jìn)而可以為我國乃至全世界防疫發(fā)揮更好的促進(jìn)作用.