任利強(qiáng),郭 強(qiáng),王海鵬,張立民
(海軍航空大學(xué) 信息融合技術(shù)研究所,煙臺 264001)
近年來,從人機(jī)圍棋大戰(zhàn)到無人駕駛汽車,從智能游戲、智能檢索到智能機(jī)器人,從語音識別、圖像識別到機(jī)器翻譯和自然語言理解等.人工智能技術(shù)對社會各領(lǐng)域產(chǎn)生了廣泛而深遠(yuǎn)的影響,IBM、谷歌、Face book、微軟、Amazon、百度、阿里巴巴等各國高科技企業(yè)普遍將人工智能視為下一代產(chǎn)業(yè)革命和互聯(lián)網(wǎng)革命的技術(shù)引爆點,并且投入大量資金以加快其產(chǎn)業(yè)化進(jìn)程[1].人工智能相關(guān)產(chǎn)業(yè)與技術(shù)也受到了各國政府的高度關(guān)注與積極投入.美國白宮科技政策辦公室2016年10月發(fā)布了題為《為人工智能的未來做好準(zhǔn)備》和《國家人工智能研究與發(fā)展戰(zhàn)略規(guī)劃》[2]的重要報告,前者概述了人工智能的發(fā)展現(xiàn)狀以及應(yīng)用領(lǐng)域,后者則提出了美國應(yīng)該將人工智能提升到優(yōu)先發(fā)展的戰(zhàn)略方向;英國政府2016年12月發(fā)布了題為《人工智能:未來決策的機(jī)遇與影響》[3]的報告,以關(guān)注人工智能對社會創(chuàng)新與生產(chǎn)力的促進(jìn)作用,論述如何將英國人工智能的獨特優(yōu)勢轉(zhuǎn)化為增強(qiáng)英國國力的優(yōu)勢;2017年3月我國首次將人工智能寫進(jìn)2017年《政府工作報告》[4]中,2017年8月國務(wù)院下發(fā)的《新一代人工智能發(fā)展規(guī)劃》通知中甚至宣布舉全國之力搶占人工智能全球制高點.這些足以表明人工智能已經(jīng)被多國提升到國家戰(zhàn)略層面.
基于人工智能技術(shù)被各國廣泛應(yīng)用,成為近年來輿論焦點和炙手可熱的科技熱搜詞.為此,本文對有關(guān)人工智能2007-2016年的文獻(xiàn)梳理、分析和比較,全面了解和追蹤近年來人工智能研究過程中方法與技術(shù)的更新.以美國核心期刊數(shù)據(jù)庫Web of Science收錄的與人工智能相關(guān)的6879篇期刊論文為依托,利用CiteSpace軟件對人工智能領(lǐng)域合作國家、研究機(jī)構(gòu)、引用文獻(xiàn)、關(guān)鍵詞和突現(xiàn)詞五個方面進(jìn)行可視化分析,全面了解人工智能領(lǐng)域的研究進(jìn)展.文獻(xiàn)大數(shù)據(jù)可視化分析結(jié)果可以為人工智能的深入研究、實踐探索和產(chǎn)業(yè)推進(jìn)提供重要參考.
人類的創(chuàng)造性不僅取決于邏輯思維,還與形象思維密切相關(guān).利用形象思維獲取視覺符號中所蘊含的信息有助于人類發(fā)現(xiàn)和洞察規(guī)律,進(jìn)而獲得科學(xué)發(fā)現(xiàn).期間,可視化技術(shù)對重大科學(xué)發(fā)現(xiàn)起到了重要作用[5].數(shù)據(jù)可視化于二十世紀(jì)五十年代出現(xiàn),指運用計算機(jī)圖形學(xué)和圖像處理技術(shù),以圖表、地圖、標(biāo)簽云、動畫或任何使內(nèi)容更容易理解的圖形方式來呈現(xiàn)數(shù)據(jù)[6],使數(shù)據(jù)所表達(dá)的內(nèi)容更容易被理解.
隨著大數(shù)據(jù)時代的到來,人類社會產(chǎn)生的數(shù)據(jù)呈爆炸式增長,數(shù)據(jù)的規(guī)模越來越大[7].這些冰冷枯燥的海量數(shù)據(jù)使人望而生畏.在這種背景下大數(shù)據(jù)可視化技術(shù)作為一種可以有效地簡化與提煉數(shù)據(jù)流,將海量復(fù)雜的數(shù)據(jù)直觀可視化呈現(xiàn)的工具逐步發(fā)展起來.知識圖譜便是其中之一,它是以科學(xué)知識為研究對象,描述科學(xué)知識的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形[8].科學(xué)知識圖譜涉及數(shù)理統(tǒng)計學(xué)、計算機(jī)科學(xué)、社會學(xué)、信息科學(xué)、圖像學(xué)等多學(xué)科的理論,并且與科學(xué)計量學(xué)的共詞分析、共引分析等方法結(jié)合,通過對科學(xué)知識的挖掘和處理,繪制一系列可視化的圖形,將學(xué)科知識發(fā)展進(jìn)程和結(jié)構(gòu)關(guān)系直觀形象地展示出來[9].這種將數(shù)據(jù)通過可視化技術(shù)變成直觀圖形的方法不僅讓冰冷枯燥的數(shù)據(jù)變得親切和易于理解,更是激發(fā)了人的形象思維與想象力,從而為科學(xué)新發(fā)現(xiàn)創(chuàng)造新的手段和條件[10].
在科學(xué)探索中,學(xué)者最關(guān)注的莫過于從自己所研究領(lǐng)域海量文獻(xiàn)中發(fā)現(xiàn)自己最感興趣的主題和科學(xué)文獻(xiàn),對自己研究領(lǐng)域發(fā)展歷程有清晰的認(rèn)識,以及發(fā)現(xiàn)該領(lǐng)域最為活躍的研究熱點、前沿和未來發(fā)展趨勢.由美國費城德雷克塞爾大學(xué)教授陳超美開發(fā)的CiteSpace軟件對上述一系列問題提供了解決方法.CiteSpace是一種基于引文分析理論的科技文本挖掘及可視化分析軟件[11].該軟件可以用來繪制科學(xué)領(lǐng)域發(fā)展的知識圖譜,直觀地展現(xiàn)科學(xué)知識領(lǐng)域的信息全景、宏觀結(jié)構(gòu)以及一個學(xué)科或知識領(lǐng)域在一定時期發(fā)展的趨勢與動向,探測并發(fā)現(xiàn)若干研究前沿領(lǐng)域的演進(jìn)歷程及其重要的奠基性理論文獻(xiàn)[12].同時,CiteSpace所獨特具有的時區(qū)視圖和突變詞檢測功能可以發(fā)現(xiàn)科學(xué)領(lǐng)域研究的熱點及前沿.陳超美教授在2004年發(fā)表的《Searching for intellectual turning points:Progressive knowledge domain visualization》[13]文章中首次介紹了CiteSpace軟件.2005年陳悅、劉則淵發(fā)表的《悄然興起的科學(xué)知識圖譜》[14]文章在國內(nèi)首次應(yīng)用了CiteSpace可視化軟件.2008年CiteSpace實現(xiàn)了對中文數(shù)據(jù)的可視化分析,加速了該軟件在國內(nèi)應(yīng)用的傳播進(jìn)程.2016年李杰、陳超美出版的《CiteSpace:科技文本挖掘及可視化》專著對CiteSpace的設(shè)計理念與操作流程做了詳細(xì)的介紹,標(biāo)志CiteSpace已從初級應(yīng)用到高級應(yīng)用.如今CiteSpace軟件已進(jìn)入“5.1”版本,其功能已日漸完善.
利用CiteSpace構(gòu)建知識圖譜步驟如圖1所示.CiteSpace在國內(nèi)文獻(xiàn)中的應(yīng)用主要表現(xiàn)在三個方面:一是作為科學(xué)知識圖譜的引證資料;二是作為其他可視化軟件的比較對象;三是作為科技文獻(xiàn)可視化分析的工具.本文應(yīng)用CiteSpace軟件的第三種形式,通過該軟件對國際人工智能領(lǐng)域的科技文獻(xiàn)大數(shù)據(jù)進(jìn)行分析,從而得到分時動態(tài)的可視化圖譜.對圖譜的進(jìn)一步分析以識別并發(fā)現(xiàn)該領(lǐng)域科學(xué)發(fā)展的現(xiàn)狀、研究熱點、研究前沿及發(fā)展趨勢[15].
圖1 CiteSpace操作流程圖
基于CiteSpace的人工智能文獻(xiàn)大數(shù)據(jù)可視化分析框架如圖2所示.首先,在了解人工智能文獻(xiàn)大數(shù)據(jù)可視化分析需求的基礎(chǔ)上,提出了掌握人工智能研究領(lǐng)域的發(fā)展現(xiàn)狀、重要文獻(xiàn)并探究該領(lǐng)域的研究熱點和前沿的研究目標(biāo);其次,根據(jù)研究目標(biāo)選擇大數(shù)據(jù)可視化工具CiteSpace作為合適的研究工具對數(shù)據(jù)進(jìn)行分析處理;再次,根據(jù)研究目標(biāo)選取Web of Science數(shù)據(jù)庫中與人工智能有關(guān)的文獻(xiàn)數(shù)據(jù)作為研究內(nèi)容;接著,通過建立時間分布圖譜、國家合作圖譜、機(jī)構(gòu)合作圖譜以及地理可視化網(wǎng)絡(luò)實現(xiàn)時空知識圖譜分析,通過建立文獻(xiàn)共被引圖譜、關(guān)鍵詞聚類圖譜和突現(xiàn)詞檢測圖譜實現(xiàn)內(nèi)容知識圖譜分析,從時空知識圖譜和內(nèi)容知識圖譜分析兩方面對人工智能研究現(xiàn)狀、熱點以及前沿進(jìn)行分析;最后,根據(jù)圖譜分析的結(jié)果給出結(jié)論.
圖2 基于CiteSpace的人工智能文獻(xiàn)大數(shù)據(jù)可視化分析框架框圖
科技文本數(shù)據(jù)的采集是CiteSpace可視化分析的基礎(chǔ).對于科技文本數(shù)據(jù)而言,索引型數(shù)據(jù)庫收錄了除正文外所有文獻(xiàn)的信息.美國Web of Science數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)較為完整,包括文獻(xiàn)類型、作者、期刊、關(guān)鍵詞、摘要、機(jī)構(gòu)和參考文獻(xiàn).基于CiteSpace分析的數(shù)據(jù)便是以Web of Science下載的數(shù)據(jù)格式為基礎(chǔ).
研究數(shù)據(jù)來源于美國Web of Science中的Web of Science TM核心數(shù)據(jù)庫,檢索方式為主題=“artificial intelligence” or “Artificial Intelligence”,時間跨度=2007-2016,文獻(xiàn)類型=ARTICLE,索引=SCIEXPANDED,檢索時間為2017年8月3日,查詢到的7000篇文獻(xiàn)數(shù)據(jù)庫界面如圖3所示.剔除“書評”、“會議摘要”、“書信”以及其他“新聞報道”,最后得到有效記錄6879條,這些文獻(xiàn)2007-2016年期間被引用頻次總計70 519次,每項平均引用次數(shù)為10.25,h-index[16]為90,表示有90篇論文至少被引用90次.
在數(shù)據(jù)分析之前需要對Web of Science格式的數(shù)據(jù)進(jìn)行數(shù)據(jù)過濾與除重.數(shù)據(jù)過濾可以提取不同學(xué)科領(lǐng)域的數(shù)據(jù),由于人工智能涉及多個學(xué)科領(lǐng)域,數(shù)據(jù)過濾操作可以略過.數(shù)據(jù)除重可以去除冗余的數(shù)據(jù),CiteSpace軟件的數(shù)據(jù)預(yù)處理模塊可以完成此步驟.如圖4所示,進(jìn)入數(shù)據(jù)預(yù)處理界面,首先選擇標(biāo)簽“WoS”,然后加載原始數(shù)據(jù)到“Input Directory”,將保存處理過后數(shù)據(jù)文件夾加載到“Output Directory”,最后點擊“Remove Duplicates (WoS)”完成除重過程.
圖3 文獻(xiàn)檢索結(jié)果界面
圖4 CiteSpace軟件數(shù)據(jù)除重界面
軟件相關(guān)選項參數(shù)的設(shè)置如圖5所示,時間跨度(Time Span)設(shè)置為2007-2016,選擇每1年為一個時間切片(Time Slice),從而得到10個時間分段.網(wǎng)絡(luò)節(jié)點關(guān)聯(lián)強(qiáng)度選擇Cosine算法,設(shè)定時間片閾值為50,即數(shù)據(jù)抽取對象為前50 (Top 50).最后選擇最小生成樹精簡算法 (Minimum Spanning Tree)[17]對網(wǎng)絡(luò)修正裁剪,并且根據(jù)研究需要選擇相應(yīng)的節(jié)點類型,繪制相應(yīng)的科學(xué)知識圖譜.
圖5 CiteSpace軟件相關(guān)選項參數(shù)設(shè)置界面
通過建立時間分布圖譜、國家合作圖譜、機(jī)構(gòu)合作圖譜以及地理可視化網(wǎng)絡(luò)實現(xiàn)時空知識圖譜分析,從時空知識圖譜對人工智能的發(fā)展現(xiàn)狀進(jìn)行不同層面的分析與探究.
5.2.1 人工智能研究時間分布圖譜
某一領(lǐng)域的發(fā)展?fàn)顩r可以從該領(lǐng)域發(fā)文量歷時性變化趨勢中得到反映[18].為了解人工智能近十年的研究成果,統(tǒng)計了2007-2016年人工智能領(lǐng)域各年發(fā)表的文獻(xiàn)量如圖6 所示.圖6顯示,自2007年以來圍繞人工智能的研究文獻(xiàn)量呈現(xiàn)持續(xù)增長的趨勢,尤其是2016年恰逢“人工智能60周年”,圍繞人工智能的研究文獻(xiàn)量出現(xiàn)急增.人工智能正受到廣泛的關(guān)注,迎來發(fā)展熱潮.明顯看出,全球人工智能發(fā)展持續(xù)火熱,研究正進(jìn)入高速發(fā)展階段.
圖6 人工智能各年發(fā)文量統(tǒng)計圖
5.2.2 國家空間分布圖譜
為了解世界各個國家對人工智能領(lǐng)域的研究現(xiàn)狀,對開展人工智能相關(guān)研究的國家空間特征進(jìn)行分析.選擇網(wǎng)絡(luò)節(jié)點為“Country”,運行CiteSpace軟件,得到人工智能研究國家合作圖譜,如圖7所示.在圖7中圓圈的大小代表文獻(xiàn)作者所在國家出現(xiàn)的頻次,圓圈越大,表明該國作者出現(xiàn)的頻次越多,反之越少.圓圈的顏色代表相應(yīng)國家作者發(fā)表文獻(xiàn)時間,單圈年輪環(huán)越寬表示該單位時間段內(nèi)該國作者出現(xiàn)的頻次越多[19].可以明顯看出在人工智能研究領(lǐng)域,美國(USA)的輻射面積最大,以頻次1168居于世界首位,具有絕對的優(yōu)勢.這說明美國在人工智能領(lǐng)域具有較強(qiáng)的研究實力和影響力.中國(PEOPLES R CHINA)以784頻次位居第2,具有一定的研究實力;西班牙(SPAIN)頻次581位列第3;英國(ENGLAND)頻次526位列第4;伊朗(IRAN)頻次497位列第5;第6和第9分別是印度(INDIA)和土耳其(TURKEY)、意大利(ITALY)和法國(FRANCE).由此可見,歐洲和亞洲各國都高度重視人工智能技術(shù)的發(fā)展,積極開展人工智能領(lǐng)域相關(guān)研究.
圖7 人工智能研究國家合作圖譜
5.2.3 研究機(jī)構(gòu)空間分布圖譜
構(gòu)建人工智能的研究機(jī)構(gòu)分布圖譜時,設(shè)定網(wǎng)絡(luò)節(jié)點類型為“Institution”,生成人工智能研究機(jī)構(gòu)合作圖譜,如圖8所示.從圖8可以發(fā)現(xiàn),伊斯蘭自由大學(xué)(Islamic Azad Univ)頻次最高,在人工智能領(lǐng)域發(fā)表論文最多,具有絕對高的研究實力.其次高產(chǎn)的機(jī)構(gòu)依次為中國科學(xué)院(Chinese Acad Sci)、德黑蘭大學(xué)(Univ Tehran)、臺灣科學(xué)技術(shù)大學(xué)(Taiwan Univ Sci &Technol)、馬來亞大學(xué)(Univ Malaya)、南洋理工大學(xué)(Nanyang Technol Univ),表明這四個機(jī)構(gòu)在人工智能方向具有較強(qiáng)的研究潛力.通過對這些機(jī)構(gòu)的所在地進(jìn)行分析,發(fā)現(xiàn)發(fā)文量排在前十的研究機(jī)構(gòu)都位于亞洲,其中包括4所伊朗名校,3所中國研究機(jī)構(gòu),僅從發(fā)文量上可見,近年來人工智能在亞洲受到廣泛關(guān)注與積極研究.同時表明,伊朗和中國對人工智能的研究相當(dāng)重視且具有一定的基礎(chǔ)實力.
為了研究不同機(jī)構(gòu)間的合作情況,如圖8所示.節(jié)點為研究機(jī)構(gòu)名稱,節(jié)點之間連線描述機(jī)構(gòu)的合作,連線的顏色表示節(jié)點首次合作的時間,連線的粗細(xì)表示機(jī)構(gòu)合作次數(shù),線條越細(xì)表示合作次數(shù)越少[20].機(jī)構(gòu)合作網(wǎng)絡(luò)中共有節(jié)點429個,連線137條,整體網(wǎng)絡(luò)密度僅為0.0015,這說明國際人工智能研究團(tuán)隊分散,不同機(jī)構(gòu)的作者之間存在較少合作,極具凝聚力的科研群體尚未能形成.未來需要國內(nèi)外高校及相關(guān)研究團(tuán)隊之間加強(qiáng)合作交流,打破消極界限,創(chuàng)建跨機(jī)構(gòu)、跨學(xué)科的合作隊伍,以促進(jìn)人工智能研究的快速發(fā)展.
圖8 人工智能研究機(jī)構(gòu)合作局部圖譜
5.2.4 合作網(wǎng)絡(luò)地理可視化分析
對國際人工智能研究作者合作網(wǎng)絡(luò)進(jìn)行地理可視化分析,如圖9所示.圖(a)為國際人工智能研究的合作網(wǎng)絡(luò);圖(b)為我國在參與人工智能研究中的合作網(wǎng)絡(luò).如圖9所示,美國和歐洲在人工智能領(lǐng)域具有密切的合作,同時國際人工智能研究中心位于美國和以西班牙、英國、意大利、法國和比利時為代表的歐洲國家.中國和美國、歐洲都有合作,但合作密度較小,中國人工智能研究中心主要位于北京、上海、香港和臺灣.
圖9 人工智能研究國際合作網(wǎng)絡(luò)地理可視化
通過建立文獻(xiàn)共被引圖譜、關(guān)鍵詞聚類圖譜和突現(xiàn)詞檢測圖譜實現(xiàn)內(nèi)容知識圖譜分析,從內(nèi)容知識圖譜對人工智能研究重要文獻(xiàn)、研究熱點和前沿進(jìn)行分析與探究.
5.3.1 人工智能研究引用文獻(xiàn)分析
當(dāng)兩篇文獻(xiàn)同時被第三篇文獻(xiàn)引用時,這兩篇文獻(xiàn)之間就存在共被引關(guān)系,文獻(xiàn)被引頻次可以較客觀地反映該文獻(xiàn)被學(xué)術(shù)界或知識域所認(rèn)可的程度,以及在網(wǎng)絡(luò)中的地位[21].持續(xù)高被引的文獻(xiàn)被認(rèn)為是一個領(lǐng)域的經(jīng)典文獻(xiàn),一個領(lǐng)域的早期奠基性文獻(xiàn)和經(jīng)典文獻(xiàn)則反映該領(lǐng)域研究的發(fā)展脈絡(luò)和研究基礎(chǔ).本文利用CiteSpace軟件進(jìn)行文獻(xiàn)共被引分析,設(shè)定網(wǎng)絡(luò)節(jié)點為“CitedReference”,生成人工智能研究的文獻(xiàn)共被引圖譜,如圖10所示.圖譜中節(jié)點大小、顏色以及連線的粗細(xì)和顏色代表的含義和前文圖譜的解讀類似.
圖10 人工智能研究的文獻(xiàn)共被引圖譜
圖10顯示了各共被引文獻(xiàn)的發(fā)表年份以及共被引用情況.從中可以看出Karaboga D和Basturk B于2008年所著的《On the performance of Artificial Bee Colony (ABC) algorithm》[22]、Karaboga D和Akay B 2009年所著的《A comparative study of Artificial Bee Colony algorithm》[23]、Karaboga D和Basturk B 2007年所著的《A powerful and efficient algorithm for numerical function optimization:Artificial Bee Colony(ABC) algorithm》[24]被引頻次分列前三.他們提出了一種較新的群體智能優(yōu)化算法—人工蜂群算法.而被引頻次排在前八的文獻(xiàn)都是研究關(guān)于人工蜂群算法.這足以看出人工蜂群算法在人工智能領(lǐng)域被廣泛應(yīng)用,是人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練、組合優(yōu)化問題、系統(tǒng)和工程設(shè)計等多個領(lǐng)域研究的基礎(chǔ)理論,也是經(jīng)典理論[25].
5.3.2 人工智能研究熱點可視化分析
5.3.2.1 關(guān)鍵詞研究
關(guān)鍵詞是對文獻(xiàn)研究內(nèi)容的高度概括,在一定程度上可以代表一篇文獻(xiàn)的研究內(nèi)容.網(wǎng)絡(luò)節(jié)點的中心性是反映節(jié)點核心程度的重要指標(biāo)之一[26],可以衡量某個節(jié)點在網(wǎng)絡(luò)中的重要性,以及與其他節(jié)點之間聯(lián)系的密切程度.從而,一段時間內(nèi)科學(xué)研究者共同關(guān)注的核心問題即研究熱點可以從中心性和頻次高的關(guān)鍵詞中得到體現(xiàn)[27].
分析人工智能研究熱點時,設(shè)定網(wǎng)絡(luò)節(jié)點為“Keyword”,運行軟件后將同義關(guān)鍵詞合并后得到研究文獻(xiàn)中關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),如圖11所示.圖譜中每個關(guān)鍵詞用一個圓形節(jié)點表示,圓圈越大表明該關(guān)鍵詞在人工智能研究領(lǐng)域內(nèi)出現(xiàn)的頻次越高,即高頻關(guān)鍵詞.其中需要關(guān)注的是帶有紫紅色光圈的節(jié)點,該節(jié)點代表的關(guān)鍵詞具有較高的中心性,表示與其它關(guān)鍵詞聯(lián)系密切程度較高.其中關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)中有節(jié)點104個,連線54條,網(wǎng)絡(luò)密度為0.0101.相對于機(jī)構(gòu)合作網(wǎng)絡(luò),關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜的結(jié)構(gòu)形態(tài)有了較大的優(yōu)化和提升.但總體上關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)仍比較疏松、密度不高.這提示我們,未來研究中不僅要求科研機(jī)構(gòu)之間加強(qiáng)合作,而且還需要科研學(xué)者專注于自己所研究的主題,選擇合適的方向展開深入研究、精準(zhǔn)研究,以避免對所研究的方向淺嘗輒止.
圖11 國內(nèi)人工智能關(guān)鍵詞共現(xiàn)圖譜
近十年人工智能研究文獻(xiàn)中出現(xiàn)的高頻次和高中心性關(guān)鍵詞如表1所示.研究文獻(xiàn)中出現(xiàn)頻次前十的關(guān)鍵詞有“artificial intelligence”,“artificial neural network”,“modeling”,“system”,“genetic algorithm”,“prediction”,“optimization”,“support vector machine”,“classification”,“design”.結(jié)合高中心性關(guān)鍵詞,可以發(fā)現(xiàn)近十年國際人工智能研究的熱點領(lǐng)域包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、人工神經(jīng)網(wǎng)絡(luò)、群智能、計算智能、知識庫系統(tǒng);人工智能研究的熱點算法包括遺傳算法、蟻群優(yōu)化、決策樹;人工智能研究的熱點方法及應(yīng)用包括建模、預(yù)測、優(yōu)化、分類、設(shè)計.
表1 人工智能研究文獻(xiàn)高頻次
5.3.2.2 關(guān)鍵詞聚類分析
數(shù)據(jù)挖掘中聚類是對復(fù)雜網(wǎng)絡(luò)中的數(shù)據(jù)根據(jù)相似性進(jìn)行聚合與分類的過程[28].在關(guān)鍵詞聚類分析中,聚類反映了網(wǎng)絡(luò)中節(jié)點的相似性,有助于識別和探測某一研究領(lǐng)域代表性知識子群,即該研究領(lǐng)域內(nèi)的熱點主題.設(shè)定網(wǎng)絡(luò)節(jié)點為“Keyword”,在生成關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的基礎(chǔ)上對其進(jìn)行聚類處理,最終得到如圖12所示的人工智能研究領(lǐng)域的關(guān)鍵詞聚類網(wǎng)絡(luò).
圖12 關(guān)鍵詞聚類圖譜
人工智能的研究熱點知識子群可總結(jié)為五大主題:以預(yù)測(prediction)、回歸(regression)、模糊推理系統(tǒng)(fuzzy inference system)為代表的人工神經(jīng)網(wǎng)絡(luò)方向的研究熱點;以智能(intelligence)、框架(framework)、系統(tǒng)(system)、環(huán)境(environment)為代表的機(jī)器學(xué)習(xí)方向的研究熱點;以算法(algorithm)、智能體(intelligent agent)、架構(gòu)(architecture)、管理(management)為代表的語義Web方向的研究熱點;以建模(modeling)、優(yōu)化(optimization)、群智能(swarm intelligence)、進(jìn)化算法(evolutionary algorithm)為代表的人工蜂群算法方向的研究熱點;以模糊邏輯(fuzzy logic)、計算智能(computational intelligence)、識別(identification)、時間序列(time series)為代表的軟計算方向的研究熱點.上述研究熱點主題與先前的研究結(jié)果部分相重復(fù),以人工神經(jīng)網(wǎng)絡(luò)為首的研究熱點主題值得科研學(xué)者們高度關(guān)注.近年來,攜著“深度學(xué)習(xí)”之勢,人工神經(jīng)網(wǎng)絡(luò)重新成為最強(qiáng)大的機(jī)器學(xué)習(xí)算法之一,成為人工智能領(lǐng)域的研究熱點主題.
5.3.3 結(jié)果分析中展示的人工智能領(lǐng)域研究前沿
研究熱點和研究前沿不能混淆.陳美超指出,研究前沿是一組凸顯的動態(tài)概念和潛在的研究問題,研究前沿術(shù)語即出現(xiàn)頻次快速增加的專業(yè)術(shù)語[29].Cite-Space的一大突破便是提供一種基于詞頻增長算法(Burst Detection)的突現(xiàn)詞分析方法,該方法通過對引文關(guān)鍵詞的統(tǒng)計,將短時間內(nèi)快速增長的專業(yè)詞匯檢測出來[30].憑借這些突現(xiàn)詞的時間分布和動態(tài)變化性的特點可以較好地反映知識域內(nèi)的研究前沿和發(fā)展趨勢.設(shè)定網(wǎng)絡(luò)節(jié)點為“Keyword”,詞語類型選擇突現(xiàn)詞(Burst Terms).如表2所示,利用CiteSpace軟件提供的詞頻增長算法,將詞頻變化率高的詞從大量關(guān)鍵詞中探測出來,并選取部分突現(xiàn)詞按突現(xiàn)值大小排列,通過考察突現(xiàn)詞的歷史共現(xiàn)頻次分布總結(jié)其在一段時期內(nèi)的趨勢,來確定人工智能研究領(lǐng)域的前沿.
表2 人工智能研究突現(xiàn)詞
表2顯示人工智能研究近十年詞頻變化率較高的關(guān)鍵詞有邏輯(logic)、差分進(jìn)化(differential evolution)、全局優(yōu)化(global optimization)、人工智能學(xué)習(xí)(learning (artificial intelligence))、架構(gòu)(architecture)、案例推理(case based reasoning)、復(fù)雜性(complexity)、專家系統(tǒng)(expert system)、人工免疫系統(tǒng)(artificial immune system)和智能體(intelligent agent),這些突現(xiàn)詞反應(yīng)了近十年人工智能領(lǐng)域的研究前沿.
突現(xiàn)詞一段時期內(nèi)出現(xiàn)頻次的趨勢可以體現(xiàn)一個領(lǐng)域前沿發(fā)展趨勢.如表2所示,呈突然出現(xiàn)型的突現(xiàn)詞有差分進(jìn)化算法(differential evolution)和人工免疫系統(tǒng)(artificial immune system),這些詞在近年突然出現(xiàn),可以視為未來發(fā)展的趨勢;呈上升型趨勢的突現(xiàn)詞有人工智能學(xué)習(xí)(learning (artificial intelligence))、復(fù)雜性(complexity)和智能體(intelligent agent),這類關(guān)鍵詞的研究時間并不長但仍然是領(lǐng)域內(nèi)的研究熱點,研究者對其會繼續(xù)關(guān)注;呈平穩(wěn)型趨勢的突現(xiàn)詞有邏輯(logic)和架構(gòu)(architecture),這類詞雖然在一段時間有上升或者下降的波動,但總體趨于平穩(wěn)的狀態(tài),說明一直處于研究的熱點之中.
通過CiteSpace軟件,對Web of Science數(shù)據(jù)庫中有關(guān)人工智能2007-2016年的文獻(xiàn)數(shù)據(jù)進(jìn)行不同層面的分析以及直觀的可視化展示,構(gòu)建了時間分布圖譜、國家合作圖譜、機(jī)構(gòu)合作圖譜、地理可視化網(wǎng)絡(luò)、文獻(xiàn)共被引圖譜、關(guān)鍵詞聚類圖譜,突現(xiàn)詞檢測圖譜,研究得出以下結(jié)論.
1) 時間分布圖譜表明:人工智能作為一種前沿學(xué)科在整個計算機(jī)科學(xué)領(lǐng)域正處于被極度關(guān)注的情況,近十年國際人工智能研究領(lǐng)域文獻(xiàn)量持續(xù)增長,全球人工智能發(fā)展持續(xù)火熱,研究正進(jìn)入高速發(fā)展階段.
2) 空間分布圖譜表明:在國家層面上,美國、中國、西班牙、伊朗、英國等國發(fā)文量較多,具有一定的人工智能研究基礎(chǔ);在機(jī)構(gòu)層面上,跨機(jī)構(gòu)之間的合作明顯較少,尚未形成明顯的凝聚子群,缺少具有足夠影響力的科研機(jī)構(gòu);在作者合作地理分布層面上,美國和歐洲在人工智能領(lǐng)域有密切的合作,是國際人工智能的研究中心,中國和美國、歐洲都有合作,但合作密度較小,中國人工智能研究中心主要位于北京、上海、香港和臺灣.
3) 共被引文獻(xiàn)圖譜表明:人工智能領(lǐng)域的重要研究文獻(xiàn)有Karaboga D和Basturk B于2008年所著的《On the performance of Artificial Bee Colony (ABC)algorithm》、Karaboga D、Akay B在2009年所著的《A comparative study of artificial bee colony algorithm》以及Karaboga D和Basturk B于2007年所著的《A powerful and efficient algorithm for numerical function optimization:Artificial Bee Colony (ABC)algorithm》,這些文獻(xiàn)是人工智能研究領(lǐng)域的基礎(chǔ)理論,也是經(jīng)典理論.
4) 關(guān)鍵詞共現(xiàn)圖譜表明:人工智能研究的熱點領(lǐng)域包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、人工神經(jīng)網(wǎng)絡(luò)、群智能、計算智能和知識庫系統(tǒng);人工智能研究的熱點算法包括遺傳算法、蟻群優(yōu)化和決策樹;人工智能研究的熱點方法及應(yīng)用包括建模、預(yù)測、優(yōu)化、分類和設(shè)計.人工智能研究的熱點主題有人工神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、語義Web、人工蜂群算法和軟計算.
5) 突現(xiàn)詞檢測圖譜表明:人工智能領(lǐng)域近十年研究前沿包括邏輯(logic)、差分進(jìn)化(differential evolution)、全局優(yōu)化(global optimization)、人工智能學(xué)習(xí)(learning (artificial intelligence))、架構(gòu)(architecture)、案例推理(case based reasoning)、復(fù)雜性(complexity)、專家系統(tǒng)(expert system)、人工免疫系統(tǒng)(artificial immune system)和智能體(intelligent agent).
人工智能領(lǐng)域已經(jīng)成為世界各國科技革命和產(chǎn)業(yè)變革的新競技場.積極研究和利用人工智能技術(shù),對我國科學(xué)研究發(fā)展和社會經(jīng)濟(jì)增長具有重要促進(jìn)作用,也是我國把握未來發(fā)展先機(jī)并提升自身國際競爭力的重要途徑.
1 朱巍,陳慧慧,田思媛,等.人工智能:從科學(xué)夢到新藍(lán)海—人工智能產(chǎn)業(yè)發(fā)展分析及對策.科技進(jìn)步與對策,2016,33(21):66-70.[doi:10.6049/kjjbydc.2016040495]
2 Government Office for Science.Artificial intelligence:Opportunities and implications for the future of decision making.https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/566075/gs-16-19-artificialintelligence-ai-report.pdf.[2016-12].
3 National Science and Technology Council.The national artificial intelligence research and development strategic plan.http://www.360doc.com/content/16/1015/20/37334461_598685262.shtml.[2016-10-15].
4 中華人民共和國政府工作報告.http://www.gov.cn/premier/2017-03/16/content_5177940.htm.[2017-03-16].
5 陳明.大數(shù)據(jù)可視化分析.計算機(jī)教育,2015,(5):94-97.
6 李健,王麗萍,劉瑞.美國的大數(shù)據(jù)研發(fā)計劃及對我國的啟示.中國科技資源導(dǎo)刊,2013,45(1):17-23.
7 李國杰.大數(shù)據(jù)研究的科學(xué)價值.中國計算機(jī)學(xué)會通訊,2012,8(9):8-15.
8 梁秀娟.科學(xué)知識圖譜研究綜述.圖書館雜志,2009,28(6):58-62.
9 Xu T Y,Qu H N,Zhao S S,et al.The visualization analysis of research hotspot and frontier technology of the smart power distribution and utilization based on the cite space.Energy and Power Engineering,2017,9(4B):515-524.
10 劉則淵,王賢文,陳超美.科學(xué)知識圖譜方法及其在科技情報中的應(yīng)用.數(shù)字圖書館論壇,2009,(10):14-34.[doi:10.3772/j.issn.1673-2286.2009.10.004]
11 梁靜,任增元.我國研究生教育研究進(jìn)展的文獻(xiàn)計量分析.現(xiàn) 代 教 育 管 理 ,2015,(12):103-108.[doi:10.3969/j.issn.1674-5485.2015.12.020]
12 侯劍華,胡志剛.CiteSpace軟件應(yīng)用研究的回顧與展望.現(xiàn)代情報,2013,33(4):99-103.
13 Chen CM.Searching for intellectual turning points:Progressive knowledge domain visualization.Proceedings of the National Academy of Sciences of the United States of Americ,2004,101(S1):5303-5310.
14 陳悅,劉則淵.悄然興起的科學(xué)知識圖譜.科學(xué)學(xué)研究,2005,23(2):149-154.
15 姜俊鋒,丁香乾,侯瑞春,等.基于Citespace Ⅲ的大數(shù)據(jù)研究的可視化分析.計算機(jī)與數(shù)字工程,2016,44(2):291-295,299.
16 郭俊倉.個人學(xué)術(shù)水平評介指標(biāo)——h因子與ph因子概念介紹.西安工業(yè)大學(xué)學(xué)報,2015,35(11):909.
17 Liu HL,Zhu YP,Guo YZ,et al.Visualization analysis of subject,region,author,and citation on crop growth model by CiteSpace Ⅱ software.In:Wen ZK,Li TR,eds.Knowledge Engineering and Management.Berlin,Heidelberg:Springer,2014.243-252.
18 蔡建東,馬婧,袁媛.國外CSCL理論的演進(jìn)與前沿?zé)狳c問題——基于Citespace的可視化分析.現(xiàn)代教育技術(shù),2012,22(5):10-16.
19 Chen C.CiteSpace Ⅱ :Detecting and visualizing emerging trends and transient patterns in scientific literature.Journal of the American Society for Information Science and Technology,2006,57(3):359-377.[doi:10.1002/(ISSN)1532-2890]
20 李杰,陳超美.CiteSpace:科技文本挖掘及可視化.北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2016.180-185.
21 金麗娜.基于復(fù)雜網(wǎng)絡(luò)的文獻(xiàn)關(guān)聯(lián)關(guān)系模型的建立與分析[碩士學(xué)位論文].北京:北京化工大學(xué),2013.27-32.
22 Karaboga D,Basturk B.On the performance of artificial bee colony (ABC) algorithm.Applied Soft Computing,2008,8(1):687-697.[doi:10.1016/j.asoc.2007.05.007]
23 Karaboga D,Akay B.A comparative study of artificial bee colony algorithm.Applied Mathematics and Computation,2009,214(1):108-132.[doi:10.1016/j.amc.2009.03.090]
24 Karaboga D,Basturk B.A powerful and efficient algorithm for numerical function optimization:Artificial bee colony(ABC) algorithm.Journal of Global Optimization,2007,39(3):459-471.[doi:10.1007/s10898-007-9149-x]
25 秦全德,程適,李麗,等.人工蜂群算法研究綜述.智能系統(tǒng)學(xué)報,2014,9(2):127-135.[doi:10.3969/j.issn.1673-4785.201307019]
26 劉軍.社會網(wǎng)絡(luò)分析導(dǎo)論.北京:社會科學(xué)文獻(xiàn)出版社,2004.170-185.
27 Freeman LC.Centrality in social networks conceptual clarification.Social Networks,1978-1979,1(3):215-239.[doi:10.1016/0378-8733(78)90021-7]
28 Chen CM.Visualising semantic spaces and author co-citation networks in digital libraries.Information Processing &Management,1999,35(3):401-420.
29 陳超美.CITESPACE Ⅱ:科學(xué)文獻(xiàn)中新趨勢與新動態(tài)的識別與可視化.陳悅,侯劍華,梁永霞,譯.情報學(xué)報,2009,28(3):401-402.
30 辛偉.知識圖譜在軍事心理學(xué)研究中的應(yīng)用[碩士學(xué)位論文].西安:第四軍醫(yī)大學(xué),2013.52-59.