〔摘要〕大數(shù)據(jù)時代為人文社會科學研究及其自身的變革迎來了新的發(fā)展機遇,人文社會科學領域對大數(shù)據(jù)相關問題的研究正處于快速上升期。以中文社會科學引文索引數(shù)據(jù)庫為數(shù)據(jù)來源,從期刊、作者、研究機構、學科屬性4個層面對國內(nèi)人文社會科學視野下大數(shù)據(jù)的主要研究力量進行了分析。通過信息計量與可視化識別出國內(nèi)人文社會科學視野下大數(shù)據(jù)研究的六大研究前沿:面向大數(shù)據(jù)的企業(yè)競爭情報研究、大數(shù)據(jù)時代社會治理與公共服務創(chuàng)新、基于網(wǎng)絡大數(shù)據(jù)的企業(yè)生態(tài)系統(tǒng)建模、大數(shù)據(jù)時代公共圖書館的服務創(chuàng)新與發(fā)展、數(shù)據(jù)新聞、教育大數(shù)據(jù)及其應用。
〔關鍵詞〕人文社會科學;大數(shù)據(jù);研究前沿;信息計量;信息可視化
DOI:10.3969/j.issn.1008-0821.2017.03.024
〔中圖分類號〕G250252〔文獻標識碼〕A〔文章編號〕1008-0821(2017)03-0132-09
〔Abstract〕In the age of big data,humanities and social sciences research and their changes with new opportunities.Research on big data is in the fast rising period in the field of humanities and social sciences.Distribution of researchers of big data in the field of humanities and social science were analyzed from journals,authors,research institutions,subject property amounts to four levels based on Chinese social sciences citation index.In addition,identify six research frontiers of big data in the field of humanities and social science through the use of analysis method of information visualization and informetrics.These research frontiers included study on enterprise competitive intelligence based on big data,innovation of social administration and public services in the age of big data,enterprise eco-system model based on network data,innovation and development of public library services in the age of big data,data news,and education big data and its applications.
〔Key words〕humanities and social sciences;big data;research frontiers;informetrics;information visualization
大數(shù)據(jù)作為新興產(chǎn)業(yè),其產(chǎn)業(yè)鏈條涉及與數(shù)據(jù)和信息有關的一系列信息技術,可謂是新一代信息技術與信息管理的大變革。伴隨著國家及各省市層面有關大數(shù)據(jù)發(fā)展行動綱要與計劃的陸續(xù)出臺,大數(shù)據(jù)逐漸成為國內(nèi)外政府管理部門、學術研究機構、工業(yè)企業(yè)單位的熱門議題。大數(shù)據(jù)及其技術在人類社會管理、政府治理、經(jīng)濟文化、教育科學等領域的廣泛應用,使得這一信息技術變成與人文社會科學研究息息相關的一種思維方式,并促使越來越多的人文社會科學研究者開始積極關注和研究與大數(shù)據(jù)有關的問題。人文社會科學量化研究方法的長期探索為大數(shù)據(jù)與人文社科研究兩者的結合奠定了較好基礎[1]。方興未艾的大數(shù)據(jù)已給人文社會科學研究提出了很多問題和挑戰(zhàn),同時也提供了許多人文社會科學研究變革與創(chuàng)新的機會,人文社會科學研究應自覺融入大數(shù)據(jù)時代[2]。有研究指出人文社會科學領域與大數(shù)據(jù)息息相關,人文社會科學領域也高度重視大數(shù)據(jù)的相關研究[3]。那么目前國內(nèi)人文社會科學領域對大數(shù)據(jù)問題進行研究的主要力量分布情況怎么樣?該視野下的大數(shù)據(jù)研究前沿又是什么?回答這些問題對人文社會科學視野下的大數(shù)據(jù)研究有一定的參考與借鑒作用。為更好地推動國內(nèi)人文社會科學領域對大數(shù)據(jù)相關問題的研究,本文基于中文社會科學引文索引(Chinese Social Sciences Citation Index,以下簡稱CSSCI)對我國人文社會科學領域大數(shù)據(jù)研究的力量分布及其研究前沿進行識別。
1數(shù)據(jù)來源說明
鑒于本文是要客觀地反映國內(nèi)人文社會科學領域的大數(shù)據(jù)研究現(xiàn)狀及其動向問題,加之考慮到CSSCI在收錄國內(nèi)人文社會科學期刊數(shù)據(jù)方面的針對性、權威性、典型性和代表性[4-7],因此,筆者選擇CSSCI數(shù)據(jù)庫作為數(shù)據(jù)檢索來源。通過限定篇名和文獻類型雙重條件進行高級檢索,即檢索表達式如下:篇名(詞)=大數(shù)據(jù) and 文獻類型=論文,不限定文獻發(fā)表時間共計檢索出1 216篇文獻,檢索時間為2017年1月14日。通過進一步的數(shù)據(jù)清洗工作剔除1篇重復文獻以及與大數(shù)據(jù)研究內(nèi)容無關的7篇文獻(主要涉及各大數(shù)據(jù)庫網(wǎng)站間的對比研究),最后剩余1 208篇論文數(shù)據(jù)作為分析對象。
根據(jù)1208篇文獻在各年度的數(shù)量分布數(shù)據(jù)繪制其年度文獻量及其累計文獻量分布,如表1所示。表1顯示基于CSSCI數(shù)據(jù)庫來看,國內(nèi)人文社會科學領域對大數(shù)據(jù)相關問題的研究始于2012年,并呈現(xiàn)出逐年快速增加的研究態(tài)勢,表現(xiàn)為2012年的11篇增長至2013年的115篇,2014年309篇,2015年的474篇,需要說明的是由于檢索時間的原因導致2016年的文獻量收錄更新不全。文獻年度分布情況從數(shù)量上反映出人文社會科學領域對大數(shù)據(jù)的研究關注度在逐年增加,且持續(xù)受到人文社會科學學者的高度關注。同時,結合表1的年度文獻量累積分布情況來看,大數(shù)據(jù)問題研究已成為我國人文社會科學研究領域的研究熱點主題。對大數(shù)據(jù)年度累計文獻量進行趨勢線模擬,發(fā)現(xiàn)其呈現(xiàn)出指數(shù)分布,趨勢線公式為:y=76263e11374x,R2=0883。根據(jù)擬合值R2可判斷出該趨勢線模擬效果和精度具有較高的可靠性,趨勢線模擬分析表明目前國內(nèi)人文社會科學領域對大數(shù)據(jù)相關主題的研究正處于快速上升期,且該領域研究文獻累積量呈現(xiàn)出明顯的指數(shù)型變化增長趨勢,筆者相信人文社會科學領域對大數(shù)據(jù)相關問題的研究熱度還會持續(xù),并從研究數(shù)量層面的增加逐步轉向研究內(nèi)容層面的深入探索,從而不斷推動人文社會科學領域大數(shù)據(jù)研究的逐步發(fā)展與成熟。
從期刊載文量、作者與研究機構發(fā)文量可識別出某研究領域的重要情報源和主要研究力量[8]。同時,基于論文學科歸屬的視角也能對某研究領域的主要力量分布情況進行學科層面的宏觀分析。統(tǒng)計分析發(fā)現(xiàn),1 208篇文獻共刊載于267種期刊上,刊均載文約45篇。從期刊來源分布來看,國內(nèi)人文社會科學領域刊發(fā)大數(shù)據(jù)研究的期刊有209種期刊(占總期刊數(shù)量的7828%)載文量在平均值以下,其中包括115種期刊(占總期刊數(shù)量的4307%)僅刊發(fā)了1篇文獻,49種期刊(占總期刊數(shù)量的1835%)刊發(fā)了2篇文獻,28種期刊(占總期刊數(shù)量的1049%)刊發(fā)了3篇文獻,17種期刊(占總期刊數(shù)量的637%)刊發(fā)了4篇文獻。進一步分析發(fā)現(xiàn),58種期刊(占總期刊數(shù)量的2172%)刊發(fā)了國內(nèi)人文社會科學領域大數(shù)據(jù)研究的843篇文獻(占總文獻量的6978%)。表2統(tǒng)計出載文量大于10篇以上的期刊列表,共載文665篇,其載文量超過總文獻的一半(占總文獻量的5505%),可見這些期刊是目前國內(nèi)人文社會科學領域大數(shù)據(jù)研究的重要期刊情報源。表2中前4種期刊均是圖書情報學領域核心期刊,這在一定程度上顯示目前國內(nèi)人文社會科學領域大數(shù)據(jù)研究的核心力量來源于圖書情報學學科。
數(shù)據(jù)顯示,1 208篇文獻共涉及1 036位第一署名作者,占第一署名作者總數(shù)約7575%的915位作者僅發(fā)表了1篇文獻,97位作者僅發(fā)表了2篇文獻,發(fā)文量≥3篇的共有24位作者(占第一署名作者總數(shù)的232%),高產(chǎn)作者合計發(fā)文99篇(占總文獻量的82%)。同時,1 208篇文獻共涉及439所第一署名研究機構,占第一署名機構總數(shù)約6059%的266所研究機構僅發(fā)表了1篇文獻,66所研究機構僅發(fā)表了2篇文獻,發(fā)表4篇文獻以上的有80所研究機構(占第一署名研究機構總數(shù)的1822),合計發(fā)文720篇(占總文獻量的596%)??梢娔壳皣鴥?nèi)人文社會科學領域大數(shù)據(jù)研究者平均發(fā)文量很低,高產(chǎn)量的作者數(shù)量偏少,
而高產(chǎn)研究機構群正在逐漸形成?;贑SSCI文獻發(fā)表數(shù)量來分析目前國內(nèi)人文社會科學領域大數(shù)據(jù)研究的高產(chǎn)作者(發(fā)文量≥3)與高產(chǎn)研究機構(發(fā)文量≥10),見表3。表3僅統(tǒng)計以第一署名作者與機構的發(fā)文情況,結果顯示中國人民大學新聞學院的喻國明、蘭州財經(jīng)大學(蘭州商學院2015年改名)信息工程學院的馬曉亭、江西財經(jīng)大學管理哲學研究中心的黃欣榮、桂林理工大學圖書館的張興旺等學者是目前國內(nèi)人文社會科學領域對大數(shù)據(jù)有關問題進行研究的高產(chǎn)作者。而中國人民大學、武漢大學、南京大學、清華大學、北京大學、蘭州財經(jīng)大學、北京師范大學等研究機構是目前該領域研究的高產(chǎn)機構。
數(shù)據(jù)處理過程中發(fā)現(xiàn),1 208篇文獻中有72篇文獻沒有標注學科分類,其中有51篇文獻沒有標注中圖分類號,首先筆者根據(jù)中國知網(wǎng)CNKI數(shù)據(jù)庫對這51篇文獻的分類號標注結果進行數(shù)據(jù)補充,然后再根據(jù)文獻內(nèi)容以及中圖分類號對學科分類信息進行修正完善,最后對學科分類及中圖分類號信息進行統(tǒng)計分析。需要說明的是,對于某些同時具有兩個中圖類號和學科類別的文獻,僅取第一個中圖類號及其所對應的學科類別加以分析。表4是基于CSSCI數(shù)據(jù)庫的國內(nèi)人文社會科學領域大數(shù)據(jù)研究主要學科力量分布列表。表4顯示,目前國內(nèi)人文社會科學領域大數(shù)據(jù)研究主要涉及25個學科,其中按文獻量排名的前10門學科分別圖書館、情報與文獻學、新聞學與傳播學、教育學、管理學、經(jīng)濟學、政治學、統(tǒng)計學、哲學、法學、藝術學。圖書館、情報與文獻學(占總文獻量3005%)是目前國內(nèi)人文社會科學領域開展大數(shù)據(jù)研究最活躍的學科力量之一,其次是新聞學與傳播學(占總文獻量1316%),以及教育學(占總文獻量1151%)。為進一步從學科層面顯示人文社會科學領域對大數(shù)據(jù)有關問題關注的變化情況,筆者將表4中排名前10位學科及其文獻量按照年度進行展示,見圖1。
圖2顯示,從CSSCI來源數(shù)據(jù)來看,圖書情報學是國內(nèi)人文社會科學領域最早對大數(shù)據(jù)相關問題開展研究的主要學科,同時其在文獻數(shù)量及增長方面基本領域于其他主要學科,這進一步反映出圖書情報學學科在大數(shù)據(jù)研究領域的重要地位。進一步分析發(fā)現(xiàn),除新聞學與傳播學、藝術學兩大學科從2015年開始對大數(shù)據(jù)有關問題的學科關注度有所下降外,目前國內(nèi)人文社會科學領域大數(shù)據(jù)研究的其他8門主要學科基本呈現(xiàn)出逐年增加的態(tài)勢(由于檢索時間原因導致2016年數(shù)據(jù)不全)。從圖1可知,教育學對大數(shù)據(jù)的研究表現(xiàn)出很高的研究熱情,其是在主要學科門類中惟一在2016年數(shù)據(jù)不全的情況下還表現(xiàn)出增長態(tài)勢的學科,教育學在國內(nèi)人文社會科學領域大數(shù)據(jù)研究所占比重逐年增加,一定程度上反映出教育學領域對大數(shù)據(jù)相關問題的研究已經(jīng)為教育學的研究熱點主題。此外結果還顯示出經(jīng)濟學對大數(shù)據(jù)有關問題的研究文獻增長幅度也較快。教育大數(shù)據(jù)以及大數(shù)據(jù)環(huán)境下的教育問題,以及經(jīng)濟大數(shù)據(jù)以及大數(shù)據(jù)環(huán)境下的經(jīng)濟問題是國內(nèi)人文社會科學研究領域對大數(shù)據(jù)有關問題研究的新視角和新拓展。
3研究前沿主題識別分析
研究前沿分析可為科研人員提供某研究領域的發(fā)展動態(tài),并能發(fā)現(xiàn)具有價值的研究方向或潛在研究領域[9]。同樣,對人文社會科學領域內(nèi)大數(shù)據(jù)研究前沿的探測也能識別出人文社會科學視野下大數(shù)據(jù)領域研究中正受到關注的研究主題或涌現(xiàn)出的具有發(fā)展?jié)摿Φ难芯款I域,從而有利于更好地推動該領域的科學研究工作。有文獻資料指出,“研究前沿”的概念最早由普賴斯于1965年提出,其被用來描述研究領域的動態(tài)本質[10-12]。之后國內(nèi)外學者對科學研究前沿的探討一直持續(xù),有研究者在總結國內(nèi)外眾多學者對研究前沿所下的各種定義與概念的基礎上,指出研究前沿就是在科學研究中最近出現(xiàn)、正在興起的研究主題或者研究領域[13]。對于科學研究前沿的有效探測方法而言,其要么根據(jù)領域專家的經(jīng)驗知識進行判斷,要么進行科學計量與文本內(nèi)容挖掘,而前者相較于后者來看,前一種方法較為費時并帶有較為濃厚的專家主觀色彩,因而科學計量與文本內(nèi)容挖掘方法是當前快速高效進行科學研究前沿識別的重要輔助手段。目前,基于文獻計量的研究前沿識別基本方法主要有同被引分析、文獻耦合分析、共詞分析等[14]。有研究指出,研究前沿與知識基礎具有密切的對應關系,分析知識基礎有利于對研究前沿本質的認識和理解[15]。同時,從文獻引用關系的方法來看,研究前沿與其對應的知識基礎是不可分割的整體,因而對研究前沿的探測離不開對其在文獻中引用軌跡網(wǎng)絡的分析。國際著名信息可視化專家陳超美教授開發(fā)的基于引文分析理論的信息可視化應用程序CiteSpace把研究領域概念化為從知識基礎映射到研究前沿的概念模型,即研究領域被概念化為研究前沿和知識基礎兩者之間的時變映射,而研究前沿是時間變量映射的定義域,其知識基礎是映射的值域[16]。在CiteSpace中,知識基礎是共引文獻網(wǎng)絡,研究前沿由引用這些知識基礎的施引文獻集合組成,而研究前沿領域是從施引文獻中提取的與新趨勢和突變密切相關的專業(yè)名詞術語,且共被引文章和引用這些文章的術語的復合網(wǎng)絡中可用研究前沿專業(yè)術語概念來作為共引聚類的標簽[17-20]。目前,CiteSpace以繪制知識圖譜的方式常被作為探測學科或領域研究前沿的工具之一[21-25]。
根據(jù)研究需要,在CiteSpace功能與參數(shù)設置區(qū)域中進行相應設置:數(shù)據(jù)分析時間從2012-2016年,以1年為時區(qū)切割;節(jié)點類型選擇Cited Reference,數(shù)據(jù)閾值設定前中后3個時間段的最低被引頻次、本時間切片中共被引頻次、共被引率的參數(shù)值為(2,2,20)、(4,3,20)、(3,3,20);同時網(wǎng)絡節(jié)點的關聯(lián)強度計算方法、可視化結果視圖等選擇默認。經(jīng)過數(shù)據(jù)運行和可視化處理生成對應的可視化網(wǎng)絡,并在文獻共引網(wǎng)絡結果可視化界面中進行聚類處理,聚類的標簽大小按照聚類規(guī)模進行顯示。為進一步實現(xiàn)聚類的命名處理,從施引文獻的關鍵詞中提取名詞性術語進行聚類命名,這些聚類命名可反映出國內(nèi)人文社會科學領域的大數(shù)據(jù)研究前沿,本文的名詞術語提取方法采用對數(shù)似然率算法(Log-likelihood Ratio,簡稱LLR)。圖2是基于CSSCI的大數(shù)據(jù)研究文獻共被引網(wǎng)絡及其聚類可視化圖譜,網(wǎng)絡節(jié)點數(shù)量163,網(wǎng)絡連線數(shù)量431,網(wǎng)絡密度為(2×431)/(163×162)=003264。圖2中網(wǎng)絡模塊化數(shù)值Modularity Q=06499,表明網(wǎng)絡聚類效果較好,其社團結構表現(xiàn)顯著,反映聚類內(nèi)部網(wǎng)絡同質性的平均Silhouette數(shù)值=03831。
圖2中節(jié)點及其對應標簽字體大小反映出文獻的被引頻次,即文獻被引頻次越高,表現(xiàn)為節(jié)點及其對應標簽字體越大。選取被引頻次≥20的共計6篇文獻作為國內(nèi)人文社會科學大數(shù)據(jù)研究的高被引文獻?;贑SSCI數(shù)據(jù)庫來看,按照被引頻次高低,這些重要文獻依次如下:第一篇是2013年孟小峰和慈祥發(fā)表的《大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)》,被引頻次高達66,該文基于對國內(nèi)外大數(shù)據(jù)研究成果的梳理和總結,首先探討了大數(shù)據(jù)的基本概念與應用問題,然后從大數(shù)據(jù)處理的模式與基本流程兩個方面分析了大數(shù)據(jù)處理框架問題,并從云計算、大數(shù)據(jù)處理工具兩個層面分析了大數(shù)據(jù)管理的關鍵技術,最后從大數(shù)據(jù)集成、大數(shù)據(jù)分析、大數(shù)據(jù)隱私問題、大數(shù)據(jù)能耗問題、大數(shù)據(jù)處理與硬件的協(xié)同、大數(shù)據(jù)管理易用性問題、性能的測試基準7個方面探討了目前大數(shù)據(jù)研究面臨的新挑戰(zhàn)[26]。第二篇是李國杰和程學旗發(fā)表的《大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考》一文,被引頻次高達62,該文分析了何謂大數(shù)據(jù)的問題,闡述了開展大數(shù)據(jù)研究的重要意義,從“數(shù)據(jù)科學”研究對象、數(shù)據(jù)關系網(wǎng)絡、大數(shù)據(jù)研究中的關聯(lián)關系與因果關系、社會科學的大數(shù)據(jù)研究、數(shù)據(jù)處理的復雜性研究、科學第四范式等六大方面探索了大數(shù)據(jù)的科學問題,并從大數(shù)據(jù)的表示方法、存儲與融合、處理與分析工具等方面討論了大數(shù)據(jù)面臨的挑戰(zhàn),最后提出了對大數(shù)據(jù)發(fā)展戰(zhàn)略四大建議:優(yōu)先支持網(wǎng)絡大數(shù)據(jù)研究、大數(shù)據(jù)科學的基礎研究、大數(shù)據(jù)研究的組織方式、大數(shù)據(jù)研究的資源支持[27]。第三篇是2013年馮芷艷等發(fā)表的《大數(shù)據(jù)背景下商務管理研究若干前沿課題》,被引39次,該文從管理學的角度探討大數(shù)據(jù)對于現(xiàn)代企業(yè)生產(chǎn)管理和商務運營決策等方面帶來的變革與沖擊的研究,提出了3個重要研究視角,分別是社會化的價值創(chuàng)造、網(wǎng)絡化的企業(yè)運作、實時化的市場洞察,并討論了四大重要的研究方向與課題,分別是社會化網(wǎng)絡環(huán)境中的行為機理與社會資本結構、企業(yè)網(wǎng)絡生態(tài)系統(tǒng)及其協(xié)同共生機制、大數(shù)據(jù)環(huán)境下的顧客洞察與市場營銷策略、基于大數(shù)據(jù)的商業(yè)模式創(chuàng)新[28]。第四篇是2013年鄔賀銓發(fā)表的《大數(shù)據(jù)時代的機遇與挑戰(zhàn)》,被引25次,該文從宏觀經(jīng)濟、制造業(yè)、農(nóng)業(yè)領域、醫(yī)療保健領域等方面探討了大數(shù)據(jù)應用領域,并從大數(shù)據(jù)挖據(jù)的數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)處理、可視化呈現(xiàn)四大環(huán)節(jié)探討了大數(shù)據(jù)技術應用的挑戰(zhàn)[29]。第五篇是王珊等發(fā)表的《架構大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望》,被引20次,該文討論了大數(shù)據(jù)分析平臺需具備的特性,并評價、歸納與對比分析了大數(shù)據(jù)分析的主流實現(xiàn)平臺:并行數(shù)據(jù)庫、MapReduce及兩者的混合架構[30]。第六篇是2012年樊偉紅等發(fā)表的《圖書館需要怎樣的“大數(shù)據(jù)”》,被引20次,該文研究了大數(shù)據(jù)給圖書館帶來的挑戰(zhàn)與機遇,并提出大數(shù)據(jù)技術及服務可能給圖書館新型知識服務帶來的幫助包括:建立知識服務及業(yè)務建設的風險模型、用戶流失分析及價值分析、新型知識服務引擎建設、預測可能的資源故障、網(wǎng)絡化信息資源智能組合方式、對圖書館自然環(huán)境、人文環(huán)境及技術環(huán)境數(shù)據(jù)多維度大數(shù)據(jù)的智能分析及智能輔助決策等[31]。除通過文獻被引頻次來識別重要性節(jié)點外,還可通過節(jié)點的中介中心性來對衡量文獻重要性,進而發(fā)現(xiàn)領域內(nèi)重要的知識基礎文獻[32-33]。節(jié)點中介中心性高低可表征對應文獻在學科領域的研究橋梁作用,具有高中介中心性的文獻是某時間段內(nèi)該學科領域知識演化網(wǎng)絡中的轉折點。在CiteSpace中,中介中心性數(shù)值Centrality≥01的節(jié)點為高中介中心性關鍵點,節(jié)點在圖譜中表現(xiàn)為具有紫色外圈。表5是基于CSSCI的大數(shù)據(jù)關鍵節(jié)點文獻(Centrality≥01)。
圖2中為突出顯示規(guī)模較大的一些主要聚類結果,過濾相對較小規(guī)模的聚類,在設置圖譜的最小可見的聚類規(guī)模大小數(shù)值=10。從圖2的聚類命名結果(LLR算法)來看,基于CSSCI的人文社會科學領域的大數(shù)據(jù)研究前沿主要包括六大聚類,按照聚類規(guī)模大小依次是:#0 企業(yè)(25)(Silhouette=0788)、#1公共治理(24)(Silhouette=0725)、#2企業(yè)生態(tài)系統(tǒng)(23)(Silhouette=0802)、#3公共圖書館(22)(Silhouette=0873)、#4程式化(17)(Silhouette=0716)、#5教育大數(shù)據(jù)(16)(Silhouette=0854)。從各聚類的Silhouette數(shù)值來看,聚類成員的相似性較高。本文以LLR算法的命名結果為基礎,并通過進一步分析各聚類對應的施引文獻列表中引用該聚類的文獻比例較高(引用比例≥10%)的施引文獻標題與摘要等信息進一步對六大聚類反映的研究前沿進行解釋命名,分別是面向大數(shù)據(jù)的企業(yè)競爭情報研究、大數(shù)據(jù)時代社會治理與公共服務創(chuàng)新、基于網(wǎng)絡大數(shù)據(jù)的企業(yè)生態(tài)系統(tǒng)建模、大數(shù)據(jù)時代公共圖書館的服務創(chuàng)新與發(fā)展、數(shù)據(jù)新聞——大數(shù)據(jù)時代新聞內(nèi)容生產(chǎn)的新模式、教育大數(shù)據(jù)及其應用。
31面向大數(shù)據(jù)的企業(yè)競爭情報研究
大數(shù)據(jù)本身具有的各種特性,以及大數(shù)據(jù)處理技術給以數(shù)據(jù)挖掘與分析為基礎的企業(yè)競爭情報帶來新的發(fā)展機遇與創(chuàng)新路徑。大數(shù)據(jù)分析在對象、運用的方法和目標等方面都與企業(yè)競爭情報研究存在交集,大數(shù)據(jù)及其技術所帶來的信息生態(tài)環(huán)境的新變化必然會對企業(yè)競爭情報帶來深刻的影響[34]。從數(shù)據(jù)全面、社會化和及時傳播等特性來看,大數(shù)據(jù)有利于提高競爭情報的真實性、精準性以及實時性[35]。大數(shù)據(jù)時代的競爭情報發(fā)展動向將更加重視動態(tài)競爭情報的分析,即如何從高速動態(tài)變化的大數(shù)據(jù)中獲得動態(tài)競爭情報[36]。大數(shù)據(jù)環(huán)境下的企業(yè)競爭情報工作需圍繞結構化、半結構化和非結構化大數(shù)據(jù)三方面進行動態(tài)信息全生命周期中各個環(huán)節(jié)等管理。有學者指出,企業(yè)只有不斷基于獲取的動態(tài)數(shù)據(jù)轉化為可供決策的動態(tài)情報,才能適應大數(shù)據(jù)時代的競爭,并探討了面向大數(shù)據(jù)的企業(yè)競爭情報動態(tài)運行模式MDD,即以面向大數(shù)據(jù)的企業(yè)競爭情報監(jiān)控機制、面向大數(shù)據(jù)的企業(yè)競爭情報發(fā)現(xiàn)機制、面向大數(shù)據(jù)的企業(yè)競爭情報決策支持機制三者為核心,三者相互配合,并與情報價值鏈條和情報目標鏈條各個環(huán)節(jié)結合的新模式[37]。同時,基于大數(shù)據(jù)的企業(yè)競爭情報動態(tài)信息處理體系具有參與資源的多維異構性、參與資源的跨域關聯(lián)性、情報處理過程的多維自組織性、競爭情報服務的多模態(tài)性、競爭情報服務模式的顛覆性、體系的可持續(xù)發(fā)展性[38]。總之,面向大數(shù)據(jù)的企業(yè)競爭情報相關研究,特別是面向大數(shù)據(jù)的企業(yè)競爭情報動態(tài)信息處理與分析的理論、模式、體系、方法、技術平臺等研究內(nèi)容理應成為學界研究者關注和亟待解決的焦點。
32大數(shù)據(jù)時代社會治理與公共服務創(chuàng)新
基于數(shù)據(jù)化的政府管理理念與機制,并科學化推動社會治理模式與公共服務方式的創(chuàng)新是大數(shù)據(jù)時代對智慧政府及其管理的現(xiàn)實要求。大數(shù)據(jù)技術為政府公共服務改善與創(chuàng)新工作帶來的發(fā)展機遇,使政府能以創(chuàng)新的方式和形式提供公共服務,并可助力實現(xiàn)公共治理在服務效率、管理效能與公眾滿意度等方面的不斷提升[39]。大數(shù)據(jù)時代所帶來數(shù)據(jù)和信息生態(tài)環(huán)境的改變給政府社會治理和公共服務領域帶來了重大應用價值。基于大數(shù)據(jù)技術能夠解決的政府公共治理難題包括諸如公共安全、公共危機管理、食品安全監(jiān)管、智能交通、公共衛(wèi)生與醫(yī)療、工作就業(yè)等[40]。從構成內(nèi)容來看,大數(shù)據(jù)公共治理主要包括政府云服務平臺、移動電子政務、數(shù)據(jù)開放運動以及制度保障4個方面[41]?;诙嘣髷?shù)據(jù)的社會治理與公共服務創(chuàng)新是智慧政府的重要治理特點和方式。大數(shù)據(jù)時代所帶來的社會治理創(chuàng)新路徑轉向方式包括:從經(jīng)驗治理導向到精準治理導向、從封閉到開放、從碎片化到整體化、從政府主導走向政社合作治理[42]。大數(shù)據(jù)時代的新型數(shù)據(jù)處理技術與國家公共治理過程的精密融合,為實現(xiàn)基于大數(shù)據(jù)的高效率、高智能、高精準國家社會治理與公共服務創(chuàng)新模式提供了重要突破口,并進而為打造智慧政府提供重要支撐。基于大數(shù)據(jù)的社會治理與公共服務創(chuàng)新研究前景廣闊,是大數(shù)據(jù)時代人文社會科學視野下開展社會公共管理研究的重要熱點領域。
33基于網(wǎng)絡大數(shù)據(jù)的企業(yè)生態(tài)系統(tǒng)建模
大數(shù)據(jù)及其技術應用正以各種方式對現(xiàn)代企業(yè)管理決策活動產(chǎn)生影響,對企業(yè)生存至關重要的企業(yè)生態(tài)系統(tǒng)也面臨著大數(shù)據(jù)時代的新變革和新挑戰(zhàn)。大數(shù)據(jù)時代企業(yè)生態(tài)系統(tǒng)的產(chǎn)業(yè)運行環(huán)境、運營模式、合作方式、客戶市場等方面出現(xiàn)了新的特征與變化,基于大數(shù)據(jù)的企業(yè)生態(tài)系統(tǒng)演化與構建是迫切需要研究的現(xiàn)實問題[43]。該研究主題可研究大數(shù)據(jù)環(huán)境下基于社會媒體的企業(yè)生態(tài)系統(tǒng)微觀個體建模、行為規(guī)律與交互模式及其宏觀組織結構、共生協(xié)同演化及其系統(tǒng)穩(wěn)定性等關鍵問題,構建可持續(xù)發(fā)展的企業(yè)網(wǎng)絡生態(tài)鏈[28]。如何實現(xiàn)基于網(wǎng)絡大數(shù)據(jù)驅動的具有可持續(xù)發(fā)展特性的企業(yè)生態(tài)系統(tǒng)是大數(shù)據(jù)對于現(xiàn)代企業(yè)管理領域的新變革,對于現(xiàn)代企業(yè)的科學化管理與決策具有十分重要的作用。因此,基于網(wǎng)絡大數(shù)據(jù)的企業(yè)生態(tài)系統(tǒng)建模研究將是大數(shù)據(jù)時代下學術界和企業(yè)界所關心的重要焦點問題。
34大數(shù)據(jù)時代公共圖書館的服務創(chuàng)新與發(fā)展
一方面,大數(shù)據(jù)與信息、知識之間存在十分重要的關聯(lián);另一方面,大數(shù)據(jù)技術及其應用不可避免地對圖書館及其服務產(chǎn)生影響。因而圖書情報學成為國內(nèi)人文社會科學領域較早對大數(shù)據(jù)相關問題開展研究的主要學科,目前該學科已成為推動大數(shù)據(jù)研究領域的一股重要發(fā)展力量。公共圖書館掌握著巨大的數(shù)據(jù)資源和信息資源,大數(shù)據(jù)技術在公共圖書館的應用是業(yè)務和時代雙重發(fā)展的需要。大數(shù)據(jù)環(huán)境下,以信息處理與信息服務作為優(yōu)勢的圖書館所開展的服務范圍和業(yè)務領域將有更大的擴展和延伸,數(shù)據(jù)分析服務、數(shù)據(jù)挖掘服務將成為圖書館知識服務體系創(chuàng)新的制高點[44]。大數(shù)據(jù)為公共圖書館帶來的發(fā)展契機與影響主要表現(xiàn)在三方面:大數(shù)據(jù)幫助公共圖書館建立和完善新的知識服務、大數(shù)據(jù)為公共圖書館拓展公共服務提供強有力的技術支撐、大數(shù)據(jù)對公共圖書館的數(shù)據(jù)存儲能力和計算能力提出新的挑戰(zhàn)[45]。如何實現(xiàn)基于大數(shù)據(jù)驅動的新型公共圖書館服務模式、業(yè)務內(nèi)容、技術平臺、應用前景及其績效評價等問題,還亟待圖書情報學等研究人員的積極探討。
35數(shù)據(jù)新聞——大數(shù)據(jù)時代新聞內(nèi)容生產(chǎn)的新模式數(shù)據(jù)新聞又稱之為數(shù)據(jù)驅動新聞,是指對基于可以公開獲取的數(shù)據(jù)進行分析與過濾進而創(chuàng)作出新聞報道的方式,數(shù)據(jù)新聞有助于實踐“開放新聞”的理念,同時數(shù)據(jù)可視化是數(shù)據(jù)新聞的重要組成部分之一[46]。數(shù)據(jù)新聞作為大數(shù)據(jù)時代新聞內(nèi)容生產(chǎn)的新模式,作為基于數(shù)據(jù)驅動的新聞制作新理念對傳統(tǒng)新聞內(nèi)容生產(chǎn)的思路與流程產(chǎn)生了一定的影響。大數(shù)據(jù)對新聞生產(chǎn)的影響表現(xiàn)為新聞生產(chǎn)主體從單一到多元的轉變、新聞生產(chǎn)內(nèi)容從事實報道到探求規(guī)律的轉變、新聞生產(chǎn)方式從專業(yè)生產(chǎn)到技術生產(chǎn)[47]。同時在數(shù)據(jù)新聞的理念逐漸被接受的同時,也有學者指出,大數(shù)據(jù)技術應用到傳媒行業(yè)時,要深刻反思大數(shù)據(jù)技術的兩面性并予以警醒,并針對大數(shù)據(jù)對新聞內(nèi)容生產(chǎn)方面的局限也進行了深入探討[48]。如何通過在新聞傳媒領域科學合理地運用大數(shù)據(jù)及其技術,通過數(shù)據(jù)新聞的揚長避短從而實現(xiàn)新聞內(nèi)容生產(chǎn)創(chuàng)新模式將是大數(shù)據(jù)時代下新聞傳播學界的重要話題。
36教育大數(shù)據(jù)及其應用
教育大數(shù)據(jù)對教育領域改革與創(chuàng)新發(fā)展具有重要作用。從戰(zhàn)略層面來看,教育大數(shù)據(jù)應定位為推動教育變革的新型戰(zhàn)略資產(chǎn)、推進教育領域綜合改革的科學力量以及發(fā)展智慧教育的基石[49]。大數(shù)據(jù)及其技術應用有利于促使教育機構的績效提升和科學過程管理。目前基于教育大數(shù)據(jù)的應用服務包括:實現(xiàn)在線學習預警[50]、個性化和自適應學習系統(tǒng)[51]、MOOC的資源開發(fā)范式[52]、常態(tài)化教學及其管理[53]。大數(shù)據(jù)及其技術的快速發(fā)展和在各行業(yè)的廣泛應用,引起了教育行業(yè)領域的高度重視,如何基于大數(shù)據(jù)技術將教育領域所積累的海量數(shù)據(jù)轉變?yōu)榻逃I域的科學管理決策方案已成為大數(shù)據(jù)環(huán)境下教育領域的新熱點和新趨勢。
參考文獻
[1]陳泓茹,趙寧,汪偉.大數(shù)據(jù)融入人文社科研究的基本問題[J].學術論壇,2015,38(12):106-110.
[2]歐陽康.大數(shù)據(jù)與人文社會科學研究的變革與創(chuàng)新[N].光明日報,2016-11-10,(16).
[3]趙蓉英,魏緒秋.計量視角下的我國人文社會科學領域大數(shù)據(jù)研究熱點挖掘與分析[J].情報雜志,2016,35(2):93-98.
[4]湯建民.中國人文社會科學各學科研究論文特征的計量分析[J].科學學研究,2011,29(7):991-998.
[5]譚春輝.高校哲學社會科學創(chuàng)新能力評價指標體系構建研究[J].重慶大學學報:社會科學版,2010,16(2):70-75.
[6]王富國.基于CSSCI的圖書情報學互引分析[J].圖書館,2015,(6):52-59.
[7]馬費成,陳柏彤.我國人文社會科學學科多樣性研究[J].情報科學,2015,33(1):3-8.
[8]呂紅,馬海群.國內(nèi)政府信息公開研究現(xiàn)狀與展望——邁向政府數(shù)據(jù)開放[J].現(xiàn)代情報,2016,36(5):158-164.
[9]楊良選,李自力,王浩.基于CiteSpace Ⅱ的研究前沿可視化分析[J].情報學報,2011,30(8):883-889.
[10]Price D J D S.Networks of scientific papers:The pattern of bibliographic references indicates the nature of the scientific research front[J].Science,1965,149(3683):510-515.
[11]Morris S A,Yen G,Wu Z,et al.Time line visualization of research fronts[J].Journal of the Association for Information Science and Technology,2003,54(5):413-422.
[12]陳超美,陳悅,侯劍華,等.CiteSpace Ⅱ:科學文獻中新趨勢與新動態(tài)的識別與可視化[J].情報學報,2009,28(3):401-421.
[13]許曉陽,鄭彥寧,趙筱媛,等.研究前沿識別方法的研究進展[J].情報理論與實踐,2014,37(6):139-144.
[14]王立學,冷伏海.簡論研究前沿及其文獻計量識別方法[J].情報理論與實踐,2010,33(3):54-58.
[15]Persson O.The intellectual base and research fronts of JASIS 1986-1990[J].Journal of the Association for Information Science and Technology,1994,45(1):31-38.
[16]Chen C.CiteSpace Ⅱ:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the Association for Information Science and Technology,2006,57(3):359-377.
[17]Chen C.Searching for intellectual turning points:progressive knowledge domain visualization[J].Proceedings of the National Academy of Sciences,2004,101(suppl):5303-5310.
[18]Chen C,Leydesdorff L.Patterns of connections and movements in dual-map overlays:A new method of publication portfolio analysis[J].Journal of the Association for Information Science and Technology,2014,65(2):334-351.
[19]Chen C.Predictive effects of structural variation on citation counts[J].Journal of the Association for Information Science and Technology,2012,63(3):431-449.
[20]Chen C,Ibekwe-Sanjuan F,Hou J.The structure and dynamics of cocitation clusters:A multiple-perspective cocitation analysis[J].Journal of the Association for Information Science and Technology,2010,61(7):1386-1409.
[21]侯劍華,胡志剛.CiteSpace軟件應用研究的回顧與展望[J].現(xiàn)代情報,2013,33(4):99-103.
[22]葛莉,劉則淵.國際創(chuàng)業(yè)教育研究前沿的可視化分析[J].教育科學,2011,27(2):8-14.
[23]許振亮,郭曉川.50年來國際技術創(chuàng)新研究前沿的演進歷程——基于科學知識圖譜視角[J].科學學研究,2012,30(1):44-59.
[24]Chen C,Dubin R,Kim M C.Emerging trends and new developments in regenerative medicine:a scientometric update(2000-2014)[J].Expert Opinion on Biological Therapy,2014,14(9):1295-1317.
[25]Kim M C,Chen C.A scientometric review of emerging trends and new developments in recommendation systems[J].Scientometrics,2015,104(1):239-263.
[26]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.
[27]李國杰,程學旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J].中國科學院院刊,2012,27(6):5-15.
[28]馮芷艷,郭迅華,曾大軍,等.大數(shù)據(jù)背景下商務管理研究若干前沿課題[J].管理科學學報,2013,16(1):1-9.
[29]鄔賀銓.大數(shù)據(jù)時代的機遇與挑戰(zhàn)[J].求是,2013,(4):47-49.
[30]王珊,王會舉,覃雄派,等.架構大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計算機學報,2011,34(10):1741-1752.
[31]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012,(11):63-68,77.
[32]趙蓉英,王菊.圖書館學知識圖譜分析[J].中國圖書館學報,2011,37(2):40-50.
[33]邱均平,呂紅.近五年國際圖書情報學研究熱點、前沿及其知識基礎——基于17種外文期刊知識圖譜的可視化分析[J].圖書情報知識,2013,(3):4-15.
[34]黃曉斌,鐘輝新.大數(shù)據(jù)時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展[J].圖書與情報,2012,(6):9-14.
[35]吳金紅,張飛,鞠秀芳.大數(shù)據(jù):企業(yè)競爭情報的機遇、挑戰(zhàn)及對策研究[J].情報雜志,2013,(1):5-9.
[36]劉高勇,汪會玲,吳金紅.大數(shù)據(jù)時代的競爭情報發(fā)展動向探析[J].圖書情報知識,2013,(2):105-111.
[37]鐘輝新,張興旺,黃曉斌.面向大數(shù)據(jù)的企業(yè)競爭情報動態(tài)運行模式MDD:監(jiān)控、發(fā)現(xiàn)、決策的互動[J].情報理論與實踐,2014,37(3):6-11.
[38]張興旺,麥范金,李晨暉.基于大數(shù)據(jù)的企業(yè)競爭情報動態(tài)信息處理的內(nèi)涵及共性技術體系研究[J].情報理論與實踐,2014,37(3):121-128.
[39]馬亮.大數(shù)據(jù)技術何以創(chuàng)新公共治理?——新加坡智慧國案例研究[J].電子政務,2015,(5):2-9.
[40]趙強,單煒.大數(shù)據(jù)政府創(chuàng)新:基于數(shù)據(jù)流的公共價值創(chuàng)造[J].中國科技論壇,2014,(12):23-27.
[41]高奇琦,陳建林.大數(shù)據(jù)公共治理:思維、構成與操作化[J].人文雜志,2016,(6):103-111.
[42]陶希東.大數(shù)據(jù)時代中國社會治理創(chuàng)新的路徑與戰(zhàn)略選擇[J].南京社會科學,2016,(6):85-90.
[43]資武成.“大數(shù)據(jù)”時代企業(yè)生態(tài)系統(tǒng)的演化與建構[J].社會科學,2013,(12):55-62.
[44]程蓮娟.美國推進大數(shù)據(jù)的應用實踐及其有益借鑒——基于圖書館視角的分析[J].情報資料工作,2013,34(5):110-112.
[45]容春琳.公共圖書館應用大數(shù)據(jù)的策略研究[J].圖書館建設,2013,(7):91-95.
[46]章戈浩.作為開放新聞的數(shù)據(jù)新聞——英國《衛(wèi)報》的數(shù)據(jù)新聞實踐[J].新聞記者,2013,(6):7-13.
[47]黃俊華.大數(shù)據(jù)時代新聞生產(chǎn)的挑戰(zhàn)及其應對策略[J].新聞傳播,2014,(12):75-76.
[48]左艷紅.大數(shù)據(jù)對新聞內(nèi)容生產(chǎn)的局限[J].編輯之友,2014,(8):63-65.
[49]楊現(xiàn)民,唐斯斯,李冀紅.發(fā)展教育大數(shù)據(jù):內(nèi)涵、價值和挑戰(zhàn)[J].現(xiàn)代遠程教育研究,2016,(1):50-61.
[50]王林麗,葉洋,楊現(xiàn)民.基于大數(shù)據(jù)的在線學習預警模型設計——“教育大數(shù)據(jù)研究與實踐專欄”之學習預警篇[J].現(xiàn)代教育技術,2016,26(7):5-11.
[51]萬海鵬,汪丹.基于大數(shù)據(jù)的牛頓平臺自適應學習機制分析——“教育大數(shù)據(jù)研究與實踐專欄”之關鍵技術篇[J].現(xiàn)代教育技術,2016,26(5):5-11.
[52]吳南中.教育大數(shù)據(jù)應用于MOOC的資源開發(fā)范式研究[J].中國遠程教育,2015(8):23-29.
[53]孫眾,宋潔,姚夏晶,等.教育大數(shù)據(jù)的課堂應用新形態(tài)——“教育大數(shù)據(jù)研究與實踐專欄”之教學應用篇[J].現(xiàn)代教育技術,2016,26(9):5-10.
(本文責任編輯:郭沫含)