国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

當(dāng)代語(yǔ)言技術(shù)研究前沿與發(fā)展趨勢(shì)*

2015-11-12 01:10:42張延成
關(guān)鍵詞:交叉圖譜群體

張延成, 孫 婉

(武漢大學(xué) 文學(xué)院,湖北 武漢430072)

一、引 言

本文不同于傳統(tǒng)的學(xué)術(shù)研究綜述。在傳統(tǒng)的學(xué)術(shù)研究觀念中,研究綜述的撰寫(xiě)是各研究領(lǐng)域極其重要,且很有難度的工作——一般情況下只有對(duì)本領(lǐng)域研究現(xiàn)狀非常熟悉,且已在該領(lǐng)域做出開(kāi)創(chuàng)性成果的學(xué)者可以勝任。此外,傳統(tǒng)的研究綜述撰寫(xiě)受到作者知識(shí)結(jié)構(gòu)和主觀性的影響,存在對(duì)研究領(lǐng)域全貌概括不完整、對(duì)學(xué)科交叉領(lǐng)域特性描述不確切、對(duì)學(xué)科研究熱點(diǎn)把握不準(zhǔn)確等諸多問(wèn)題。在當(dāng)今資訊高度流動(dòng)、學(xué)術(shù)數(shù)據(jù)量劇增的情況下,這種影響可能更為嚴(yán)重。然而,隨著文獻(xiàn)計(jì)量學(xué)理論和技術(shù)的發(fā)展,處理學(xué)術(shù)大數(shù)據(jù)的可視化方法的逐漸成熟,適時(shí)將其理論和方法引入學(xué)科研究綜述的撰寫(xiě)中,對(duì)迅速把握專門(mén)領(lǐng)域重要文獻(xiàn)、研究組織和地域、研究團(tuán)隊(duì)和重要學(xué)者、研究熱點(diǎn)和趨勢(shì)、學(xué)科交叉與創(chuàng)新等情況等大有裨益。這種做法可以較好地避免傳統(tǒng)研究綜述機(jī)械地按照時(shí)間、國(guó)內(nèi)外研究這類低維度寫(xiě)法帶來(lái)的諸多問(wèn)題。目前這種文獻(xiàn)計(jì)量式的綜述或研究方式已有相當(dāng)數(shù)量的研究成果,但在語(yǔ)言學(xué)研究領(lǐng)域則比較匱乏。本文就是一次嘗試。

我們選擇“語(yǔ)言技術(shù)”為主題。語(yǔ)言技術(shù)(Language Technology)按中國(guó)科學(xué)技術(shù)信息研究所的定義:“即自然語(yǔ)言處理技術(shù)(Natural language processing,NLP),又稱人類語(yǔ)言技術(shù)(Human language technology),包括書(shū)面語(yǔ)言文本處理(Text processing)和語(yǔ)音、口語(yǔ)處理(Speech processing)兩大技術(shù)范圍?!雹賲⒖粗袊?guó)科學(xué)技術(shù)信息研究所網(wǎng)站:http://www.istic.ac.cn/?TabId=332這個(gè)定義的語(yǔ)言技術(shù)是狹義的,它廣泛運(yùn)用于教育教學(xué)、通信工程、信息管理、科學(xué)研究等領(lǐng)域,是當(dāng)代技術(shù)發(fā)展的熱點(diǎn)之一。廣義的語(yǔ)言技術(shù)還包含與人類語(yǔ)言和言語(yǔ)研究及應(yīng)用密切關(guān)聯(lián)的一切技術(shù)領(lǐng)域。本文以“l(fā)anguage”和(and)“technology”為主題詞在SCI、SSCI、A&HCI網(wǎng)絡(luò)數(shù)據(jù)庫(kù)“Web of Science”中檢索,所得結(jié)果基本涵蓋以上狹義和廣義的“語(yǔ)言技術(shù)”研究的文獻(xiàn)。我們?cè)噲D以這種寬泛的主題詞檢索方式,通過(guò)文獻(xiàn)計(jì)量方法考察“語(yǔ)言”和“技術(shù)”關(guān)聯(lián)或交叉的研究前沿、熱點(diǎn)與趨勢(shì),以作為語(yǔ)言學(xué)研究及相關(guān)領(lǐng)域科技情報(bào)綜合利用的參考。

二、研究方法的說(shuō)明

本文基于可視化理論基礎(chǔ),擬借助信息可視化軟件,使用可視化建模分析方法,包括共引分析、共詞分析、信息可視化等方法,繪制語(yǔ)言技術(shù)研究領(lǐng)域的文獻(xiàn)共引網(wǎng)絡(luò)圖譜、關(guān)鍵詞演進(jìn)圖譜等,直觀地展示并分析語(yǔ)言技術(shù)研究核心文獻(xiàn)、領(lǐng)域交叉性、研究群體以及研究前沿及發(fā)展趨勢(shì)。

Citespace是一款優(yōu)秀的可視化軟件,可將引文分析、聚類分析、網(wǎng)絡(luò)分析等在知識(shí)單元分析的基礎(chǔ)上結(jié)合并集成起來(lái),并融入數(shù)據(jù)挖掘、計(jì)算機(jī)圖形學(xué)、圖像技術(shù)、智能技術(shù)及相關(guān)先進(jìn)算法等手段與方法,進(jìn)行跨學(xué)科的綜合創(chuàng)新,從而形成適于多元、分時(shí)、動(dòng)態(tài)網(wǎng)絡(luò)分析的新一代可視化技術(shù),可以作為基于知識(shí)單元分析的知識(shí)計(jì)量學(xué)普遍應(yīng)用的新工具。本文數(shù)據(jù)均用2013年6月更新的CitespaceⅢ3.6.R2 (64-bit)版本統(tǒng)計(jì)。①呂一博,康宇航.基于共現(xiàn)分析的科技監(jiān)測(cè)地圖繪制及實(shí)證研究[J].科學(xué)學(xué)研究,2010,(10).

數(shù)據(jù)源是“Web of Science”中SCI、SSCI、A&HCI數(shù)據(jù)庫(kù),年代區(qū)間為2003年到2013年,共得到4952篇文獻(xiàn)。為了保證研究的準(zhǔn)確性,將每一年作為一個(gè)單位時(shí)間切片,將知識(shí)圖譜節(jié)點(diǎn)分別設(shè)置為“作者(Author)”、“關(guān)鍵詞(Keyword)”、“領(lǐng)域(Category)”、“國(guó)家(Country)”、“機(jī)構(gòu)”(Institution)等,使用含有文獻(xiàn)標(biāo)題、作者、發(fā)表期刊、資助基金、摘要、關(guān)鍵詞等信息的文件進(jìn)行知識(shí)圖譜分析。

為了能夠凸顯重要文獻(xiàn)和重要作者對(duì)學(xué)科演進(jìn)的特點(diǎn),我們?cè)谥R(shí)圖譜繪制之前對(duì)文獻(xiàn)被引頻次(c)、兩篇文獻(xiàn)共引頻次(cc)、文獻(xiàn)共引系數(shù)(ccv)的值進(jìn)行了相應(yīng)的限制,這些參數(shù)表明知識(shí)圖譜節(jié)點(diǎn)之間關(guān)系的密切程度(MALL H,1973)②MALL H.1973Co-citation in Scientific Literature:A New Measure Of The Relationship Between Publications,Journal of the America Society of Information Science,24(4):265~269.。為了保證知識(shí)圖譜的辨識(shí)度,在圖譜繪制的過(guò)程中運(yùn)用“路徑搜索(pathfinder)”算法(Chen C,Morris S,2003)③Chen,C.,Morris,S.Visualizing Evolving Networks:Minimum Spanning Trees Versus Pathfinder Networks[J].Proceedings of IEEE Symposium on Information Visualization,IEEE Computer Society Press,2003:67~74.對(duì)知識(shí)圖譜的網(wǎng)絡(luò)進(jìn)行了簡(jiǎn)化。

筆者將檢索所得的Web of Science數(shù)據(jù)庫(kù)文獻(xiàn)記錄以純文本格式保存到電腦,再分步驟導(dǎo)入CitespaceⅢ進(jìn)行運(yùn)算和知識(shí)圖譜生成與繪制。

三、研究進(jìn)展的分析

下面從高頻被引文獻(xiàn)研究領(lǐng)域分析語(yǔ)言技術(shù)研究學(xué)科群、學(xué)科交叉、研究方向和關(guān)鍵詞演進(jìn)等。

(一)學(xué)科群體與領(lǐng)域交叉性分析

通過(guò)提取2003至2013年每一年文獻(xiàn)信息中被引用頻率最多的前10%的文獻(xiàn)信息進(jìn)行研究領(lǐng)域(category)分析,得到語(yǔ)言技術(shù)研究主要學(xué)科領(lǐng)域研究聚集形成的學(xué)科群體知識(shí)圖譜,如圖1所示。

圖1 語(yǔ)言技術(shù)研究涉及的主要學(xué)科群與交叉領(lǐng)域知識(shí)圖譜

中多層分色同心圓(黑白圖表現(xiàn)深淺差異)表示年度區(qū)間總引文量,深淺層次不同圓環(huán)(彩打情況下顯示不同顏色)對(duì)應(yīng)文獻(xiàn)在不同年份被引,圖上方彩條標(biāo)明色彩(黑白圖表現(xiàn)為深淺差異)與年份的對(duì)應(yīng)關(guān)系。同心圓中心出現(xiàn)深色的圓,則代表突顯領(lǐng)域,即新興研究領(lǐng)域。例如,計(jì)算機(jī)科學(xué)(Computer Science)、教育與教育研究(Education &Educational Research)同心圓即如此,表明它們?yōu)檠杆侔l(fā)展的新興領(lǐng)域。多邊形表示形成聚類的研究領(lǐng)域,即學(xué)科群體。例如,康復(fù)研究(Rehabilitation)、教育(Education)、計(jì)算機(jī)科學(xué)康復(fù)研究(Rehabilitation Computer Science)構(gòu)成了聚類標(biāo)簽為“#3hearing”的學(xué)科群體。

為了能夠清楚地展示交叉學(xué)科群體的關(guān)系,圖片做了凸顯和簡(jiǎn)化處理。圖中生成的編號(hào)標(biāo)出了語(yǔ)言技術(shù)涉及的11個(gè)主要交叉學(xué)科群體,學(xué)科群體的命名來(lái)源于4952篇文獻(xiàn)使用頻率最高的索引詞。學(xué)科群體標(biāo)簽顏色的深淺表明學(xué)科輪廓值(Silhouette)的大小,輪廓值越大,標(biāo)簽顏色越深。11個(gè)主要交叉學(xué)科群體及其下屬的學(xué)科領(lǐng)域見(jiàn)表1所列。

表1 語(yǔ)言技術(shù)研究學(xué)科群及其下屬交叉領(lǐng)域

#4網(wǎng)絡(luò)特色服務(wù)的使用using web feature service信息科學(xué)與計(jì)算機(jī)科學(xué)圖書(shū)館學(xué)Information Science &Library Science Computer Science地理學(xué)Geography信息科學(xué)與圖書(shū)館學(xué)Information Science &Library Science 3 0.836 2004#3聽(tīng)覺(jué)與聽(tīng)力hearing康復(fù)研究Rehabilitation教育Education計(jì)算機(jī)科學(xué)康復(fù)研究Rehabilitation Computer Science 3 0.64 2005#1互聯(lián)網(wǎng)帶寬internet bandwidth通信Communication聲學(xué)Acoustics聽(tīng)力學(xué)與言語(yǔ)病理學(xué)Audiology & Speech-Language Pathology 3 0.449 2006#6電腦運(yùn)算computing自動(dòng)化及控制系統(tǒng)Automation & Control Systems工程學(xué)Engineering計(jì)算機(jī)科學(xué)Computer Science 3 0.095 2004#7用戶user儀器及儀表學(xué)Instruments &Instrumentation物理學(xué)Physics 2 0.87 2003#5凸性convexity運(yùn)籌學(xué)與管理科學(xué)Operations Research &Management Science運(yùn)籌學(xué)與計(jì)算機(jī)科學(xué)管理科學(xué)Operations Research & Management Science Computer Science 2 0.79 2005#10美國(guó)標(biāo)準(zhǔn)技術(shù)協(xié)會(huì)天然氣水合物研究數(shù)據(jù)庫(kù)NIST gas hydrate research database電信學(xué)Telecommunications計(jì)算機(jī)科學(xué)電信學(xué)Telecommutications Computer Science 2 1 2004

以上內(nèi)容是按照學(xué)科群體的規(guī)模大小進(jìn)行排列的。輪廓值(Silhouette)標(biāo)明學(xué)科群體的確定程度,確定程度越高形成的多邊形形狀越清晰,數(shù)值越接近1,數(shù)值為1的集群表示一個(gè)相對(duì)于其他學(xué)科領(lǐng)域獨(dú)立的學(xué)科集群。平均(mean)指數(shù)表示某學(xué)科群體形成年份,年份的早晚表示該學(xué)科群體的出現(xiàn)與發(fā)展的先后。

結(jié)合圖表信息可以看出語(yǔ)言技術(shù)研究的學(xué)科交叉極為普遍,各學(xué)科間交叉關(guān)系較為復(fù)雜,通過(guò)表中的參數(shù)可以概括出以下幾點(diǎn):

1.學(xué)科群體大小的值與確定性值不一定成正比。學(xué)科群體“#9圖書(shū)館(library)”是最大的學(xué)科群體,包括眾多領(lǐng)域,但能夠作為獨(dú)立學(xué)科群體的確定性不高,如表1所示,輪廓值(Silhouette)只有0.25,故在圖1中“#9圖書(shū)館(library)”的標(biāo)簽顏色就淺。這與圖書(shū)館的不區(qū)分學(xué)科的收藏性質(zhì)有關(guān)。該群體中,語(yǔ)言技術(shù)與諸多學(xué)科領(lǐng)域都有交集,例如,教育與教育學(xué)研究(Education & Educational Research)、健康保健科學(xué)與服務(wù)(Health Care Sciences & Services)、材料科學(xué)(Materials Science)、商學(xué)(Business)、商業(yè)管理學(xué)與經(jīng)濟(jì)學(xué)(Management Business & Economic)、信息科學(xué)與圖書(shū)館學(xué)(Information Science & Library Science)等。

2.利用規(guī)模值(Size)和輪廓值(Silhouette)確定富有潛力的新興學(xué)科群體。規(guī)模值(Size)顯示的學(xué)科確定性與學(xué)科性質(zhì)有關(guān),一般來(lái)說(shuō)理工類學(xué)科領(lǐng)域組成的學(xué)科群體確定性較強(qiáng)。例如,學(xué)科群體“#10美國(guó)標(biāo)準(zhǔn)技術(shù)協(xié)會(huì)天然氣水合物研究數(shù)據(jù)庫(kù)(NIST gas hydrate research database)”形成了相對(duì)獨(dú)立的學(xué)科,輪廓值(Silhouette)最高,主要是因?yàn)樵搶W(xué)科專業(yè)性極強(qiáng),有獨(dú)立的研究理論、標(biāo)準(zhǔn),并進(jìn)行了廣泛的實(shí)踐。但正因?yàn)閷I(yè)太強(qiáng),其規(guī)模值(Size)反而最小,僅含兩個(gè)領(lǐng)域。那些輪廓值和規(guī)模值都較高的學(xué)科群體才可能是成熟,或富有前景的。例如,“#0種子算法與基因組(seed genome)”因數(shù)學(xué)算法、編程語(yǔ)言和生物學(xué)的深入結(jié)合,顯示較高的確定性(輪廓值為0.958,加之規(guī)模值為5)較高,學(xué)科群體的成熟度也較高。“#2計(jì)算機(jī)輔助語(yǔ)言教學(xué)(CALL)”是與語(yǔ)言技術(shù)相關(guān)的非常顯著的大學(xué)科群,其確定性(輪廓值為0.754)遠(yuǎn)高于“#9圖書(shū)館(library)”,其規(guī)模值(為7)也很高,總體上看,是與語(yǔ)言技術(shù)相關(guān)的成熟度最高的學(xué)科群體。此外,“#8決策支持系統(tǒng)decision support system”、“#4網(wǎng)絡(luò)特色服務(wù)的使用using web feature service”、“#3聽(tīng)覺(jué)與聽(tīng)力 hearing”、“#1互聯(lián)網(wǎng)帶寬internet bandwidth”都是值得關(guān)注的與語(yǔ)言技術(shù)關(guān)聯(lián)的新興學(xué)科群體。

3.2003年至2013年間平均值(mean)顯示,主要學(xué)科群體在2004到2006年間形成。“#7用戶(user)”等形成較早但不成規(guī)模,上述規(guī)模值(Size)和輪廓值(Silhouette)較高的學(xué)科群體都在2004到2006年間形成,并持續(xù)發(fā)展到2013年。

綜上,語(yǔ)言技術(shù)研究領(lǐng)域的交叉性極為復(fù)雜。既有學(xué)科群體內(nèi)部研究領(lǐng)域的交叉,也有學(xué)科群體之間的研究領(lǐng)域交叉。這種復(fù)雜的交叉過(guò)程蘊(yùn)含著新興學(xué)科產(chǎn)生的可能。

(二)主要研究領(lǐng)域分析

在圖1包含的43個(gè)熱點(diǎn)研究領(lǐng)域中,按照文獻(xiàn)頻數(shù)、凸顯性和中心性(一種文獻(xiàn)重要等級(jí)算法(參見(jiàn)陳超美2001))綜合指標(biāo)排序如下:

表2 語(yǔ)言技術(shù)研究涉及的中心性最高的14個(gè)領(lǐng)域

這些領(lǐng)域按共現(xiàn)詞加權(quán)分析主要集中在計(jì)算機(jī)與通信科學(xué)、教育學(xué)、語(yǔ)言學(xué)、心理學(xué)等幾個(gè)核心領(lǐng)域。

計(jì)算機(jī)與通信科學(xué)領(lǐng)域涵蓋信息系統(tǒng)、理論方法、人工智能、軟件工程、硬件建設(shè)等,主要的研究成果集中于自然語(yǔ)言處理技術(shù),其中包括機(jī)器翻譯、文本分析、自動(dòng)言語(yǔ)識(shí)別與合成等。例如,對(duì)機(jī)器翻譯系統(tǒng)“對(duì)齊模板”的翻譯方法的研究(Franz Josef Och & Hermann Ney,2004)①Franz Josef Och,Hermann Ney.The Alignment Template Approach to Statistical Machine Translation[J].Computational Linguistics,2004,(30):417~449.,這種機(jī)器翻譯方法具有較好的實(shí)用性和商業(yè)前景。自動(dòng)語(yǔ)音識(shí)別領(lǐng)域?qū)θ绾慰朔Z(yǔ)音變異影響的研究一直是熱點(diǎn),如地域特征、社會(huì)語(yǔ)言學(xué)特征、外國(guó)口音、說(shuō)話風(fēng)格、語(yǔ)速等(M Benzeghiba,2007)①M(fèi).Benzeghiba,R.De Mori,O.Deroo,S.Dupont,T.Erbes,D.Jouvet,L.Fissore,P.Laface,A.Mertins,C.Ris,R.Rose,V.Tyagi,C.Wellekens.Automatic speech recognition and speech variability:A review[J].Speech Communication,2007,(49):763~786.。隨著計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的進(jìn)步,意見(jiàn)挖掘和情感分析頗受重視,用自然語(yǔ)言處理工具對(duì)臨床數(shù)據(jù)庫(kù)中的不良事件進(jìn)行監(jiān)測(cè)越來(lái)越普遍(David W Bates,2003)②David W Bates,R Scott Evans,Harvey Murff,et al.Detecting Adverse Events Using Information Technology[J].Journal of the American Medical Informatics Association,2003,(10):115~128.。此外,從臨床電子病歷和醫(yī)學(xué)研究文獻(xiàn)中挖掘相關(guān)性、模式和知識(shí)是重要的研究趨勢(shì)(Guergana K Savova,2010)③Guergana K Savova,James J Masanz,Philip V Ogren,Jiaping Zheng,Sunghwan Sohn,Karin C Kipper-Schuler,Christopher G Chute.Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES):architecture,component evaluation and applications[J].J Am Med Inform Assoc,2010,(17):507~513.。

語(yǔ)言學(xué)領(lǐng)域與上述計(jì)算機(jī)科學(xué)的自然語(yǔ)言處理多有交叉,與教育領(lǐng)域的語(yǔ)言教學(xué)也有交叉,偏重于語(yǔ)言學(xué)研究的主要有語(yǔ)言起源與演化、語(yǔ)言與思維和神經(jīng)機(jī)制關(guān)系的探究等。例如,學(xué)者們使用非洲和歐洲最近發(fā)現(xiàn)的第一手考古學(xué)和古生物學(xué)材料討論語(yǔ)言的起源、符號(hào)論和音樂(lè)之間的關(guān)系(Francesco d’Errico & Christopher Henshilwood,2003)④Francesco d'Errico,Christopher Henshilwood,Graeme Lawson,Marian Vanhaeren,Anne-Marie Tillier,Marie Soressi,F(xiàn)red erique Bresson,Bruno Maureille,April Nowell,Joseba Lakarra,Lucinda Backwell,Michele Julien.Archaeological Evidence for the Emergence of Language,Symbolism,and Music-An Alternative Multidisciplinary Perspective[J].Journal of World Prehistory,2003,(17):1~70.;使用詞匯數(shù)據(jù)和貝葉斯系統(tǒng)方法討論史前人口擴(kuò)張?jiān)谒茉焐锱c文化多樣性中發(fā)揮的作用(R.D.Gray & A.J.Drummond,2009)⑤R.D.Gray,A.J.Drummond,S.J.Greenhil.Language Phylogenies Reveal Expansion Pulses and Pauses in Pacific Settlement[J].Science,2009,(323):479~483.;通過(guò)數(shù)值認(rèn)知匹配任務(wù)重復(fù)測(cè)試發(fā)現(xiàn),連數(shù)字“一”都沒(méi)有的亞馬孫河流域Pirah?語(yǔ)言使用者都能夠?qū)?shù)值和大數(shù)量物體完全精確配對(duì),研究認(rèn)為語(yǔ)言中所謂精確數(shù)字是一種文化發(fā)明,不是一個(gè)語(yǔ)言的普遍性,并且數(shù)字詞并不改變我們底層數(shù)量表征,而是一種在時(shí)間、空間和情態(tài)變化中用來(lái)追蹤大型集合基數(shù)的認(rèn)知“技術(shù)”(Michael C.Franka & Daniel L.Everett,2008)⑥Michael C.Franka,Daniel L.Everett,Evelina Fedorenko,Edward Gibson.Number as a cognitive technology:Evidence from Pirah?language and cognition[J].Cognition,2008,(108):819~824.;通過(guò)核磁共振成像研究大腦句法處理機(jī)制發(fā)現(xiàn)句法是神經(jīng)隔離的,分布在不同腦區(qū),突破了原來(lái)認(rèn)為只有左半球布羅卡氏和韋尼克區(qū)才是句法中樞的觀點(diǎn)(Yosef Grodzinsky & Angela D Friederici,2006)⑦Yosef Grodzinsky,Angela D Friederici.Neuroimaging of syntax and syntactic processing[J].Current Opinion in Neurobiology,2006,(16):240~246.;腦成像技術(shù)還發(fā)現(xiàn)韋尼克區(qū)對(duì)稱區(qū)域、左右前運(yùn)動(dòng)區(qū)、左右腦島和布羅卡區(qū)是處理創(chuàng)新隱喻的回路(N.Mashal & M.Faust,2005)⑧N.Mashal,M.Faust,T.Hendler.The role of the right hemisphere in processing nonsalient metaphorical meanings:Application of Principal Components Analysis to fMRI data[J].Neuropsychologia,2005,(43):2084~2100.。

在教育領(lǐng)域,近年來(lái)主要研究熱點(diǎn)有教育教學(xué)技術(shù)、網(wǎng)絡(luò)教育、語(yǔ)言學(xué)習(xí)、特殊人群語(yǔ)言康復(fù)的技術(shù)等。具體而言,移動(dòng)學(xué)習(xí)、合作學(xué)習(xí)與無(wú)縫學(xué)習(xí)等關(guān)聯(lián)研究,基于嵌入技術(shù)的學(xué)習(xí)資源研發(fā)、網(wǎng)頁(yè)設(shè)計(jì)等網(wǎng)絡(luò)技術(shù)與教育,微博、社交網(wǎng)絡(luò)與學(xué)習(xí),二語(yǔ)習(xí)得與學(xué)習(xí),電子白板等教室科技與課堂教學(xué),語(yǔ)料庫(kù)、在線工具與語(yǔ)言學(xué)習(xí)、語(yǔ)言能力測(cè)試與評(píng)估,閱讀、聽(tīng)說(shuō)等語(yǔ)言障礙(表中領(lǐng)域高頻共現(xiàn)詞Rehabilitation表明康復(fù)研究的重要價(jià)值),都是近年來(lái)的熱點(diǎn)。例如,研究表明對(duì)幼兒進(jìn)行人工耳蝸植入術(shù)對(duì)促進(jìn)其表達(dá)能力的提高有顯著效果,并建議有經(jīng)驗(yàn)的兒科移植中心給12歲以下的兒童植入人工耳蝸(Shani J.Dettman &Darren Pinder,2007)⑨Shani J.Dettman,Darren Pinder,Robert J.S.Briggs,Richard C.Dowell,Jaime R Leigh.Communication Development in Children Who Receive the Cochlear Implant Younger than 12Months:Risks versus Benefits[J].Ear &Hearing,2007,(4):11S~18S.;腦成像研究表明失寫(xiě)癥等障礙是人的語(yǔ)言整個(gè)系統(tǒng)內(nèi)的混亂,而不是系統(tǒng)中某個(gè)項(xiàng)目(如語(yǔ)音加工等)導(dǎo)致的(Sally E,2005)①Sally E.Shaywitz,Bennett A.Shaywitz.Dyslexia(Specific Reading Disability)[J].Biol Psychiatry,2005,(57):1301~1309.;對(duì)聾生如何使用在視覺(jué)資源方面支持其閱讀理解的多媒體資源軟件包的調(diào)查表明“視覺(jué)素養(yǎng)”的技能教育很重要(Nikolaraizi M & Vekiri I,2013)②Nikolaraizi M,Vekiri I,Easterbrooks S.Investigating Deaf Students'Use of Visual Multimedia Resources in Reading Comprehension[J].American Annals of the Deaf,2013,(157):458~473.;有的研究旨在向從事早期兒童特殊教育專業(yè)的人員提供一個(gè)標(biāo)準(zhǔn)的、綜合的語(yǔ)言評(píng)估工具(Chu-Sui Lin & Shu-Hui Chang,2013)③Chu-Sui Lin,Shu-Hui Chang,Wen-Ying Liou,Yu-Show Tsai.The Development of A Multimedia Online Language Assessment Tool for Young Children with Autism[J].Research in Developmental Disabilities,2013,(34):3553~3565.;等等。

心理學(xué)領(lǐng)域與教育、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)也多有交叉,出現(xiàn)不少新興的研究方向,例如網(wǎng)絡(luò)和計(jì)算機(jī)輔助交際行為、web2.0社會(huì)文本中的心理學(xué)資源挖掘與研究、語(yǔ)言學(xué)習(xí)的認(rèn)知策略等。一些有特色的方向,如探討社交網(wǎng)絡(luò)中“自我”與新型社區(qū)關(guān)系(Whittaker L & Gillespie Alex,2013)④Whittaker L,Gillespie Alex.Social Networking Sites:Mediating the Self and its Communities[J].Journal of Community & Applied Social Psychology,2013,(23):492~504.,通過(guò)文本自動(dòng)分析探討語(yǔ)篇常用詞(如代詞、冠詞、介詞、連詞、助詞等功能詞)對(duì)人類社會(huì)和心理世界的揭示(James W.Pennebaker & Matthias R,2003)⑤James W.Pennebaker,Matthias R.Mehl,Kate G.Niederhoffer.Psychological Aspects of Natural Language Use:Our Words,Our Selves[J].Annual Reviews Psychology,2003,(54):547~577.;根據(jù)博客中進(jìn)食失調(diào)(如神經(jīng)性食欲缺乏、易餓癥等)數(shù)據(jù)探究在線社會(huì)行為的心理學(xué)意義(Wolf Markus & Theis Florian,2013)⑥Wolf Markus,Theis Florian,Kordy Hans.Language Use in Eating Disorder Blogs:Psychological Implications of Social Online Activity[J].Journal of Language and Social Psychology,2013,(32):212~26.;自閉癥的交際與學(xué)習(xí)心理等。

(三)關(guān)鍵詞演進(jìn)分析

通過(guò)提取2003至2013年每一年文獻(xiàn)信息中使用頻率最高的前5個(gè)關(guān)鍵詞(keywords)可以得到語(yǔ)言研究關(guān)鍵詞演進(jìn)的知識(shí)圖譜,如圖2所示。

圖2 語(yǔ)言技術(shù)研究關(guān)鍵詞演進(jìn)圖譜

圖中顯示了2003年至2013年,剔除重復(fù)后每年使用頻率最高的5個(gè)關(guān)鍵詞,共33個(gè)。如圖上端的彩色條狀(由于排版對(duì)彩圖的限制,本段關(guān)于色彩表述在黑白圖中表現(xiàn)為深淺濃淡的差異。)圖例所示,圖中關(guān)鍵詞左方呈現(xiàn)嵌套形式的彩色圓環(huán)對(duì)應(yīng)不同年份該關(guān)鍵詞在文獻(xiàn)中出現(xiàn),例如:大紅色、橙色、黃色圓環(huán)分別代表2013、2012、2011年的文獻(xiàn),關(guān)鍵詞“語(yǔ)言(language)”所在分色多層同心圓顯示它在2003至2013年間每年均有出現(xiàn)。最外環(huán)為粉色的關(guān)鍵詞是凸顯的熱點(diǎn)關(guān)鍵詞。關(guān)鍵詞之間彩色的連線標(biāo)明不同年份的共現(xiàn)情況。從圖中可以看出,“技術(shù)(technology)”與“科學(xué)(science)”兩個(gè)關(guān)鍵詞之間有一條綠色連線,可知這兩個(gè)關(guān)鍵詞在2006年的文獻(xiàn)中同時(shí)出現(xiàn)過(guò)。關(guān)鍵詞圓環(huán)對(duì)應(yīng)圖中下方的年份數(shù)字,表示該關(guān)鍵詞首次成為年度使用頻率最高的5個(gè)關(guān)鍵詞之一的時(shí)間,例如,“影響(impact)”這一關(guān)鍵詞在2011年因?yàn)榇髷?shù)據(jù)討論的升溫首次成為年度使用頻率前5的關(guān)鍵詞。

圖2中“語(yǔ)言(language)”和“技術(shù)(technology)”作為搜索所用關(guān)鍵詞,出現(xiàn)頻率高,半徑大,但并不是我們分析的重點(diǎn),而中等半徑的圓形則提示與語(yǔ)言技術(shù)研究高度相關(guān)的關(guān)鍵詞,可以揭示相關(guān)研究熱點(diǎn)或通用術(shù)語(yǔ)。例如設(shè)計(jì)(design)、系統(tǒng)(system)、管理(management)、通訊(communication)、互聯(lián)網(wǎng)(internet)、本體(ontology)、教育(education)等,顯示“語(yǔ)言技術(shù)”應(yīng)用的廣泛性。

根據(jù)橫坐標(biāo)時(shí)間軸,語(yǔ)言技術(shù)研究關(guān)鍵詞在10年時(shí)間段的頭3年開(kāi)始密集出現(xiàn)一些熱點(diǎn)領(lǐng)域并能持續(xù)延伸,包括互聯(lián)網(wǎng)(internet)、計(jì)算機(jī)與算法(computer&algorithm)、系統(tǒng)與模式(system&models)(計(jì)算學(xué)科領(lǐng)域通用術(shù)語(yǔ))、兒童(children)(既含教育因素,又涉及語(yǔ)言技術(shù)應(yīng)用于兒童健康和發(fā)展)、知識(shí)(knowledge)(主要涉及知識(shí)挖掘處理與管理)、信息與信息技術(shù)、通訊與管理、建筑與設(shè)計(jì)、網(wǎng)絡(luò)服務(wù)、言語(yǔ)科技等,2006以后出現(xiàn)仿真(simulation)、語(yǔ)義網(wǎng)(semantic web)(含語(yǔ)義框架)、數(shù)據(jù)庫(kù)(database)、教育(education)(關(guān)聯(lián)“學(xué)生”,表明以學(xué)生的中心的教育教學(xué)理念更加普遍)、科學(xué)(science)(表明理論研究的深入)、影響(impact)(主要指大數(shù)據(jù)的綜合影響)等,清晰展示研究前沿的演進(jìn)。關(guān)鍵詞之間的密集連線顯示語(yǔ)言研究領(lǐng)域關(guān)聯(lián)與拓展。

四、結(jié) 語(yǔ)

通過(guò)可視化分析可以從宏觀上看出2003年以來(lái)語(yǔ)言技術(shù)研究發(fā)展若干特點(diǎn):首先是極強(qiáng)的跨學(xué)科、跨領(lǐng)域綜合性,體現(xiàn)了現(xiàn)代學(xué)科的發(fā)展特征。從語(yǔ)言技術(shù)學(xué)科群體和研究領(lǐng)域的交叉狀況來(lái)看,語(yǔ)言技術(shù)學(xué)科群體內(nèi)部的研究領(lǐng)域存在交叉關(guān)系,學(xué)科群體之間的研究領(lǐng)域存在交叉關(guān)系。這種疊加錯(cuò)綜的交叉關(guān)系是新興學(xué)科形成的溫床。其次,語(yǔ)言技術(shù)研究熱點(diǎn)多、形成時(shí)間早、持續(xù)時(shí)間長(zhǎng),深刻變革表現(xiàn)為語(yǔ)義化、智能化以及科學(xué)性加強(qiáng)??偟目磥?lái),語(yǔ)言技術(shù)研究關(guān)注現(xiàn)實(shí)實(shí)踐,在通信、網(wǎng)絡(luò)、教育、康復(fù)、管理等方面得到運(yùn)用廣泛。隨著技術(shù)的革新和進(jìn)步,語(yǔ)言技術(shù)在實(shí)際應(yīng)用領(lǐng)域的研究還將進(jìn)一步深入。

猜你喜歡
交叉圖譜群體
繪一張成長(zhǎng)圖譜
通過(guò)自然感染獲得群體免疫有多可怕
“六法”巧解分式方程
“群體失語(yǔ)”需要警惕——“為官不言”也是腐敗
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
連一連
主動(dòng)對(duì)接你思維的知識(shí)圖譜
基于Fast-ICA的Wigner-Ville分布交叉項(xiàng)消除方法
雙線性時(shí)頻分布交叉項(xiàng)提取及損傷識(shí)別應(yīng)用
雜草圖譜
石林| 泾阳县| 伊金霍洛旗| 遵义县| 北碚区| 洪江市| 顺昌县| 高尔夫| 嘉祥县| 合川市| 平山县| 桐庐县| 三明市| 太原市| 昆山市| 金门县| 苍南县| 峡江县| 漳浦县| 菏泽市| 南郑县| 襄垣县| 达拉特旗| 调兵山市| 安平县| 榆中县| 衡山县| 亳州市| 南康市| 朝阳市| 金沙县| 睢宁县| 昭平县| 尉犁县| 德化县| 梁平县| 通道| 杭锦旗| 凉城县| 洛扎县| 弥渡县|