田春穎,孫 璇,莊淑涵,關(guān)媛媛,王泓午
(天津中醫(yī)藥大學(xué),天津 301617)
舌診是中醫(yī)臨床辨證論治的一種手段,是獲取機體健康狀況的一種重要途徑[1]。傳統(tǒng)舌診的判別一般靠醫(yī)生的知識水平,常常被光線、環(huán)境等條件影響,主觀性很強,缺少量化指標(biāo),因此延緩了舌診客觀化的進(jìn)程[2-4]。因此科學(xué)研究者研發(fā)出中醫(yī)智能舌診儀,使中醫(yī)舌診走向現(xiàn)代化、客觀化。其中,舌象的正確分割是實現(xiàn)中醫(yī)舌診客觀化的必要條件之一。舌象分割包括兩方面內(nèi)容:一是舌體提取,二是苔質(zhì)分離[5]。舌象分割的效果將對進(jìn)一步的舌象分析產(chǎn)生直接影響,所以保證舌象分割的準(zhǔn)確率是相當(dāng)重要的[6]。隨著圖像分割技術(shù)的發(fā)展,舌象研究中的圖像分割也經(jīng)歷了從人工分割逐漸走向半自動、自動分割的過渡,但目前舌體分割的結(jié)果還不是很令人滿意。
所以利用Note Express對中國知網(wǎng)、維普、萬方以及Pubmed數(shù)據(jù)庫進(jìn)行檢索、篩選,最終對納入的文獻(xiàn)進(jìn)行計量學(xué)分析,即采用數(shù)學(xué)和統(tǒng)計學(xué)方法對文獻(xiàn)進(jìn)行統(tǒng)計學(xué)分析和描述[7],找出文獻(xiàn)分布規(guī)律,據(jù)此探討舌象分割技術(shù)的研究現(xiàn)狀及發(fā)展趨勢,為舌象分割技術(shù)準(zhǔn)確率的提高提供參考,具有重要的理論和實際意義。
1.1 數(shù)據(jù)來源 本研究的文獻(xiàn)來源為中國知網(wǎng)(CNKI)、維普(VIP)、萬方(WanFangdata)、Pubmed數(shù)據(jù)庫公開發(fā)表的文獻(xiàn)。
1.2 檢索策略 對四大數(shù)據(jù)庫進(jìn)行主題檢索,中文檢索詞為“舌”“分割”,英文檢索詞為“segmentation”“tongue”。檢索時限為建庫至2018年12月。
1.3 納入與排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):研究舌象分割技術(shù)的期刊論文、會議論文和學(xué)位論文;如內(nèi)容雷同并經(jīng)判斷是同一研究,選擇資料最完整的文獻(xiàn)。
排除標(biāo)準(zhǔn):綜述類文獻(xiàn),科普類文獻(xiàn),文摘類文獻(xiàn);無法獲取全文者;主要研究未涉及舌象分割技術(shù)的文章(如紋理識別與分析、舌色識別與分析、舌象采集及舌象儀研制等)。
1.4 文獻(xiàn)篩選與資料提取 由兩位研究員嚴(yán)格按照文獻(xiàn)納排標(biāo)準(zhǔn)進(jìn)行獨立篩選,并交叉核對,如遇分歧,與通訊作者討論后決定。對篩選后的文獻(xiàn)進(jìn)行提取,數(shù)據(jù)提取表用Excel 2016進(jìn)行,提取內(nèi)容包括論文標(biāo)題、論文作者、發(fā)表年度、發(fā)表期刊、第一作者單位、發(fā)表類型、基金資助、舌體分割方法、苔質(zhì)分離方法、分割準(zhǔn)確率及是否提及相應(yīng)的分割評價標(biāo)準(zhǔn)等,以進(jìn)行文獻(xiàn)計量學(xué)分析。1.5 統(tǒng)計分析 應(yīng)用Note Express 3.20軟件進(jìn)行文獻(xiàn)管理,根據(jù)“題錄類型”“作者”“年份”“標(biāo)題”字段進(jìn)行系統(tǒng)查重,并結(jié)合人工查重后,以人工審閱的方式進(jìn)行文獻(xiàn)篩選與資料提取。應(yīng)用Excel 2016軟件錄入以上提取信息并對其進(jìn)行描述分析。SATI 3.2[8]文獻(xiàn)題錄信息統(tǒng)計分析工具進(jìn)行詞頻分析,形成共詞矩陣,利用UCINET 6.0軟件NetDraw版塊對共詞矩陣?yán)L成高頻關(guān)鍵詞可視化網(wǎng)絡(luò)分析圖,分析舌象分割技術(shù)研究的熱點及趨勢。
根據(jù)普賴斯定律[9],核心作者的最低發(fā)文量為m=0.749√nmax,其中nmax指統(tǒng)計年度內(nèi)最高產(chǎn)的作者的發(fā)文量。發(fā)文量達(dá)到m及以上的所有作者發(fā)表的文獻(xiàn)量之和應(yīng)占納入文獻(xiàn)總量的50%。并分析論文作者、文獻(xiàn)量及作者所在單位等指標(biāo)[10]。
初檢經(jīng)查重后,共檢索文獻(xiàn)219篇,經(jīng)過逐層篩選,最終納入文獻(xiàn)140篇,文獻(xiàn)篩選流程與結(jié)果見圖1。
2.1 文獻(xiàn)基本特征分析 文獻(xiàn)年度分布1999—2018年,國內(nèi)外共刊載舌象分割技術(shù)文獻(xiàn)140篇,平均每年發(fā)表7篇。舌象分割技術(shù)文獻(xiàn)最早的1篇發(fā)表于1999年,在2008年之前發(fā)文量基本呈上升趨勢,2008—2013年發(fā)文量有所下降,2013—2018年相發(fā)文量保持不穩(wěn)定的增長,但從整體上呈上升趨勢,見圖2。
發(fā)表文獻(xiàn)類型分析截至2018年12月,納入的140篇舌象分割技術(shù)文獻(xiàn)中,期刊論文最多,共計73篇,占52.14%;其次是學(xué)位論文,共計64篇,占45.71%;會議論文只有3篇,占2.14%,見圖3。
圖1 文獻(xiàn)篩選流程與結(jié)果
圖2 文獻(xiàn)年度分布
圖3 舌象分割研究發(fā)表文獻(xiàn)類型分析
論文來源期刊分析舌象分割技術(shù)文獻(xiàn)中,期刊論文分布期刊58種73篇,每種期刊均載文1.26篇,論文分布呈較高的離散程度。大多數(shù)期刊(46種)僅載文1篇,載文2篇的期刊9種,載文3篇的期刊3種。《電腦知識與技術(shù)》《計算機應(yīng)用研究》《中國圖象圖形學(xué)報》載文量最多,為3篇。載文2篇(含2篇)以上的期刊共12種,占期刊總數(shù)的20.69%,共載文27篇,占期刊論文總數(shù)的36.99%。12種期刊中,影響因子1.0以下的期刊有4種,共載文9篇;影響因子在1.0~2.0之間的期刊有8種,共載文18篇。12種期刊中,10種期刊(83.33%)為核心期刊。載文2篇以上(含2篇)的期刊載文情況、期刊影響因子(2018)以及是否為核心期刊情況,見表1。
基金資助情況分析140篇文獻(xiàn)中有53篇(37.86%)文獻(xiàn)研究受科研基金的支持,其中國家級科研基金贊助者31篇(58.49%),受省部級科研基金資助者12篇(22.64%),受市級科研基金資助者7篇(13.21%),受院校級科研基金資助者3篇(5.66%)。基金資助文獻(xiàn)年度發(fā)表情況,見圖4。
核心作者分析本研究納入的140篇文獻(xiàn),共有211名作者參與發(fā)表。其中發(fā)文量最多的作者是來自廈門大學(xué)的周昌樂和江西中醫(yī)藥大學(xué)的杜建強,各累計發(fā)表6篇文章,各占納入文獻(xiàn)研究總量的4.29%。根據(jù)普賴斯定律[9],本研究核心作者最低文獻(xiàn)量m=1.83,取整為2,發(fā)文量為2篇及2篇以上的作者共59名,占全部作者的27.96%,這些作者共發(fā)表文獻(xiàn)163篇,占文獻(xiàn)總量的77.25%>50%,符合普賴斯定律的要求,即舌象儀圖像分割技術(shù)研究已形成“核心作者群”。舌象分割技術(shù)研究“核心作者群”,見表 2。
表1 舌象分割技術(shù)論文來源期刊分布
圖4 舌象分割技術(shù)受基金資助文獻(xiàn)年度發(fā)表情況
第一作者所在研究機構(gòu)分布共有58個研究機構(gòu)發(fā)表舌象分割技術(shù)文獻(xiàn),發(fā)文量前3名的研究機構(gòu)分別為北京工業(yè)大學(xué)11篇(7.86%)、上海交通大學(xué)10篇(7.14%)、哈爾濱工業(yè)大學(xué)9篇(6.43%)。140篇有效文獻(xiàn)中由研究機構(gòu)獨立發(fā)表109篇(77.86%),多機構(gòu)合作發(fā)表31篇(22.14%),發(fā)文量前10位的研究機構(gòu)如表3所示。
表2 舌象分割技術(shù)研究核心作者
2.1.7 舌象分割技術(shù)研究的共詞分析 高頻關(guān)鍵詞分析出現(xiàn)頻次排名前5的關(guān)鍵詞依次為圖像分割、舌診、舌體分割、中醫(yī)舌診、舌診客觀化,見表4。
通過對高頻關(guān)鍵詞的分析,可顯示舌象分割技術(shù)領(lǐng)域的關(guān)注重點,但僅對詞頻分析還不能說明此領(lǐng)域的內(nèi)部聯(lián)系,因此對其進(jìn)一步分析,以揭示研究熱點全貌。
構(gòu)建共詞矩陣確定舌象分割技術(shù)研究的關(guān)鍵詞數(shù)量為15個,生成共詞矩陣,見表5。同時為構(gòu)建高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)知識圖譜提供數(shù)據(jù)支撐,為后續(xù)分析奠定基礎(chǔ)。
表3 舌象分割技術(shù)發(fā)文量前10位的研究機構(gòu)
表4 舌象分割技術(shù)研究高頻關(guān)鍵詞分析
表5 舌象分割技術(shù)研究共詞矩陣(部分)
高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)知識圖譜分析分析結(jié)果顯示圖像分割處于舌象分割技術(shù)高頻關(guān)鍵詞共詞網(wǎng)絡(luò)的中心位置,是最重要的結(jié)點,說明圖像分割在舌象分割技術(shù)領(lǐng)域研究中占舉足輕重的地位。中醫(yī)舌診和圖像分割兩個結(jié)點間的線段最粗,說明中醫(yī)舌診與圖像分割雖為兩個獨立的不同研究領(lǐng)域,但兩者關(guān)聯(lián)性最強。見圖5。
圖5 舌象分割技術(shù)高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)知識圖譜
2.2 舌象分割技術(shù)分析 舌象分割方法分析納入的140篇文獻(xiàn)中,111篇文獻(xiàn)研究內(nèi)容為舌體提取技術(shù),13篇文獻(xiàn)研究內(nèi)容為苔質(zhì)分離技術(shù),16篇文獻(xiàn)內(nèi)容既研究舌體提取技術(shù)又研究苔質(zhì)分離技術(shù)。總觀,舌體提取技術(shù)中,主要使用的前三類技術(shù)是Snake模型(29.13%)、基于閾值的分割技術(shù)(18.90%)及基于圖論的分割技術(shù)(7.09%),Snake模型中主要使用經(jīng)典Snake模型(21.62%)和GVF Snake模型(21.62%),基于閾值的分割技術(shù)中主要使用最大類間方差法(33.33%),基于圖論的分割技術(shù)中主要使用Grab Cut算法(44.44%)。苔質(zhì)分離技術(shù)中,主要使用的前三類技術(shù)是基于閾值的分割技術(shù)(34.48%)、基于聚類的分割技術(shù)(24.14%)及基于區(qū)域的分割技術(shù)(10.34%),基于閾值的分割技術(shù)中主要使用多通道動態(tài)閾值法(30%),基于聚類的分割技術(shù)中主要使用K-均值聚類法(85.71%),基于區(qū)域的分割技術(shù)中主要使用分裂-合并法(66.67%)。排名前3的舌象分割技術(shù)如下表6所示。
表6 排名前三的舌象分割技術(shù)
舌象分割準(zhǔn)確率及其評價標(biāo)準(zhǔn)分析納入的140篇文獻(xiàn)中,僅22篇文獻(xiàn)提及舌象分割的準(zhǔn)確率,11篇提及舌象分割準(zhǔn)確率的評價標(biāo)準(zhǔn)。舌象分割準(zhǔn)確率及其評價標(biāo)準(zhǔn)皆提及的文獻(xiàn)均為研究舌體提取技術(shù)的文獻(xiàn),如下表7所示。
3.1 舌象分割技術(shù)研究的重視程度仍需提高 文獻(xiàn)數(shù)量在一定程度上能反映出該領(lǐng)域的發(fā)展程度及國家、社會的重視程度[11]。舌象分割是舌象采集和分析的中樞環(huán)節(jié),是舌診信息化和客觀化的基礎(chǔ)[12-13]。本次研究結(jié)果顯示,近20年舌象分割技術(shù)方法文獻(xiàn)整體上呈上升趨勢,發(fā)文量不穩(wěn)定且發(fā)展較慢,僅37.86%的的文獻(xiàn)獲得基金資助,提示舌象分割技術(shù)研究的基金支持力度較低,推斷可能是導(dǎo)致該領(lǐng)域不穩(wěn)定性發(fā)展,發(fā)展速度較慢的原因,尚需該領(lǐng)域科研人員提高重視程度,國家政府加大基金支持力度。
表7 舌象分割準(zhǔn)確率及其評價標(biāo)準(zhǔn)皆提及的文獻(xiàn)
3.2 文獻(xiàn)各研究機構(gòu)間發(fā)展不均衡 從作者的研究機構(gòu)來看,140篇文獻(xiàn)來源于58所研究機構(gòu)。發(fā)文前10位的研究機構(gòu)均為高校。原因可能是高??蒲腥藛T有更多的機會參加培訓(xùn)學(xué)習(xí),有較強的科研團隊和學(xué)術(shù)氛圍。納入的140篇文獻(xiàn)研究中,77.86%的文獻(xiàn)由研究機構(gòu)獨立完成發(fā)表,僅22.14%的文獻(xiàn)由多機構(gòu)合作完成發(fā)表。今后應(yīng)加強合作力度,開展不同研究機構(gòu)間的多點合作,互相交流合作,加強隊伍建設(shè),同時也對改善不均衡局面起到一定的作用[14]。
3.3 主要期刊陣地初具雛形,“核心作者群”已形成學(xué)術(shù)期刊是共享和展示科研成果的重要平臺,通過對收錄舌象分割技術(shù)文獻(xiàn)的期刊進(jìn)行分析,確定舌象分割技術(shù)文獻(xiàn)分布的主要期刊陣地,有助于快速了解該領(lǐng)域的科研成果?!峨娔X知識與技術(shù)》《計算機應(yīng)用研究》《中國圖象圖形學(xué)報》等期刊發(fā)表的此類文獻(xiàn)較多。提示中國舌象分割技術(shù)的研究成果可以優(yōu)先考慮投稿至這些刊物[15-16]。
根據(jù)普賴斯定律[9],通過“核心作者”分析,“核心作者群”已形成,杜建強、周昌樂等研究人員發(fā)表的文獻(xiàn)相對較多,提示以上研究者在該領(lǐng)域具有重要貢獻(xiàn),研究人員可以爭取與其進(jìn)行合作研究。
3.4 舌象分割技術(shù)當(dāng)前研究熱點 舌象分割技術(shù)高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)知識圖譜顯示:當(dāng)前舌象分割技術(shù)研究的最終目的是舌診客觀化,主要研究內(nèi)容為舌體分割技術(shù),以圖像分割技術(shù)為基礎(chǔ),將其應(yīng)用于中醫(yī)舌診領(lǐng)域,Snake模型結(jié)合數(shù)學(xué)形態(tài)學(xué)原理常被科研人員應(yīng)用并加以研究。
舌象分割技術(shù)分析顯示:舌象分割中主要應(yīng)用改進(jìn)的Snake模型和基于閾值的分割技術(shù)。傳統(tǒng)Snake模型定義了一條能量曲線,該曲線是針對特征目標(biāo)的初始輪廓[17-19],因其魯棒性、實用性等優(yōu)點被廣泛應(yīng)用于舌象分割[20]。但是傳統(tǒng)Snake模型的缺點是:初始輪廓曲線必須靠近真實邊界且難以收斂到凹部邊界[21-22]。因此Snake模型在舌體提取中被科研人員所改進(jìn),常改進(jìn)成梯度向量流(GVF)Snake模型來克服傳統(tǒng)Snake模型的缺點?;陂撝档姆指罴夹g(shù)是利用像素的灰度值,通過特定的準(zhǔn)則選取最佳閾值進(jìn)行圖像分割的一種技術(shù)[23]。苔質(zhì)分離時,主要應(yīng)用最佳閾值迭代算法,減輕或消除噪聲對閾值的影響。雖然舌象分割技術(shù)研究在不斷發(fā)展,但仍存在一些問題:對分割方法的準(zhǔn)確率評價尚未形成統(tǒng)一標(biāo)準(zhǔn),準(zhǔn)確率多由中醫(yī)專家定性評判,由判定的一致率來確定,一致率越高說明該方法分割效果越好[5]。但這種方法主觀性較強,有較多不確定性,因此,業(yè)內(nèi)應(yīng)當(dāng)積極建立統(tǒng)一的評價標(biāo)準(zhǔn),以促進(jìn)舌象分割標(biāo)準(zhǔn)化,舌象客觀化。
3.5 本研究存在的局限性 首先,此研究是基于中國知網(wǎng)、萬方、維普及Pubmed數(shù)據(jù)庫檢索的文獻(xiàn)進(jìn)行分析,可能存在文獻(xiàn)納入不全的偏倚。其次,此研究僅對高頻關(guān)鍵詞進(jìn)行分析,不能排除低頻詞在將來成為研究主流的可能性。最后,今后類似研究需擴大文獻(xiàn)檢索面,并綜合其他文獻(xiàn)分析方法,以全面深入挖掘和分析文獻(xiàn)信息。
綜上所述,此研究采用文獻(xiàn)計量學(xué)的方法從文獻(xiàn)基本特征及舌象分割技術(shù)多角度分析了近20年國內(nèi)國外關(guān)于舌象分割技術(shù)的研究現(xiàn)狀,合理客觀地揭示其發(fā)展趨勢,為未來開展舌象分割技術(shù)研究提供理論參考依據(jù)。