摘要:維吾爾文模式匹配技術(shù)對維吾爾文不良文本檢測和過濾有著很大的實(shí)用性,因此考慮語言特點(diǎn)在AC-BM多模式算法上改進(jìn)提出一種AC-BM-Ug算法,算法利用AC多模式匹配算法,借用BM匹配算法跳躍原理提出的一種改進(jìn)算法。
關(guān)鍵詞:改進(jìn)AC-BM多模式匹配;維吾爾語
中圖分類號:TP311? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)16-0210-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
1 概述
維吾爾文模式匹配在維吾爾文搜索引擎、書目檢索系統(tǒng)、文本信息過濾、網(wǎng)站監(jiān)控等各領(lǐng)域中至關(guān)重要??紤]AC-BM算法在模式匹配中廣泛應(yīng)用,語言特點(diǎn)對AC-BM算法進(jìn)行改進(jìn)實(shí)現(xiàn)了維吾爾文多模式匹配。
2 維吾爾文
3 AC算法
4 改進(jìn)的AC-BM-Ug算法
5 結(jié)束語
本文考慮維吾爾語言特征、書寫方向等各種因素,在AC-BM算法上進(jìn)行改進(jìn)提出適合維吾爾語的多模式匹配算法。此算法可將應(yīng)用于維吾爾文不良信息關(guān)鍵詞的檢測和過濾,自動化辦公、網(wǎng)絡(luò)檢測等網(wǎng)絡(luò)信息處理等領(lǐng)域中中,更有效的、快速的處理文本匹配。
參考文獻(xiàn):
[1] 伊力亞爾·達(dá)吾提,哈力旦·阿布都熱依木.面向維吾爾文的多模式匹配算法研究[J].計(jì)算機(jī)工程,2015,41(1):143-149.
[2] 早克熱·卡德爾,艾山·吾買爾,吐爾根·依布拉音,艾斯卡爾·艾木都拉.維吾爾語名詞構(gòu)形詞綴有限狀態(tài)自動機(jī)的構(gòu)造[J].中文信息學(xué)報(bào),2009,23(6):116-121.
[3] 吾守爾·斯拉木.維吾爾語文語轉(zhuǎn)換系統(tǒng)的研究[C].中國青海西寧:第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會論文集,2005.
【通聯(lián)編輯:光文玲】