阿迪來·艾合買提+馮向萍
摘 要: 命名實(shí)體識(shí)別在自然語言處理實(shí)踐中具有高度重要的作用,而且也是信息提取等各種自然語言方式的基礎(chǔ)工具。本文采用條件隨機(jī)場模型(Conditional Random Fields,CRF)對(duì)維吾爾語音樂實(shí)體識(shí)別進(jìn)行初步的探討。首先維吾爾語網(wǎng)站上收集數(shù)據(jù),進(jìn)行一系列預(yù)處理后得到純文本,然后制定語料標(biāo)注規(guī)則對(duì)實(shí)體進(jìn)行人工標(biāo)注,再利用上下文、關(guān)鍵字、詞典等一系列特征進(jìn)行訓(xùn)練,制定一個(gè)適合的模板來進(jìn)行音樂實(shí)體的識(shí)別。實(shí)驗(yàn)結(jié)果證明,此方法在維吾爾語音樂領(lǐng)域不僅可行、而且有效。
關(guān)鍵詞: 音樂實(shí)體識(shí)別;條件隨機(jī)場模型;特征選擇
中圖分類號(hào):TP301
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):2095-2163(2017)02-0059-04