![](https://cimg.fx361.com/images/2025/0108/Fy8EFoKdtzziinXXrqViNJ.webp)
![](https://cimg.fx361.com/images/2025/0108/VTFQTmNzS7hzgppqFoLt5D.webp)
![](https://cimg.fx361.com/images/2025/0108/YvCfwNwTkMxdiNU9Kv4CZz.webp)
![](https://cimg.fx361.com/images/2025/0108/dc3vHTTxReVyvbUPGZs7Jr.webp)
![](https://cimg.fx361.com/images/2025/0108/9bbF8y6SpDKpbFpZanv3wy.webp)
摘要:為提高醫(yī)藥文獻(xiàn)中文分詞的準(zhǔn)確率,根據(jù)醫(yī)藥文獻(xiàn)的特點(diǎn),研究了中文分詞的算法。首先介紹了基于字符串匹配的分詞方法、基于理解的分詞方法、基于統(tǒng)計(jì)的分詞方法和基于匹配與統(tǒng)計(jì)結(jié)合分詞方法,并在設(shè)計(jì)思想上對(duì)各算法進(jìn)行了比較。在此基礎(chǔ)上,運(yùn)用C語言,VC6.0平臺(tái)實(shí)現(xiàn)各算法,并對(duì)醫(yī)藥文獻(xiàn)進(jìn)行分詞實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示,基于字符串匹配的最大正向匹配法取得了較好的性能。
關(guān)鍵詞:醫(yī)藥文獻(xiàn);中文分詞;字符串匹配
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)17-4138-03
Research of Chinese Word Segmentation on Medical Documents
ZHOU Jian-