鄧春偉 史煥卿
摘要:為了提高垃圾郵件過濾的準確性,在分析垃圾郵件數(shù)據(jù)的基礎(chǔ)上,對比信息檢索與信息過濾之間的關(guān)系,將信息檢索框架Lucene應(yīng)用到垃圾郵件過濾系統(tǒng)中,提出最小風險概率加權(quán)的樸素貝葉斯算法,與最小風險法結(jié)合,有效地減少貝葉斯方法的獨立性約束,實驗驗證了加權(quán)樸素貝葉斯算法的有效性。
關(guān)鍵詞:最小風險;貝葉斯算法;Lucene
中圖分類號:TP399文獻標志碼:A文章編號:1007-2683(2012)01—0063—05