甘冬連 張永 劉博
摘要:針對垃圾郵件大量存在的問題,提出基于MapReduce并行SVM的垃圾郵件分類算法,用支持向量機作為分類器,基于MapReduce將各子分類器進行合并,并通過重訓練得到模型,利用該模型對測試集進行分類,得到結果。為解決算法精度損失、準確率低等問題,引入KNN,在原算法基礎上進行循環(huán)迭代。
關鍵詞:MapReduce;SVM;KNN分類算法
DOIDOI:10.11907/rjdk.161466
中圖分類號:TP301文獻標識碼:A文章編號:1672-7800(2016)006-0010-03
參考文獻:
[1]杜玲玲.基于MapReduce的數(shù)據(jù)挖掘算法研究與應用[D].桂林:桂林電子科技大學,2012.
[2]邰建華.Hadoop平臺下的海量數(shù)據(jù)存儲技術研究[D].大慶:東北石油大學,2012.
[3]曹聰.云計算支持下的數(shù)據(jù)挖掘算法及其應用[D].廣州:廣州大學,2012.
[4]???基于Hadoop云平臺的分布式支持向量機研究[D].臨汾:山西師范大學,2014.
[5]汪海燕,黎建輝,楊風雷.支持向量機理論及算法研究綜述[J].計算機應用研究,2014(5):1281-1286.
[6]張國云.支持向量機算法及其應用研究[D].長沙:湖南大學,2006.
[7]桑應賓.基于K近鄰的分類算法研究[D].重慶:重慶大學,2009.