李蘭英+董義明+孔銀+周秋麗
摘要:針對(duì)K-means在處理海量數(shù)據(jù)時(shí),因初始聚類(lèi)中心的選取不確定,從而導(dǎo)致收斂速度過(guò)慢的問(wèn)題。本文提出了改進(jìn)的K-means算法,首先用模糊聚類(lèi)的思想對(duì)數(shù)據(jù)集進(jìn)行模糊分類(lèi),其次采用動(dòng)態(tài)計(jì)算聚類(lèi)中心的方式對(duì)數(shù)據(jù)集進(jìn)行二次分類(lèi),最后將算法在MapReduce模型上進(jìn)行了實(shí)現(xiàn).實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法不僅提高了加速比,而且算法的收斂速度更快。endprint