韓松 李新宇 丁雪
隨著電子政務(wù)的不斷普及和發(fā)展,越來(lái)越多的政務(wù)已經(jīng)電子化,隨之帶來(lái)的是龐大的政府?dāng)?shù)據(jù)量,以及人們從海量數(shù)據(jù)中發(fā)現(xiàn)有用知識(shí)的難度。首先電子政務(wù)的數(shù)據(jù)具有數(shù)量大的特點(diǎn),因此很多機(jī)關(guān)部門(mén)選擇應(yīng)用數(shù)據(jù)挖掘解決這個(gè)問(wèn)題。但是隨著各機(jī)關(guān)部門(mén)的數(shù)據(jù)不斷發(fā)展,數(shù)據(jù)分散,數(shù)據(jù)質(zhì)量不一致的特點(diǎn)顯現(xiàn),傳統(tǒng)的分布式數(shù)據(jù)挖掘已經(jīng)無(wú)法解決現(xiàn)有數(shù)據(jù)處理瓶頸問(wèn)題,急需一種新的數(shù)據(jù)挖掘的手段解決這個(gè)問(wèn)題。而現(xiàn)如今云計(jì)算的發(fā)展為分布式數(shù)據(jù)挖掘提供了許多新的解決思路和方案。文中提出的基于云計(jì)算架構(gòu)的分布式數(shù)據(jù)挖掘與傳統(tǒng)的分布式數(shù)據(jù)挖掘方法不同,它是基于云計(jì)算數(shù)據(jù)存儲(chǔ)架構(gòu)設(shè)計(jì)的,它充分利用各個(gè)節(jié)點(diǎn)的計(jì)算能力并行完成數(shù)據(jù)挖掘過(guò)程,在低成本的情況下,可以更好地從大量且分散的政府?dāng)?shù)據(jù)中提供有效知識(shí)以供參考和決策。