管恩政 常曉宇 王 喆 周春光
摘要:為解決從數(shù)據(jù)庫(kù)中挖掘長(zhǎng)模式可能遇到較高的計(jì)算復(fù)雜度問(wèn)題,提出一種新的算法FFSPAN。傳統(tǒng)上,要判斷一個(gè)序列是否頻繁,需要在原數(shù)據(jù)庫(kù)中判斷整個(gè)序列是否頻繁;而算法FFSPAN是通過(guò)在序列數(shù)據(jù)庫(kù)中尋找一個(gè)頻繁項(xiàng)或一個(gè)頻繁項(xiàng)集來(lái)代替尋找一個(gè)完整的頻繁序列,而且FFSPAN算法每次掃描的數(shù)據(jù)庫(kù)都是迅速減小的,這使得算法在挖掘的序列模式越長(zhǎng)時(shí)越有效.在標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,F(xiàn)FSPAN算法非常有效。
關(guān)鍵詞:序列模式;長(zhǎng)模式;深度優(yōu)先;數(shù)據(jù)挖掘
中圖分類(lèi)號(hào):TP31
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1671-5489(2005)06-0768-05