魏斐斐
摘要:為改善孤立森林算法建立二叉樹時隨機選擇屬性進行數(shù)據(jù)分割,構(gòu)建孤立森林時可能出現(xiàn)一些性能較差的冗余二叉樹,導致模型精度不高的問題,應用一種區(qū)間套搜索算法對初始構(gòu)建的孤立森林搜索森林劃分閾值,去除性能較差的孤立二叉樹,構(gòu)建性能更優(yōu)的孤立森林,提出一種自適應閾值的改進孤立森林算法(Adaptive-iForest) 。選取UCI經(jīng)典數(shù)據(jù)集中Breastw、Ionosphere、Satellite、Shuttle、Pendigits 5個數(shù)據(jù)集進行實證分析,對比iForest、LOF兩個算法,AdaptiveiForest算法的精度與AUC值均有不同程度提升。
關鍵詞:異常數(shù)據(jù)檢測;改進孤立森林算法;區(qū)間套搜索算法;自適應閾值;UCI數(shù)據(jù)集
中圖分類號:TP301.6 文獻標識碼:A
文章編號:1009-3044(2024)10-0020-03