伴隨著網(wǎng)絡信息的迅速增長,用戶信息的搜索越來越多,然而多數(shù)的人卻難以在限定的時間里面精確地查找到自己所需要的信息,用戶對搜索引擎的要求提高,很多時候用戶所需要的檢索,關鍵詞的查全率和差準率偏低,電腦對自然語言理解能力有限,所構成的檢索式知識有局限性,關鍵詞二義性問題的存在等等問題,然而用戶現(xiàn)在多是通過檢索出來鏈接或是網(wǎng)址,很少能夠直接搜索準確的知識網(wǎng)頁,可見用戶意圖無法直接迅速正確地被電腦獲取解釋,它們基本上是將某些網(wǎng)頁當作中轉(zhuǎn)站,通過中轉(zhuǎn)站去尋求具體的網(wǎng)頁知識。所以如何準確地去獲取用戶意圖并且推薦給用戶有用的信息,讓用戶能夠迅速地獲取所需的查詢顯得十分重要。
用戶意圖即是用戶的意向,興趣和關注對象。然而本文就上面的搜索引擎方面的不足,主要提出了一種關于對用戶查詢時的關鍵詞和搜索后的日志記錄。通過改進數(shù)據(jù)挖掘的層次聚類算法來挖掘和分析數(shù)據(jù),現(xiàn)有的層次聚類已經(jīng)克服了不可伸縮性和不可撤銷性,然而改進后的層次聚類算法調(diào)整讓樹具有可修改性,它隨著用戶點擊率變化而自動調(diào)整生成樹的結構,這樣可以在用戶輸入關鍵詞的時候?qū)⑿畔⒉迦霕渲胁⑶疫M行從新調(diào)整和聚合,返回給用戶信息有用的檢索信息,通過驗證已經(jīng)證明了算法的可行性。