国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能技術(shù)在搜索引擎中的應(yīng)用

2017-02-21 20:32楊子墨
科技創(chuàng)新與應(yīng)用 2016年35期
關(guān)鍵詞:智能技術(shù)搜索引擎應(yīng)用分析

楊子墨

摘 要:當(dāng)今網(wǎng)絡(luò)信息技術(shù)日益發(fā)展,傳統(tǒng)意義上的搜索引擎更加難以滿足廣大用戶日益增長(zhǎng)的信息檢索需求。在這種趨勢(shì)下,智能技術(shù)在搜索引擎中的應(yīng)用顯得越來越重要,只有將智能技術(shù)引進(jìn)搜索引擎,才能提高用戶的工作效率,滿足人們?nèi)找嬖鲩L(zhǎng)的客觀需求。文章主要介紹了如今搜索引擎的幾大分類,傳統(tǒng)搜索引擎需要改進(jìn)的不足以及兩大智能技術(shù)在搜索引擎中的應(yīng)用。在智能技術(shù)將會(huì)更加智能更加發(fā)達(dá)的未來,搜索引擎也將不斷地更新和發(fā)展,為人們提供更加高效的搜索體驗(yàn)。

關(guān)鍵詞:智能技術(shù);搜索引擎;應(yīng)用分析

搜索引擎是根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序來搜索互聯(lián)網(wǎng)上的信息,在對(duì)信息進(jìn)行組織和處理后,將處理后的結(jié)果顯示給用戶,是為用戶提供檢索服務(wù)的系統(tǒng)。而智能技術(shù)在搜索引擎中的實(shí)際應(yīng)用也越來越廣泛,不斷有新興的智能技術(shù)出現(xiàn),搜索引擎也不斷地結(jié)合這些智能技術(shù)來進(jìn)行自身的變革和發(fā)展,這是一個(gè)漸進(jìn)的過程。文章將詳細(xì)介紹兩種智能技術(shù)在搜索引擎中的應(yīng)用。

1 搜索引擎的分類

全文搜索引擎是最標(biāo)準(zhǔn)的搜索引擎,國外的主要代表是Google,而國內(nèi)的主要代表則是百度。全文搜索引擎的主要原理是在互聯(lián)網(wǎng)中檢索與所查目標(biāo)相匹配的內(nèi)容,繼而建立數(shù)據(jù)庫,按序排列并且將其展示給用戶。

目錄搜索引擎較本質(zhì)來說,其實(shí)不能算是真正的搜索引擎。只是將網(wǎng)站鏈接目錄分類,用戶并不需要輸入關(guān)鍵字,根據(jù)目錄就完全可以找到想要的信息。目錄索引最具代表性的就是Yahoo和新浪索引。

元搜索引擎在接收用戶的搜索請(qǐng)求后,可以在各個(gè)搜索引擎上同時(shí)搜索,隨后將結(jié)果顯示給用戶。這一種搜索引擎的國內(nèi)代表是搜星搜索引擎。

2 相比網(wǎng)絡(luò)信息檢索傳統(tǒng)搜索引擎的缺點(diǎn)

傳統(tǒng)搜索引擎作為用戶在互聯(lián)網(wǎng)進(jìn)行信息檢索的一個(gè)重要途徑給廣大用戶提供了相當(dāng)大的便利,隨著互聯(lián)網(wǎng)的迅速發(fā)展,用戶對(duì)搜索引擎又提出了搜索速度更快,搜索效率更高等諸多的要求,正是用戶的這些需求刺激著搜索引擎的快速發(fā)展。傳統(tǒng)搜索引擎越來越滿足不了用戶的需求,主要存在以下幾點(diǎn)不足:(1)搜索引擎從互聯(lián)網(wǎng)搜索的各種網(wǎng)頁水準(zhǔn)不一,存在著根本沒用或者暫時(shí)性的網(wǎng)頁,這嚴(yán)重加大了用戶檢索信息的困難程度并且嚴(yán)重影響了檢索速度。(2)主流搜索引擎大多采用關(guān)鍵詞來進(jìn)行檢索,由于用戶水平的差異,極少數(shù)可以總結(jié)出關(guān)鍵詞或關(guān)鍵詞組,以至于用戶搜索不到想要的內(nèi)容從而加大了檢索難度。(3)每個(gè)搜索引擎覆蓋的范圍雖然不小,但與龐大的互聯(lián)網(wǎng)相比,簡(jiǎn)直是九牛一毛。(4)檢索的結(jié)果不準(zhǔn)確,不唯一,搜索結(jié)果為零或者為數(shù)萬的情況時(shí)有發(fā)生。(5)不能智能搜索,傳統(tǒng)搜索引擎就難以滿足用戶深層次的需求。

3 智能技術(shù)的運(yùn)用

由于傳統(tǒng)引擎的各種缺點(diǎn),用戶越來越渴望更好用更便捷的搜索方式出現(xiàn)。在這種刺激下智能技術(shù)在搜索引擎中的應(yīng)用大量出現(xiàn),這使得搜索引擎須具有一定的智能化和理解能力,當(dāng)前主要有以下兩大智能技術(shù):

3.1 網(wǎng)對(duì)網(wǎng)技術(shù)

(1)顧名思義,網(wǎng)對(duì)網(wǎng)技術(shù)就是網(wǎng)絡(luò)和網(wǎng)絡(luò)對(duì)應(yīng)起來的意思。這其中又要提到兩個(gè)概念了,是兩個(gè)單詞。第一個(gè)單詞我們都相當(dāng)熟悉了——internet。我們常說的互聯(lián)網(wǎng),就是這個(gè)單詞。而在這里,這個(gè)單詞指的是一個(gè)信息網(wǎng)絡(luò),也就是我們所說的網(wǎng)絡(luò)中的信息網(wǎng)。我們想要搜索什么東西時(shí),將它輸入在搜索引擎中,引擎就會(huì)在這個(gè)網(wǎng)絡(luò)庫中進(jìn)行查找,找到相關(guān)信息,然后呈現(xiàn)在我們面前。而另一個(gè)詞可能就有一些陌生了——innernet。表面上看起來與internet很像,英文詞典中并沒有這個(gè)詞,我們?cè)谶@里叫它內(nèi)聯(lián)網(wǎng)。內(nèi)聯(lián)網(wǎng)是和看起來更像數(shù)據(jù)庫的internet比起來,更像是人類大腦的一個(gè)信息網(wǎng)絡(luò),這里面不僅僅有我們生活和工作中所用到的各種各樣的信息,更重要的是信息之間繁雜又緊密的聯(lián)系。就像我們?cè)谏钪泻退私涣?,提到“小伙伴”這個(gè)詞,我們會(huì)想到其他與之有聯(lián)系的詞匯,比如“朋友”、“同學(xué)”等等,同樣的,當(dāng)我們提到“師父”,我們的大腦也會(huì)迅速的聯(lián)想到“師門”、“師生”這樣的相關(guān)詞匯。我們所說的內(nèi)聯(lián)網(wǎng),它所著重的,也是信息與信息之間這樣息息相關(guān)的聯(lián)系。Internet和innernet都是知識(shí)的網(wǎng)絡(luò),互聯(lián)網(wǎng)時(shí)代的信息社會(huì)發(fā)展日新月異,因此無論是哪個(gè)網(wǎng)絡(luò),其內(nèi)的信息都是不斷變化著的。

(2)人們將這個(gè)技術(shù)運(yùn)用在搜索引擎中,大大的提高了搜索引擎的實(shí)用性。作為內(nèi)聯(lián)網(wǎng)的innernet和internet聯(lián)結(jié)起來,運(yùn)用信息之間存在的各種各樣的聯(lián)系,將用戶輸入進(jìn)搜索引擎中的話語中復(fù)雜的聯(lián)系正確的分割開,然后各自拓展出一些對(duì)人們而言有用的信息,將internet中龐大、雜亂的信息進(jìn)行有序化的篩選和整理,最終將信息呈現(xiàn)在人們的眼前。這大大的提高了搜索引擎的可操作性,縮短了人們不斷刪改語句來配合internet的時(shí)間,自然也就提高了用戶的工作效率。

3.2 Web數(shù)據(jù)挖掘技術(shù)

(1)數(shù)據(jù)挖掘作為一門交叉學(xué)科,其原理比較復(fù)雜,可以從龐大的數(shù)據(jù)中將更有用、更有新意的數(shù)據(jù)挖掘出來,而Web挖掘,便是將數(shù)據(jù)挖掘和Web發(fā)展聯(lián)系起來。Web數(shù)據(jù)挖掘有三種不同的挖掘形式,即內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用記錄的挖掘。

(2)內(nèi)容挖掘指的是從Web文檔中或是描述中進(jìn)行挖掘,在網(wǎng)頁中進(jìn)行數(shù)據(jù)挖掘,其中包括數(shù)據(jù)有文本、超鏈接、圖像和視頻等等,而半結(jié)構(gòu)化的數(shù)據(jù)和無結(jié)構(gòu)的文本便是主要的挖掘?qū)ο蟆?/p>

(3)Web結(jié)構(gòu)挖掘則是通過網(wǎng)頁中的超鏈接,發(fā)現(xiàn)其中信息之間的結(jié)構(gòu)及其緊密或稀疏的聯(lián)系。在我們平時(shí)的上網(wǎng)中,我們只能看到一個(gè)個(gè)的網(wǎng)頁,打開瀏覽或者關(guān)閉。但是在這些頁面的背后,其實(shí)隱藏著無數(shù)個(gè)結(jié)構(gòu)鏈接。Web數(shù)據(jù)挖掘就能夠通過這些結(jié)構(gòu)上的鏈接,發(fā)現(xiàn)頁面與頁面、數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系,隨后對(duì)它們進(jìn)行分類,以便為用戶提供含有相似信息的更多頁面,幫助用戶完善自己想要在搜索引擎中得到的信息。

(4)Web使用記錄的挖掘則是較之前兩個(gè),讓我們感覺更加熟悉的,至少“使用記錄”四個(gè)字使我們上網(wǎng)過程中能夠看到的。當(dāng)我們點(diǎn)擊一下搜索引擎的輸入框想要輸入文本時(shí),搜索引擎會(huì)自動(dòng)下拉出我們前幾次使用時(shí)所查詢的內(nèi)容,以便我們重復(fù)查看相似內(nèi)容的信息。搜索引擎有時(shí)也會(huì)為我們推薦一些內(nèi)容的信息,這些信息也會(huì)是我們所感興趣的一些內(nèi)容,是搜索引擎結(jié)合了我們之前的使用記錄,為我們提供感興趣的相類似的內(nèi)容。這些都是Web使用記錄挖掘在搜索引擎中的實(shí)用例子,但并不是全部。搜索引擎會(huì)從用戶的訪問痕跡中挖掘出很多有意義的數(shù)據(jù),包括數(shù)據(jù)端、服務(wù)器端和代理端的數(shù)據(jù)。而其獲得這些數(shù)據(jù)的途徑又分為KDD和專業(yè)化追蹤,通過這些方法和深度的挖掘,使搜索引擎更加“智能”的了解用戶的興趣和需要。

4 結(jié)束語

搜索引擎是我們工作、學(xué)習(xí)和生活中必不可少的實(shí)用性技術(shù),正如一個(gè)調(diào)查中所顯示的,85%的人都是通過搜索引擎獲取到他們所需要的信息和所喜愛的網(wǎng)站,可見搜索引擎對(duì)于人們而言的重要性。隨著智能技術(shù)在不斷的更新,人們的生活變得越來越智能,對(duì)搜索引擎的要求也會(huì)隨之越來越高,因此不斷利用新的技術(shù)完善和提高搜索引擎的智能性,是用戶的選擇,也是時(shí)代的選擇,是搜索引擎在現(xiàn)在和未來的發(fā)展中必然的趨勢(shì),且將一直持續(xù)下去。

參考文獻(xiàn)

[1]陳勇躍,張玉峰.智能技術(shù)在搜索引擎中的應(yīng)用[J].情報(bào)雜志,2004,02:2-3+6.

[2]楊占華,楊燕.數(shù)據(jù)挖掘在智能搜索引擎中的應(yīng)用[J].微計(jì)算機(jī)信息,2006,12:244-246.

[3]朱素媛,馬溪俊,梁昌勇.人工智能技術(shù)在搜索引擎中的應(yīng)用[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,S1:657-661.

[4]李娟.數(shù)據(jù)挖掘技術(shù)在智能搜索引擎中的應(yīng)用[D].長(zhǎng)春理工大學(xué),2010.

猜你喜歡
智能技術(shù)搜索引擎應(yīng)用分析
Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項(xiàng)
世界表情符號(hào)日
智能技術(shù)在電力系統(tǒng)自動(dòng)化中的運(yùn)用研究
電氣自動(dòng)化控制中的人工智能技術(shù)探究
新型傳感器在汽車技術(shù)中的應(yīng)用分析
關(guān)于煙草設(shè)備自動(dòng)化系統(tǒng)淺析
基于Lucene搜索引擎的研究
搜索引擎,不止有百度與谷歌
邯郸县| 靖安县| 阿拉善右旗| 和硕县| 类乌齐县| 防城港市| 峡江县| 平定县| 榆中县| 江西省| 襄垣县| 广河县| 疏勒县| 荥阳市| 阳山县| 南郑县| 常熟市| 沙洋县| 田阳县| 隆林| 聂荣县| 荔浦县| 抚州市| 孙吴县| 潞城市| 大厂| 秦安县| 永登县| 江川县| 浮梁县| 康保县| 吉木乃县| 水富县| 长垣县| 棋牌| 虞城县| 吴旗县| 青阳县| 社旗县| 大邑县| 临邑县|