曾偉琪
摘要:該文結(jié)合目前互聯(lián)網(wǎng)搜索引擎的應(yīng)用情況,首先確定了搜索引擎主要的評價(jià)指標(biāo)。并對如何確定各指標(biāo)權(quán)重進(jìn)行了研究,建立了權(quán)重分配子模型,為評分標(biāo)準(zhǔn)制定依據(jù)。利用多目標(biāo)決策理論建立搜索引擎性能的綜合評價(jià)數(shù)學(xué)模型,然后使用建立的模型舉例計(jì)算百度、搜狗、搜搜、愛問、谷歌五個(gè)常用搜索引擎的的得分。該文的模型主要是基于多目標(biāo)決策理論以及多元回歸和層次分析。
關(guān)鍵詞:搜索引擎;權(quán)重;模型
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2013)14-0014-02
隨著互聯(lián)網(wǎng)的快速發(fā)展,人們已經(jīng)離不開從互聯(lián)網(wǎng)上獲取信息。但是這些信息浩如煙海,同事又夾雜著大量的有害信息。搜索引擎技術(shù)就是完美利用這些資源的有效手段。搜索引擎可以說是一個(gè)網(wǎng)站,這些網(wǎng)站通過網(wǎng)絡(luò)搜索軟件( 也稱網(wǎng)絡(luò)搜索機(jī)器人) 或網(wǎng)站登錄等方式,將互聯(lián)網(wǎng)上大量網(wǎng)站收集到本地,經(jīng)過一定的處理后放入自己的資料庫。用戶對其進(jìn)行各種查詢,搜索引擎給出響應(yīng),提供用戶所需的信息。有調(diào)查顯示,搜索是繼電子郵件之后的第二大互聯(lián)網(wǎng)應(yīng)用。 因此,建立搜索引擎綜合評價(jià)體系,完整、客觀地對搜索引擎進(jìn)行綜合評價(jià),具有較大的社會意義和研究前景。而針對這個(gè)問題目前已經(jīng)有很多學(xué)者做出一些卓有成效的研究,統(tǒng)計(jì)了大量數(shù)據(jù),運(yùn)用了大量分析研究方法,信息技術(shù)的逐漸發(fā)展,客觀有效地評價(jià)搜索引擎,得出有意義排名,并且設(shè)計(jì)個(gè)性化搜索引擎,對于提高工作效率,實(shí)現(xiàn)時(shí)間價(jià)值最大化,具有重要意義。
為了確定搜索引擎的性能,我們要根據(jù)搜索引擎和用戶之間的相互關(guān)系,以第三方身份確定評價(jià)搜索引擎性能優(yōu)劣的關(guān)鍵因素,通過建立權(quán)重子模型,確定每個(gè)環(huán)節(jié)的權(quán)重大小。再進(jìn)一步實(shí)際試驗(yàn),統(tǒng)計(jì)數(shù)據(jù),采用多目標(biāo)決策法,統(tǒng)計(jì)搜索引擎的最終得分,進(jìn)行排名。
1 模型假設(shè)
1)假設(shè)所參與評價(jià)的搜索引擎性能穩(wěn)定,服務(wù)器無故障,且短時(shí)間內(nèi)不會升級,狀態(tài)保持。
2)假設(shè)模型衡量的因素就是參與評價(jià)的關(guān)鍵因素, 其他變量設(shè)為無關(guān)變量,它們的變化不影響評價(jià)最后評價(jià)結(jié)果的準(zhǔn)確度。
3)假設(shè)網(wǎng)絡(luò)速度的狀況的變化與不影響結(jié)果。
4)假設(shè)參與評價(jià)的因素之間相互獨(dú)立。
2 符號說明
2 模型建立與求解
2.1 對現(xiàn)有的搜索引擎進(jìn)行分析
在對互聯(lián)網(wǎng)搜索引擎的優(yōu)劣進(jìn)行評價(jià)時(shí),所建立的數(shù)學(xué)模型中涉及許多決策變量。這些變量有繁多、結(jié)構(gòu)復(fù)雜、不確定性等特點(diǎn)。為了解決這一問題,我們有必要對描述目標(biāo)的相對重要度做出正確的估價(jià)。而各因素的重要程度是不一樣的,為了反映因素的重要程度,需要對各因素相對重要性進(jìn)行估測(即權(quán)數(shù)),由各因素權(quán)數(shù)組成的集合就是權(quán)重集。權(quán)重是指標(biāo)本身的物理屬性的客觀反映,是主客觀綜合量度的結(jié)果。
系統(tǒng)工程理論中的層次分析法(Analytic Hierarchy Process,簡稱AHP)是一種較好的權(quán)重確定方法。它是把復(fù)雜問題中的各因素劃分成相關(guān)聯(lián)的有序?qū)哟?,使之條理化的多目標(biāo)、多準(zhǔn)則的決策方法,是一種定量分析與定性分析相結(jié)合的有效方法。而本模型將使用層次分析法對問題的決策變量確定其權(quán)重。給出問題的層次結(jié)構(gòu)模型:
搜索引擎b;準(zhǔn)確性b1、安全性b2、完整性b3;非歧義b11、去重復(fù)b12、優(yōu)先度b13、無毒b21、社會影響b22、內(nèi)容原創(chuàng)b31、更新頻率b32。
下面闡述AHP確定權(quán)重的基本過程。
根據(jù)以上分?jǐn)?shù)可求出前五名的搜索引擎排序?yàn)椋汗雀?、搜狗、搜搜、愛問、百度?/p>
4 結(jié)束語
本文使用層次分析法比較全面的研究了關(guān)于搜索引擎的評價(jià)問題,利用多目標(biāo)決策理論建立搜索引擎性能的綜合評價(jià)數(shù)學(xué)模型,得出最終評分。但各大搜索引擎都在迅速發(fā)展,各自的搜索引擎的性能也在進(jìn)一步提升,這些都會影響到本文所確定的評價(jià)指標(biāo)的適用性。并且層次分析法存在其天然的缺點(diǎn),比如其定量數(shù)據(jù)較少,定性成分多。所以,如何建立一個(gè)合理的評價(jià)模型仍需進(jìn)一步研究。
參考文獻(xiàn):
[1] 劉正春. 搜索引擎綜合評價(jià)模型研究[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識, 2004,34(9).
[2] 徐俊, 劉娜. 層次分析法的基本思想與實(shí)際應(yīng)用[J]. 情報(bào)探索, 2008(12).
[3] 郭金玉, 張忠彬, 孫慶云. 層次分析法在安全科學(xué)研究中的應(yīng)用[J]. 中國安全生產(chǎn)科學(xué)技術(shù), 2008(2).