錢林玉+趙建川+于國龍+劉小娜+趙江+李林初
摘 要:文中通過對垂直搜索引擎原理和關(guān)鍵技術(shù)的研究,開發(fā)面向金融借貸的企業(yè)信用度查詢的垂直搜索引擎,實現(xiàn)放貸公司對借貸企業(yè)或者公司信用度的查詢。根據(jù)此公司的信用度高低進(jìn)行小額借貸的金額分配,使金融借貸更加成功。實現(xiàn)借貸之后,跟蹤企業(yè)的信用度,避免借貸用戶對借款故意拖欠、超額、跑路等現(xiàn)象,體現(xiàn)了垂直搜索引擎的商業(yè)應(yīng)用價值。文中對于垂直搜索引擎要面對和解決的企業(yè)信用度查詢進(jìn)行了分析,并給出了具有實用性的解決方案。
關(guān)鍵詞:垂直搜索引擎;信用度查詢;金融借貸;金額分配
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-1302(2017)03-0-02
0 引 言
隨著金融經(jīng)濟(jì)社會的發(fā)展,在要求保證企業(yè)信譽和商品質(zhì)量的前提下,在金融借貸時,通過將垂直搜索引擎搜索出的信息直接反饋給放貸公司,讓放貸公司對借貸用戶的信用度進(jìn)行詳細(xì)了解后,就能順利開展金融借貸合作[1]。此垂直搜索引擎開發(fā),主要能夠讓借貸公司直接查出用戶的公司信用度,根據(jù)此公司的信用度高低進(jìn)行小額借貸的金額分配,使金融借貸成功進(jìn)行[2]。
在當(dāng)代互聯(lián)網(wǎng)迅速發(fā)展的時代,每天進(jìn)行搜索引擎檢索的網(wǎng)頁有很多,使搜索引擎系統(tǒng)對網(wǎng)絡(luò)信息的搜索無法進(jìn)行準(zhǔn)確、有針對性的查詢[3]?,F(xiàn)在社會需要更為準(zhǔn)確的搜索查詢,因此需要借助能夠快速、有針對性的搜索引擎系統(tǒng)——垂直搜索引擎系統(tǒng)來搜索。通過對企業(yè)信用度的深入了解,設(shè)計并實現(xiàn)了一個用于放貸公司方便查詢的垂直搜索引擎系統(tǒng)[4]。在查詢金融信息時給出解決方案,能夠通過手機端垂直搜索引擎證明方案的實用性和方便性[5]。
1 垂直搜索引擎開發(fā)的價值
1.1 應(yīng)用價值
此金融借貸垂直搜索引擎的開發(fā)主要能夠讓放貸公司直接查出用戶商的公司信用度,根據(jù)此公司的信用度高低進(jìn)行小額借貸時的金額分配,使本次金融借貸更加成功。實現(xiàn)借貸后,跟蹤企業(yè)信用度,避免出現(xiàn)借貸用戶對借款故意拖欠、超額、跑路等現(xiàn)象,體現(xiàn)了垂直搜索引擎平臺的商業(yè)應(yīng)用價值[6]。
1.2 技術(shù)價值
目前在互聯(lián)網(wǎng)領(lǐng)域上的主要搜索引擎服務(wù)商如谷歌、百度等,都為用戶提供橫向的海量信息搜索,這無法滿足放貸公司對金融借貸用戶進(jìn)行具體了解的需求,不能實現(xiàn)系統(tǒng)的具體價值。垂直搜索引擎作為搜索引擎技術(shù)發(fā)展的一個分支,通過對關(guān)鍵字的搜索,針對特定信息進(jìn)行全面收集,并組織整理,將提供更加專業(yè)化、個性化的金融行業(yè)信息服務(wù),滿足放貸公司對專業(yè)領(lǐng)域信息的搜索需求。
2 垂直搜索引擎的原理和關(guān)鍵技術(shù)
2.1 垂直搜索引擎的原理
垂直搜索引擎系統(tǒng)是相對通用搜索引擎系統(tǒng)查詢不準(zhǔn)確、信息量大等問題提出來的新型搜索引擎模式,通過針對某一領(lǐng)域、某一人群或某一需求提供的具有一定價值的信息服務(wù)。垂直搜索引擎的特點是“專、精、深”,且具有行業(yè)色彩,如進(jìn)行金融查詢和企業(yè)信用度查詢等,相比較一般搜索引擎的無序化而言,垂直搜索引擎系統(tǒng)則顯得更加專注、具體和深入。網(wǎng)頁抓取過程如圖1所示。
2.2 垂直搜索引擎的關(guān)鍵技術(shù)
2.2.1 網(wǎng)絡(luò)爬蟲技術(shù)
網(wǎng)絡(luò)爬蟲是一個能進(jìn)行頁面下載和提取的程序,頁面上往往有我們需要的信息如鏈接、圖片、點評等,可以在互聯(lián)網(wǎng)上下載網(wǎng)頁。并且進(jìn)行鏈接提取,初始化為鏈接,然后不斷抓取新的鏈接,在網(wǎng)上獲取初始URL,在抓取網(wǎng)頁的過程中,會不斷從當(dāng)前頁面上抽取新的URL放入新的隊列中進(jìn)行URL管理,防止重復(fù)和陷入死循環(huán)[7]。實現(xiàn)內(nèi)容分析和管理,抽取頁面上的信息,并存到數(shù)據(jù)庫或文件系統(tǒng)中。以此為用戶提供最高效的服務(wù),并用HTTP協(xié)議提供服務(wù)[8]。
2.2.2 網(wǎng)絡(luò)爬蟲Heritrix
Heritrix網(wǎng)絡(luò)爬蟲用Java語言作為基礎(chǔ)進(jìn)行開發(fā)設(shè)計,這是一種開源性的網(wǎng)絡(luò)爬蟲,企業(yè)和公司用戶可以使用網(wǎng)絡(luò)爬蟲在互聯(lián)網(wǎng)上抓取對公司有價值的資源,并且Heritrix有良好的可擴展性,方便企業(yè)用戶實現(xiàn)自己的目的[9]。Heritrix的系統(tǒng)框架如圖2所示。
3 垂直搜索引擎系統(tǒng)的分析與設(shè)計
本文設(shè)計實現(xiàn)的目標(biāo)不僅是放貸公司能夠準(zhǔn)確查詢到金融用戶的信用度,更是一個準(zhǔn)確的手機信息檢索的垂直搜索引擎,是一個實現(xiàn)準(zhǔn)確、方便、快速查找的信息檢索系統(tǒng)工具。放貸公司用戶只需簡單輸入借貸公司名稱和信用度等關(guān)鍵詞就能找到相關(guān)信息,為使用者提供最新、最準(zhǔn)確、最全面的信息。搜索引擎的系統(tǒng)結(jié)構(gòu)如圖3所示。
4 系統(tǒng)實現(xiàn)
整個搜索系統(tǒng)采用Java語言開發(fā),具有良好的跨平臺和可移植等特性,很容易在PC端、移動端等操作系統(tǒng)平臺之上使用。手機信息檢索系統(tǒng)的運行界面如圖4所示。系統(tǒng)的后臺主頁界面如圖5所示。
因為分詞系統(tǒng)器有自帶的詞庫,所以使用“金融”和“信用度”作為關(guān)鍵詞可以很好地進(jìn)行查詢搜索。
5 結(jié) 語
本文論述了面向金融借貸企業(yè)信用度查詢的垂直搜索引擎系統(tǒng)的開發(fā)與實現(xiàn)過程,以及放貸公司實現(xiàn)金融借貸的實施過程,其目的是企業(yè)用戶在檢索系統(tǒng)時能夠直觀看到且不受影響,同時還能專業(yè)的進(jìn)行查詢結(jié)果分析。在金融公司檢索信息的過程中,可以很快查詢到信用度信息,并基于這些測試結(jié)果更好地進(jìn)行訪問選擇。
參考文獻(xiàn)
[1] Awekar A.C,Jaewoo K.Selective Approach ToHanding Topic Oriented Tasks On The World Wide Web[C].Proceeding of the 2007 IEEE Symposium onComputational intelligence and Data Ming,Honolulu,HI,USA,2007:343-348.
[2] Taker H.Haveliwala. Topic-Sensitive PageRank[J].in Proceedings of the Eleventh Internaional World Wide Web Conference,2002,59 (1):517-526.
[3] A Classification Method for Web Information Extraction[J].Conference on Web Information System and Applications,2004,9(5):823-827.
[4] Kamvar S,Haveliwala T,Golub G.Adaptive methods for the computation of PageRank[J].Linear Algebra and its Application,2003,386(2):51-65.
[5]李亞.垂直搜索引擎的研究與設(shè)計[D]. 武漢:武漢理工大學(xué),2010.
[6]吳燕瑋.基于行業(yè)知識垂直搜索引擎的研究與實現(xiàn)[D].北京:北京郵電大學(xué),2012.
[7]張書江.基于Java的垂直搜索引擎的設(shè)計與實現(xiàn)[D].淮南:安徽理工大學(xué),2009.
[8]張亞鳳.垂直搜索引擎中關(guān)鍵技術(shù)的研究[D].長春:長春工業(yè)大學(xué),2016.
[9]李亮.基于Lucene和Heritrix的職位垂直搜索引擎的設(shè)計與實現(xiàn)[D].北京:中國地質(zhì)大學(xué)(北京), 2010.