国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“互聯(lián)網(wǎng)+”環(huán)境下移動(dòng)校園搜索引擎設(shè)計(jì)與實(shí)現(xiàn)

2020-08-12 02:32:56王寧邦
關(guān)鍵詞:門戶搜索引擎網(wǎng)頁(yè)

王寧邦,徐 博

(云南師范大學(xué) 信息管理處,云南 昆明 650500)

1 概 述

“互聯(lián)網(wǎng)+”代表著一種新的經(jīng)濟(jì)形態(tài)?!盎ヂ?lián)網(wǎng)+”是指以互聯(lián)網(wǎng)為主的新一代信息技術(shù),包括移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)等在經(jīng)濟(jì)、社會(huì)生活中各部門的擴(kuò)散、應(yīng)用與深度融合的過(guò)程[1]。2015年成為大數(shù)據(jù)發(fā)展的里程碑,在政府工作報(bào)告中,提出要制定“互聯(lián)網(wǎng)+”計(jì)劃,推動(dòng)云計(jì)算、大數(shù)據(jù)與現(xiàn)代制造業(yè)的結(jié)合,促進(jìn)大數(shù)據(jù)的升級(jí)發(fā)展。門戶(portal)一詞原意是指正門、入口,現(xiàn)多用于互聯(lián)網(wǎng)的門戶網(wǎng)站和企業(yè)應(yīng)用系統(tǒng)的門戶系統(tǒng)[1]。高校網(wǎng)站(Website)分為門戶網(wǎng)站、二級(jí)院系或部門網(wǎng)站和專題網(wǎng)站[2]。文中信息門戶為學(xué)校官網(wǎng)、學(xué)院或部門的主站。

移動(dòng)無(wú)線互聯(lián)網(wǎng)的時(shí)代已經(jīng)到來(lái),移動(dòng)無(wú)線終端的數(shù)量己經(jīng)超過(guò)有線終端,移動(dòng)互聯(lián)的應(yīng)用需求日益增大,隨著無(wú)線網(wǎng)絡(luò)建設(shè)的發(fā)展和數(shù)字化校園應(yīng)用系統(tǒng)的持續(xù)建設(shè),校園移動(dòng)終端應(yīng)用已經(jīng)逐步形成校園信息化的應(yīng)用趨勢(shì)。校園網(wǎng)各種應(yīng)用向移動(dòng)終端的遷移,提供真正適用移動(dòng)校園網(wǎng)的應(yīng)用服務(wù),是每個(gè)學(xué)校面臨的新挑戰(zhàn)。顯然,“一云多終端”風(fēng)靡全網(wǎng),單一的服務(wù)模式解決不了“互聯(lián)網(wǎng)+”環(huán)境下的網(wǎng)絡(luò)文化發(fā)展需求,移動(dòng)網(wǎng)絡(luò)文化融合主流應(yīng)用如微信、主流移動(dòng)技術(shù)、校園信息資源的發(fā)展勢(shì)不可擋。QQ空間文化、微信文化發(fā)展迅猛,借鑒它們的運(yùn)作模式加強(qiáng)移動(dòng)校園網(wǎng)絡(luò)文化建設(shè)具有一定的研究意義。

當(dāng)下,移動(dòng)校園網(wǎng)絡(luò)文化明顯出現(xiàn)建設(shè)缺位、沒(méi)有吸引力、隱形外流等情況,信息門戶也往往回避不了無(wú)人問(wèn)津的尷尬,融入主流技術(shù)整合高校信息門戶資源,豐富、挖掘校園網(wǎng)絡(luò)文化的承載渠道,加強(qiáng)高校移動(dòng)網(wǎng)絡(luò)文化建設(shè),研究門戶信息網(wǎng)絡(luò)傳播規(guī)律以及網(wǎng)絡(luò)輿情分析與引導(dǎo)能力顯得格外重要,在“互聯(lián)網(wǎng)+”環(huán)境下重新思考高校移動(dòng)網(wǎng)絡(luò)文化建設(shè)、整合門戶信息及其傳播問(wèn)題顯得很有必要。創(chuàng)新符合網(wǎng)絡(luò)傳播規(guī)律的網(wǎng)上宣傳方式,提升網(wǎng)絡(luò)輿情分析和引導(dǎo)能力。加強(qiáng)互聯(lián)網(wǎng)分類管理,強(qiáng)化運(yùn)營(yíng)主體的社會(huì)責(zé)任。推進(jìn)文明辦網(wǎng)、文明上網(wǎng),引導(dǎo)廣大青年?duì)幃?dāng)“中國(guó)好網(wǎng)民”,倡導(dǎo)網(wǎng)絡(luò)公益活動(dòng),凈化網(wǎng)絡(luò)環(huán)境??梢?jiàn)高校信息門戶將會(huì)被融入時(shí)代的主流技術(shù)。同樣的,高校移動(dòng)校園網(wǎng)絡(luò)文化也需要依托移動(dòng)端移動(dòng)技術(shù)、豐富的校園網(wǎng)絡(luò)行為等的承載[3]。

“分久必合”,各學(xué)院門戶自成一家,信息服務(wù)不集中,快捷查詢門戶信息顯得不方便。就桌面而言,缺少一鍵查詢獲取所需信息的應(yīng)用,雖然百度可以做到這一點(diǎn),但是由于它的工作量很大,無(wú)暇顧及校園門戶信息;另外,桌面門戶由于分辨率的問(wèn)題,在移動(dòng)端的門戶信息顯得不容樂(lè)觀,但是移動(dòng)端明顯表現(xiàn)出來(lái)比桌面門戶端更觸手可及的優(yōu)勢(shì)。門戶信息在移動(dòng)端傳播具有便利性,借助移動(dòng)端IOS、Android等技術(shù),個(gè)性化推送技術(shù),第三方如微信等為桌面信息門戶的發(fā)布提供便利,學(xué)生可以方便快速獲取校園信息。網(wǎng)頁(yè)自適應(yīng)技術(shù)、HTML5技術(shù)等可以讓信息門戶擁有更好的主流技術(shù)體驗(yàn),然而現(xiàn)有的校園信息門戶不具備這些體驗(yàn)[4]。同時(shí),為每一個(gè)門戶開(kāi)發(fā)具備不錯(cuò)體驗(yàn)的客戶端存在重復(fù)建設(shè)的問(wèn)題,顯得不太現(xiàn)實(shí)。所以融入主流技術(shù)統(tǒng)一提供門戶信息服務(wù)、整合高校信息門戶資源,豐富、挖掘校園網(wǎng)絡(luò)文化的承載渠道,加強(qiáng)高校移動(dòng)網(wǎng)絡(luò)文化建設(shè),研究門戶信息網(wǎng)絡(luò)傳播規(guī)律以及網(wǎng)絡(luò)輿情分析與引導(dǎo)能力顯得格外重要。

“互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎相關(guān)研究現(xiàn)狀分析如下:(1)信息門戶整合方面;唐宏平[1]認(rèn)為信息門戶具有“統(tǒng)一管理信息資源、信息技術(shù)整合和信息共享”的優(yōu)勢(shì),并研究與應(yīng)用信息門戶技術(shù)等搭建起了遼河油田新的集中統(tǒng)一的信息門戶系統(tǒng)。馬國(guó)良[2]基于Web服務(wù)及其關(guān)鍵技術(shù)(HTTP、XML、SOAP等)、門戶技術(shù)等建立統(tǒng)一門戶。方玲慧[5]針對(duì)目前美國(guó)高校門戶網(wǎng)站建設(shè)的現(xiàn)狀和存在的問(wèn)題,對(duì)加強(qiáng)網(wǎng)站建設(shè)的對(duì)策和方法進(jìn)行探討。方偉杰[6]通過(guò)在數(shù)據(jù)整合與身份認(rèn)證整合的基礎(chǔ)上進(jìn)行信息整合實(shí)現(xiàn)高校資源與服務(wù)的綜合利用。周曉艷[7]將一卡通系統(tǒng)納入信息門戶平臺(tái)中,豐富信息平臺(tái)內(nèi)容。付小龍[8]闡述了信息構(gòu)建理論在數(shù)字校園信息門戶規(guī)劃與設(shè)計(jì)的指導(dǎo)作用。林麗娟[9]提出信息整合的分層整合架構(gòu)。藍(lán)鷹[10]提出了一套基于HTML5+CSS技術(shù)的高校門戶網(wǎng)站生成方案。畢劍[11]采用響應(yīng)式網(wǎng)頁(yè)設(shè)計(jì)技術(shù),為圖書(shū)館移動(dòng)門戶的建設(shè)提供了一種新的解決方案。關(guān)于信息門戶整合的文章較少,百度、Google等技術(shù)明顯產(chǎn)生了很好的經(jīng)濟(jì)效益和社會(huì)效益,隨著移動(dòng)技術(shù)的發(fā)展,考慮“互聯(lián)網(wǎng)+”環(huán)境下,高校利用搜索引擎等技術(shù)對(duì)信息門戶整合具有重要研究意義。(2)高校移動(dòng)網(wǎng)絡(luò)文化建設(shè)方面;孫耀庭[12]對(duì)開(kāi)放大學(xué)移動(dòng)校園APP服務(wù)功能需求進(jìn)行探索。燕玲玲[13]基于Android平臺(tái),建立一個(gè)針對(duì)本校學(xué)生的實(shí)時(shí)校園生活信息服務(wù)系統(tǒng),提供學(xué)生交流互動(dòng)的平臺(tái),打破傳統(tǒng)的只能上貼吧論壇交流的格局。(3)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)方面;岳雨儉[14]提出基于Hadoop分布式網(wǎng)絡(luò)爬蟲(chóng)技術(shù),具有較髙的抓取效率。(4)基于用戶偏好的個(gè)性化推送方面;黃原原[15]提出一個(gè)基于百度社區(qū)和領(lǐng)域本體庫(kù),結(jié)合相關(guān)反饋技術(shù)和擴(kuò)展查詢技術(shù),促使個(gè)體特征庫(kù)不斷學(xué)習(xí)用戶知識(shí)以提供個(gè)性化信息檢索的模型。周蒙[3]利用信息推送技術(shù)、個(gè)性化廣告推送技術(shù)等,設(shè)計(jì)并實(shí)現(xiàn)個(gè)性化廣告推送服務(wù)系統(tǒng)。劉思源[4]設(shè)計(jì)并實(shí)現(xiàn)了一種基于用戶偏好和地理位置信息的即時(shí)推送,并構(gòu)建完整的個(gè)性化推送模型。

綜上所述,當(dāng)前的信息門戶資源服務(wù)方式存在效率低下的問(wèn)題,尤其是大數(shù)據(jù)釋放紅利的時(shí)代,其次,分散建設(shè)集中服務(wù)顯得具有更大的影響力,產(chǎn)生了更大的社會(huì)效益,所以利用前沿的計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、云計(jì)算技術(shù)整合校園網(wǎng)門戶資源,優(yōu)化信息門戶服務(wù)效率的移動(dòng)校園搜索引擎相關(guān)研究具有重要意義。在“互聯(lián)網(wǎng)+”環(huán)境下重新思考高校移動(dòng)網(wǎng)絡(luò)文化建設(shè)、整合門戶信息及其傳播問(wèn)題顯得很有必要。此外,校園網(wǎng)絡(luò)文化平臺(tái)構(gòu)件缺失,文化資源外流嚴(yán)重,由本校學(xué)生形成的純凈校園網(wǎng)絡(luò)文化氛圍亟待形成,移動(dòng)校園網(wǎng)絡(luò)文化平臺(tái)承載學(xué)生和學(xué)校信息門戶的發(fā)展,可以依托移動(dòng)校園網(wǎng)絡(luò)文化個(gè)人空間,記錄學(xué)生在學(xué)校的網(wǎng)絡(luò)文化行為,充分挖掘高校信息資源與學(xué)生網(wǎng)絡(luò)行為之間的關(guān)系,為構(gòu)建“互聯(lián)網(wǎng)+”環(huán)境下移動(dòng)校園網(wǎng)絡(luò)文化平臺(tái)奠定基礎(chǔ)。

2 “互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎設(shè)計(jì)

以云南師范大學(xué)各個(gè)學(xué)院信息門戶為實(shí)例對(duì)象,擬研究整合校園門戶信息,提供方便快捷、融合移動(dòng)體驗(yàn)、網(wǎng)頁(yè)自適應(yīng)技術(shù)、HTML5技術(shù)的掌上信息服務(wù),提供一鍵查詢校園搜索引擎的終端功能,讓師生體驗(yàn)到真正的移動(dòng)校園。開(kāi)通移動(dòng)校園文化個(gè)人空間,進(jìn)一步構(gòu)建、繁榮移動(dòng)校園網(wǎng)絡(luò)文化。

2.1 信息服務(wù)物理模型

從桌面網(wǎng)頁(yè)到移動(dòng)端數(shù)據(jù),涉及對(duì)原始桌面網(wǎng)頁(yè)主要信息的獲取,由網(wǎng)址獲取頁(yè)面所有內(nèi)容,再通過(guò)設(shè)定的通用規(guī)則對(duì)所需要的數(shù)據(jù)進(jìn)行抓取并存儲(chǔ),為了提供信息構(gòu)建的數(shù)據(jù)訪問(wèn)接口以及客戶端請(qǐng)求程序等,處理流程如圖1所示。

2.2 “互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎主要內(nèi)容

高校移動(dòng)校園搜索引擎系統(tǒng)結(jié)構(gòu)如圖2所示。

圖1 信息服務(wù)物理模型

圖2 高校移動(dòng)校園搜索引擎系統(tǒng)結(jié)構(gòu)

2.2.1 整合數(shù)據(jù)源提供一站式信息服務(wù)

以云南師范大學(xué)為例,在數(shù)據(jù)源方面,讓每一個(gè)門戶提供數(shù)據(jù)訪問(wèn)接口顯得繁瑣,研究依托學(xué)校的云計(jì)算平臺(tái),利用爬蟲(chóng)定時(shí)對(duì)100多個(gè)校園門戶信息進(jìn)行爬取,構(gòu)建校園搜索引擎索引庫(kù)。針對(duì)就業(yè)處,擬研究爬蟲(chóng)在互聯(lián)網(wǎng)爬取就業(yè)信息,為畢業(yè)生提供完備的就業(yè)信息源。

提供網(wǎng)頁(yè)自適應(yīng)門戶:研究兼容桌面和移動(dòng)端的網(wǎng)頁(yè)自適應(yīng)技術(shù)以及HTML5技術(shù),為桌面、第三方如微信等提供數(shù)據(jù)接口,搭建“一鍵查詢所需”的統(tǒng)一入口。使用校園搜索引擎的移動(dòng)客戶端,為師生提供一鍵移動(dòng)校園、觸手可及的門戶信息服務(wù)。研究設(shè)定數(shù)據(jù)采集規(guī)則,裁剪信息門戶冗余成分,增加移動(dòng)端技術(shù)元素,讓門戶信息服務(wù)擁有移動(dòng)體驗(yàn)。

2.2.2 主題爬蟲(chóng)技術(shù)

圖3中,黑色節(jié)點(diǎn)為主題相關(guān)網(wǎng)頁(yè),白色節(jié)點(diǎn)為主題無(wú)關(guān)網(wǎng)頁(yè),Community Q為許多主題無(wú)關(guān)網(wǎng)頁(yè)組成的區(qū)域。假設(shè)爬蟲(chóng)從P0開(kāi)始爬行,理想的主題爬蟲(chóng),應(yīng)該能夠預(yù)測(cè)網(wǎng)頁(yè)的主題相關(guān)性,沿著圖中箭頭所指的方向爬行,剪掉不相關(guān)網(wǎng)頁(yè),舍棄P3這個(gè)分支,盡可能少地下載不相關(guān)網(wǎng)頁(yè);并且準(zhǔn)確判斷出P2、d0等的主題相關(guān)性,抓取到這些網(wǎng)頁(yè)。主題爬蟲(chóng)工作流程見(jiàn)圖4。

圖3 網(wǎng)絡(luò)爬蟲(chóng)搜索示意圖

圖4 主題爬蟲(chóng)工作流程

2.2.3 累積網(wǎng)絡(luò)行為,維系大學(xué)校園和學(xué)生情誼

為學(xué)生提供移動(dòng)校園網(wǎng)絡(luò)文化空間,開(kāi)通即時(shí)通信服務(wù),記錄網(wǎng)絡(luò)行:如即時(shí)通信信息、校園空間心情等,為加強(qiáng)移動(dòng)校園網(wǎng)絡(luò)文化建設(shè)累積基礎(chǔ)數(shù)據(jù),統(tǒng)計(jì)“校園最文化”:最受關(guān)注的部門、最后關(guān)注的學(xué)生、最受關(guān)注的話題等,基于位置、軌跡等研究“我與我的校園”,統(tǒng)計(jì)畢業(yè)生對(duì)學(xué)校的關(guān)注度等。

2.2.4 挖掘平臺(tái)隱性業(yè)務(wù)促進(jìn)網(wǎng)絡(luò)文化育人

在逐步完成的基礎(chǔ)上上線運(yùn)行測(cè)試,對(duì)用戶行為進(jìn)行挖掘形成新的業(yè)務(wù)。并且研究網(wǎng)絡(luò)傳播規(guī)律的網(wǎng)上宣傳方式,提升網(wǎng)絡(luò)輿情分析和引導(dǎo)能力,推進(jìn)文明辦網(wǎng)、文明上網(wǎng),引導(dǎo)廣大青年?duì)幃?dāng)“中國(guó)好網(wǎng)民”,倡導(dǎo)網(wǎng)絡(luò)公益活動(dòng),凈化網(wǎng)絡(luò)環(huán)境,在原型開(kāi)發(fā)的過(guò)程中逐步將這些需求一一落實(shí)到每一個(gè)功能業(yè)務(wù)。如對(duì)用戶網(wǎng)絡(luò)行為(如對(duì)校園信息門戶建設(shè)的點(diǎn)擊貢獻(xiàn)率)按照一定的標(biāo)準(zhǔn)量化核算成分?jǐn)?shù),給以“師大好網(wǎng)民”的電子獎(jiǎng)勵(lì),給予團(tuán)學(xué)積分獎(jiǎng)勵(lì)等。

3 “互聯(lián)網(wǎng)+”環(huán)境下高校移動(dòng)校園搜索引擎系統(tǒng)特點(diǎn)

以“互聯(lián)網(wǎng)+”為研究背景,使用自適應(yīng)網(wǎng)頁(yè)、HTML5、移動(dòng)端等主流技術(shù)整合高校信息門戶,構(gòu)建高校移動(dòng)網(wǎng)絡(luò)文化平臺(tái),提供一鍵移動(dòng)搜索引擎校園、一掌移動(dòng)校園文化體驗(yàn)。其次,項(xiàng)目將充分利用超鏈接技術(shù)、關(guān)鍵詞技術(shù)來(lái)設(shè)計(jì)開(kāi)發(fā)移動(dòng)校園搜索引擎。網(wǎng)絡(luò)育人、維系學(xué)生終身與大學(xué)校園文化這條紐帶、最關(guān)心本科生等情感目標(biāo)的移動(dòng)校園文化,使用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)需要過(guò)程的定義,尤其是在師范院校,如預(yù)測(cè)校園突發(fā)事件的發(fā)生、識(shí)別等。

(2)“一鍵搜索引擎校園,一云多終端”體驗(yàn);整合校園信息門戶數(shù)據(jù),依托計(jì)算機(jī)領(lǐng)域主流技術(shù)提供一站式搜索引擎校園服務(wù)。一云多終端校園搜索引擎讓校園信息門戶無(wú)處不在、觸手可及,校園移動(dòng)文化空間和校園門戶的信息傳播相輔相成,讓信息門戶和校園移動(dòng)文化空間深度融合、相互共生。

(3)豐富的校園網(wǎng)絡(luò)資源;校園網(wǎng)絡(luò)有豐富的硬件資源、軟件資源,尤其是項(xiàng)目可以依靠云南師范大學(xué)的云計(jì)算平臺(tái),可以利用這樣的軟硬件環(huán)境實(shí)現(xiàn)高性能計(jì)算以及處理高并發(fā)量。同時(shí),由于各種服務(wù)器資源均在校園網(wǎng)內(nèi),校園內(nèi)網(wǎng)不需要依賴Internet,保證了高速的網(wǎng)絡(luò)體驗(yàn)。

(4)集群門戶的移動(dòng)校園搜索引擎信息服務(wù)模型;模型結(jié)合了主題爬蟲(chóng)技術(shù)、個(gè)性化推薦算法等對(duì)校園網(wǎng)絡(luò)信息門戶進(jìn)行加工,為校園用戶提供個(gè)性化的信息服務(wù)。

4 關(guān)鍵技術(shù)

移動(dòng)校園搜索引擎系統(tǒng)技術(shù)路線如圖5所示。

圖5 移動(dòng)校園搜索引擎技術(shù)路線

系統(tǒng)涉及學(xué)生、統(tǒng)一信息門戶、高校信息門戶群、校園網(wǎng)絡(luò)文化移動(dòng)空間。系統(tǒng)是從零平臺(tái)到構(gòu)建平臺(tái),從無(wú)數(shù)據(jù)源到構(gòu)建數(shù)據(jù)源,從抽象的“最關(guān)心本科生”、移動(dòng)校園網(wǎng)絡(luò)文化、輿情引導(dǎo)等抽象概念到業(yè)務(wù)、邏輯、技術(shù)、融合的實(shí)現(xiàn),從基礎(chǔ)統(tǒng)計(jì)到深度算法挖掘,從門戶和文化空間的無(wú)關(guān)聯(lián)到相互映襯,從線下文化到線上文化的隱形挖掘再到校園網(wǎng)絡(luò)文化繁榮的過(guò)程。

4.1 前端實(shí)現(xiàn)過(guò)程及技術(shù)

文中主要應(yīng)用了移動(dòng)端Webkit、服務(wù)端數(shù)據(jù)采集存儲(chǔ)、計(jì)算機(jī)網(wǎng)絡(luò)等技術(shù)。移動(dòng)的應(yīng)用程序如瀏覽器、個(gè)性化應(yīng)用主要依靠Webview,Webview的引擎是Webkit,Webkit是蘋果發(fā)起的一個(gè)開(kāi)源項(xiàng)目,還對(duì)HTML5提供支持。

4.2 Webkit的渲染過(guò)程

HTML在移動(dòng)端表示的過(guò)程是Webkit的網(wǎng)頁(yè)渲染過(guò)程,第一階段是從URL到構(gòu)建完DOM樹(shù),第二階段是DOM樹(shù)到構(gòu)建完Webkit的繪圖上下文,第三個(gè)階段是從繪圖上下文到最終生成的圖像,具體為:將網(wǎng)頁(yè)內(nèi)容,送到HTML解釋器。HTML解釋器在解釋它后形成DOM樹(shù),中間如果遇到JavaScript代碼則交給JavaScript引擎去處理。如果頁(yè)面包含CSS,則交給CSS解釋器去解析。當(dāng)DOM建立的時(shí)候,接受來(lái)自CSS解釋的樣式信息,構(gòu)建一個(gè)新的內(nèi)部繪圖模型。該模型由布局模塊計(jì)算模型內(nèi)部的各個(gè)元素的位置和大小信息,最后由繪圖模塊完成從該模型到圖像的繪制。

在網(wǎng)頁(yè)內(nèi)容的下載中,需要使用到網(wǎng)絡(luò)和存儲(chǔ)。計(jì)算布局和繪圖的時(shí)候,需要使用2D/3D的圖形模塊,同時(shí)因?yàn)橐勺詈蟮目梢暬Y(jié)果,這時(shí)候需要開(kāi)始解碼音頻、視頻和圖片,同其他內(nèi)容一起繪制到最后的圖像中。

4.3 規(guī)則爬蟲(chóng)數(shù)據(jù)采集

(1)設(shè)定規(guī)則:現(xiàn)有桌面網(wǎng)頁(yè)均是很有規(guī)律的頁(yè)面,而且除了具有動(dòng)態(tài)信息外相對(duì)固定,根據(jù)現(xiàn)有桌面網(wǎng)頁(yè)特點(diǎn)設(shè)置網(wǎng)頁(yè)采集規(guī)則,如使用正則表達(dá)式獲取各種標(biāo)簽,超鏈接、標(biāo)題等,往往呈現(xiàn)大類下面具有小類,小類下面才有標(biāo)題,標(biāo)題通過(guò)超鏈接得到網(wǎng)址,每一個(gè)階段都可能需要正則表達(dá)式等的支持,才能獲取到所需要的內(nèi)容;

我一個(gè)很好的同事經(jīng)常和我抱怨類似的事情,他是一個(gè)對(duì)熟悉的人很隨和的人,但是卻很容易與其他專業(yè)的人員發(fā)生矛盾。在一次他在電話中的激烈爭(zhēng)吵后,我問(wèn)其原因,他說(shuō),是由于對(duì)方人員提供的設(shè)計(jì)資料不夠規(guī)范,雖然資料已經(jīng)進(jìn)行多次修改,但是還是沒(méi)有符合要求,于是對(duì)方人員誤以為是我方進(jìn)行故意刁難,所以發(fā)生了激烈的爭(zhēng)吵。

(2)采集數(shù)據(jù):根據(jù)設(shè)定好的規(guī)則采集滿足規(guī)則的數(shù)據(jù);

(3)產(chǎn)生數(shù)據(jù)源:將采集到的數(shù)據(jù)進(jìn)行存儲(chǔ)以便移動(dòng)端數(shù)據(jù)請(qǐng)求需要,或者為了節(jié)省數(shù)據(jù)庫(kù)資源,不再對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)庫(kù)存儲(chǔ),和對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)相比較,直接提供數(shù)據(jù)源可以根據(jù)每一次移動(dòng)端的需求啟動(dòng)采集程序獲取相應(yīng)數(shù)據(jù);

(4)移動(dòng)端請(qǐng)求數(shù)據(jù):移動(dòng)端根據(jù)用戶具體點(diǎn)擊的模塊,向數(shù)據(jù)源獲取所需要的數(shù)據(jù),并對(duì)數(shù)據(jù)使用相應(yīng)空間給以呈現(xiàn);

(5)自適應(yīng)頁(yè)面布局,在保證能夠抓取到信息詳情關(guān)鍵內(nèi)容及其HTML標(biāo)簽的同時(shí),由于捕獲的內(nèi)容中如圖片是適合PC端呈現(xiàn)的,但是在移動(dòng)端還是不能自適應(yīng),在采集到的數(shù)據(jù)里面添加自適應(yīng)標(biāo)識(shí),如使用CSS進(jìn)行圖片的自適應(yīng)代碼。

5 移動(dòng)校園搜索引擎原型系統(tǒng)

隨著終端技術(shù)的不斷發(fā)展,通用自適應(yīng)信息門戶采集及展示系統(tǒng)可以用于現(xiàn)有的、不具有自適應(yīng)功能的信息門戶等,為“一云多終端”信息展示提供解決思路。根據(jù)門戶信息等的特點(diǎn),設(shè)定采集規(guī)則,存儲(chǔ)具有自適應(yīng)多終端元素的門戶信息,提供數(shù)據(jù)源接口、微信和本地App等的展示,移動(dòng)校園搜索引擎原型系統(tǒng)以云南師范大學(xué)信息管理處門戶網(wǎng)站為例。移動(dòng)校園搜索引擎原型系統(tǒng)功能包括:

(1)云南師范大學(xué)信息管理處門戶信息自適應(yīng)采集:根據(jù)門戶網(wǎng)頁(yè)設(shè)定規(guī)則采集自適應(yīng)的門戶信息;

(2)云南師范大學(xué)信息管理處門戶信息存儲(chǔ):設(shè)計(jì)數(shù)據(jù)庫(kù)結(jié)構(gòu)對(duì)采集到的門戶自適應(yīng)信息進(jìn)行存儲(chǔ);

(3)云南師范大學(xué)信息管理處門戶信息展示:①基于Android的本地App門戶展示;②基于微信的門戶信息展示。

移動(dòng)校園搜索引擎原型系統(tǒng)技術(shù)特點(diǎn):

(1)采用混合開(kāi)發(fā)模式,其中包括基于Android本地應(yīng)用、微信等的移動(dòng)端展示,以及數(shù)據(jù)采集的C/S數(shù)據(jù)源服務(wù)端;

(2)具有“一云多終端”特點(diǎn)?;诜?wù)端采集的一個(gè)自適應(yīng)數(shù)據(jù)源可以為主流平臺(tái)Android、微信等提供數(shù)據(jù)準(zhǔn)備,避免了普通網(wǎng)頁(yè)在移動(dòng)端呈現(xiàn)混亂的情形;

(3)通用性。系統(tǒng)具有普適性,其他具體應(yīng)用可以更改采集規(guī)則、數(shù)據(jù)表結(jié)構(gòu)等進(jìn)行套用。

編程語(yǔ)言及其版本號(hào):Java7、Android 4.0、Mysql 5.6.24、Php 5.3.29。

5.1 網(wǎng)站采集界面

界面在運(yùn)行過(guò)程中,以Loading作為提示,同時(shí),日志窗口抓取運(yùn)行產(chǎn)生的結(jié)果,客戶端啟動(dòng)后,每隔設(shè)定好的時(shí)間間隔重復(fù)運(yùn)行過(guò)程。采集運(yùn)行界面如圖6所示,下一次運(yùn)行開(kāi)始時(shí)的采集完成或間隔界面如圖7所示。

圖6 采集運(yùn)行界面

圖7 采集完成或間隔界面

5.2 Android端、微信端效果圖

基于Android的移動(dòng)端呈現(xiàn)網(wǎng)站導(dǎo)航欄目標(biāo)題信息主界面、基于Android的移動(dòng)端對(duì)某條消息詳情呈現(xiàn)界面效果良好。微信端訪問(wèn)接口界面、門戶主目錄、詳情界面、目錄下內(nèi)容標(biāo)題列表界面如圖8和圖9所示。

圖8 門戶目錄

圖9 目錄下內(nèi)容標(biāo)題列表

6 結(jié)束語(yǔ)

系統(tǒng)采用自適應(yīng)網(wǎng)頁(yè)設(shè)計(jì)、HTML5、移動(dòng)端(Android、IOS等)、第三方如微信等主流應(yīng)用或技術(shù),以云南師范大學(xué)校園網(wǎng)絡(luò)信息門戶為對(duì)象,使用自行設(shè)計(jì)的規(guī)則爬蟲(chóng),基于高性能、多并發(fā)的云計(jì)算平臺(tái)提供應(yīng)用服務(wù)和存儲(chǔ)服務(wù)支持, 獲取到的數(shù)據(jù)為挖掘構(gòu)建移動(dòng)校園文化的計(jì)算機(jī)實(shí)現(xiàn)提供保障,而且項(xiàng)目系統(tǒng)模型構(gòu)建與設(shè)計(jì)在前期工作中已經(jīng)通過(guò)幾個(gè)門戶測(cè)試證明可行。同時(shí),移動(dòng)校園文化與現(xiàn)有信息平臺(tái)高度融合并服務(wù)于輿情監(jiān)測(cè)與控制、網(wǎng)絡(luò)行為預(yù)測(cè)具有相關(guān)理論支撐。做好上線運(yùn)維工作,并在此過(guò)程中繼續(xù)挖掘構(gòu)建移動(dòng)校園網(wǎng)絡(luò)文化的業(yè)務(wù),對(duì)平臺(tái)進(jìn)行網(wǎng)絡(luò)推廣,為進(jìn)一步豐富移動(dòng)校園文化奠定基礎(chǔ)。研讀個(gè)性化推薦算法,獲取適合移動(dòng)校園搜索引擎?zhèn)€性化信息服務(wù),利用實(shí)驗(yàn)法選擇預(yù)先設(shè)定的主題爬取門戶資源,實(shí)現(xiàn)個(gè)性化相關(guān)模型如用戶模型等,挖掘用戶偏好,接受統(tǒng)一資源的集中個(gè)性化服務(wù)。實(shí)際對(duì)接校園網(wǎng)絡(luò)門戶信息資源數(shù)據(jù),實(shí)測(cè)原型系統(tǒng)的信息資源爬取以及個(gè)性化信息服務(wù)是下一步的研究方向。

猜你喜歡
門戶搜索引擎網(wǎng)頁(yè)
關(guān)隘:要道門戶
散文(2022年6期)2022-07-28 01:37:58
西域門戶——兩關(guān)遺址
基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
電子制作(2018年10期)2018-08-04 03:24:38
基于內(nèi)外網(wǎng)門戶系統(tǒng)的研究
電子制作(2018年10期)2018-08-04 03:24:34
基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
電子制作(2017年2期)2017-05-17 03:54:56
網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
10個(gè)必知的網(wǎng)頁(yè)設(shè)計(jì)術(shù)語(yǔ)
廣告主與搜索引擎的雙向博弈分析
毕节市| 达拉特旗| 黔东| 沂源县| 平昌县| 拜泉县| 定日县| 普定县| 休宁县| 马公市| 平和县| 会泽县| 梅河口市| 阿合奇县| 海门市| 赤壁市| 文山县| 兰州市| 肃宁县| 黄浦区| 钟祥市| 桂平市| 乐山市| 娄底市| 广水市| 无锡市| 正宁县| 轮台县| 安新县| 日土县| 通许县| 浮山县| 普格县| 开化县| 筠连县| 江源县| 桦川县| 武胜县| 凌源市| 海盐县| 吉林市|