劉紅英
(廣州工商學(xué)院,廣州 510850)
微電子技術(shù)不斷提高的背景下,微機(jī)械傳感器也取得了較為優(yōu)秀的成果。目前微機(jī)械傳感器被深入研究,截止到目前,微機(jī)械傳感器的類型大致分為七種,分別為微機(jī)械陀螺、微氣體傳感器、微機(jī)械溫度傳感器、微機(jī)械壓力傳感器、微加速度傳感器、微流量傳感器和其他微機(jī)械傳感器[1]。這些傳感器被廣泛應(yīng)用到化學(xué)以及醫(yī)學(xué)等行業(yè)當(dāng)中,通過應(yīng)用到材料、設(shè)備等環(huán)節(jié)上,優(yōu)化數(shù)據(jù)傳輸與技術(shù)控制效果,具有極大的應(yīng)用前景。為了進(jìn)一步掌握微機(jī)械傳感器的應(yīng)用方法,針對微機(jī)械傳感器提出不同的個(gè)性化推薦算法[2]。這些現(xiàn)有的推薦算法被應(yīng)用到各大網(wǎng)絡(luò)以及設(shè)備中,盡管能夠取得一定成果,但在及時(shí)性上還不夠完善,需要進(jìn)一步優(yōu)化。云模式是將云計(jì)算與搜索引擎結(jié)合使用的新技術(shù),具有一站式解決問題的綜合能力,針對云模式的特點(diǎn)研究全新的微機(jī)械傳感器個(gè)性化推薦算法。
標(biāo)準(zhǔn)的特征項(xiàng)標(biāo)簽?zāi)軌蛞愿尤娴姆绞奖磉_(dá)傳遞信息,能夠讓無線傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)之間快速識(shí)別,建立不同關(guān)聯(lián)度的鄰居關(guān)系。當(dāng)微機(jī)械傳感器傳輸穩(wěn)定的數(shù)據(jù),也就是常規(guī)內(nèi)容的數(shù)據(jù)時(shí),設(shè)置常規(guī)內(nèi)容與其對應(yīng)的權(quán)重分別為xi和ωi,采用信息加權(quán)技術(shù)TF-IDF,衡量傳感器中數(shù)據(jù)的重要程度。其中TF用于描述詞頻,該數(shù)值越大越能說明內(nèi)容出現(xiàn)的次數(shù)越多,有較高的重要性;IDF用于描述反文檔頻率,也就是出現(xiàn)次數(shù)較少導(dǎo)致詞頻較低的內(nèi)容。通過上述分析過程,將標(biāo)簽與TF-IDF方法融合,計(jì)算公式為:
式中:fij表示信息加權(quán)函數(shù);M表示總文檔數(shù);mi表示出現(xiàn)特征xi的文檔數(shù);Wj表示文本。設(shè)置某一特征項(xiàng)信息的標(biāo)簽為xj,根據(jù)上述公式融合特征項(xiàng)標(biāo)簽,得到對應(yīng)的權(quán)重為:
式中:xfij代表標(biāo)簽xj被使用的次數(shù);M表示總數(shù)據(jù)量;m表示觸發(fā)過標(biāo)簽的數(shù)據(jù)量;Wi表示標(biāo)簽集合。標(biāo)簽的權(quán)重取值范圍在[0,1]內(nèi),當(dāng)標(biāo)簽被頻繁觸發(fā),說明傳感器傳輸過大量同類內(nèi)容,對于該標(biāo)簽下的數(shù)據(jù)相當(dāng)熟悉。但在整個(gè)網(wǎng)絡(luò)大環(huán)境中,傳感器還會(huì)面對即時(shí)性的信息,此類信息傳感器接觸的相對較少,甚至有的沒有接觸過,那么無線傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn),對于此類數(shù)據(jù)沒有對應(yīng)的鄰居關(guān)系,無法接收鄰居消息,增大鄰居發(fā)現(xiàn)延遲,所以針對即時(shí)數(shù)據(jù)也需要計(jì)算對應(yīng)的權(quán)重,加快對所有節(jié)點(diǎn)的喚醒速度,快速建立鄰居關(guān)系從而減少推薦延遲[3]。根據(jù)傳感器產(chǎn)生的瀏覽行為,針對收藏頁面、保存頁面、打印頁面、停留時(shí)間四項(xiàng)內(nèi)容建立行為函數(shù),公式為:
公式中:p表示傳感器接觸過的網(wǎng)絡(luò)頁面;其他函數(shù)與上述四項(xiàng)內(nèi)容按順序一一對應(yīng)。當(dāng)這些函數(shù)的值為0時(shí),說明沒有對該頁面執(zhí)行數(shù)據(jù)記錄,反之則記錄了該頁面的數(shù)據(jù)。結(jié)合以上公式,得到特征項(xiàng)xj的權(quán)重為:
公式中:P表示包含特征項(xiàng)xj的頁面集合。將權(quán)重標(biāo)簽的大小控制在[0,1]內(nèi),歸一化處理后的特征項(xiàng)標(biāo)簽對應(yīng)的權(quán)重為:
公式中:X表示特征項(xiàng)的集合。通過上述方法對穩(wěn)定性數(shù)據(jù)與即時(shí)性數(shù)據(jù)建立標(biāo)簽,讓傳感器通信范圍內(nèi)的節(jié)點(diǎn)間快速建立鄰居關(guān)系,從而為個(gè)性化推薦提供更大的主動(dòng)性。
無線傳感器網(wǎng)絡(luò)執(zhí)行龐大的數(shù)據(jù)傳輸工作,盡管設(shè)置了不同的特征項(xiàng)標(biāo)簽,也還是會(huì)影響節(jié)點(diǎn)之間建立鄰居關(guān)系的速度,利用云計(jì)算模式融合同屬性標(biāo)簽并實(shí)時(shí)更新。已知云數(shù)據(jù)信息交互過程中,每一個(gè)簇頭節(jié)點(diǎn)具備初始數(shù)據(jù)感知能力,根據(jù)標(biāo)簽實(shí)施分派,而后通過數(shù)據(jù)采集、相鄰節(jié)點(diǎn)身份認(rèn)證、多通道通信等步驟實(shí)現(xiàn)數(shù)據(jù)的傳輸工作。假設(shè)簇頭節(jié)點(diǎn)的信息導(dǎo)碼通過下列公式獲得:
公式中:K表示簇頭總數(shù);sat表示階段函數(shù);S(ω)表示權(quán)重為ω的Sink節(jié)點(diǎn);α表示鄰居標(biāo)簽的特征相似度;η表示信息流特征;g1、g2分別表示穩(wěn)定和即時(shí)數(shù)據(jù)數(shù)量。假設(shè)定量論域是精準(zhǔn)的,則任意一個(gè)連通的云數(shù)據(jù)可通過G=(V,E,S)描述,其中V表示全部節(jié)點(diǎn)的總和;E表示期望、熵等參數(shù)的全局定義;S表示Sink節(jié)點(diǎn)[4]。整合云數(shù)據(jù)特征項(xiàng),通過提取云數(shù)據(jù)的熵融合特征、分區(qū)預(yù)處理熵融合特征,實(shí)現(xiàn)云計(jì)算模式對海量標(biāo)簽的融合。定義信息數(shù)據(jù)節(jié)點(diǎn)的信息為(ai,bi),以空間采樣分簇重構(gòu)的方式得到X的空間結(jié)構(gòu),式為:
按照間隔粒度劃分空間結(jié)構(gòu),針對分區(qū)特征集提取同一類節(jié)點(diǎn)的信息熵,式為:
通過上述公式得到信息熵,實(shí)現(xiàn)對標(biāo)簽的融合。同樣根據(jù)空間結(jié)構(gòu)對特征進(jìn)行混合匹配,從而達(dá)到實(shí)時(shí)更顯標(biāo)簽的目的。云計(jì)算模式構(gòu)建的簇頭相異粒度數(shù)據(jù)矩陣為:
綜合云自身的特殊性以及數(shù)據(jù)的相似性,以模糊計(jì)算為原則,設(shè)置標(biāo)簽匹配模式,實(shí)時(shí)更新標(biāo)簽,幫助鄰居節(jié)點(diǎn)之間快速識(shí)別與關(guān)聯(lián)。式為:
通過上述融合與匹配過程,實(shí)時(shí)更新特征項(xiàng)標(biāo)簽,加快節(jié)點(diǎn)之間建立關(guān)聯(lián),強(qiáng)化對節(jié)點(diǎn)的喚醒操作。
在獲得實(shí)時(shí)標(biāo)簽的基礎(chǔ)上,利用聚類技術(shù)按照位置的遠(yuǎn)近處理標(biāo)簽,將位置近的標(biāo)簽和位置遠(yuǎn)的標(biāo)簽劃分到不同的簇中,這樣在個(gè)性化推薦過程中能縮減項(xiàng)目搜索范圍,在考慮時(shí)序性的條件下,能改進(jìn)算法的推薦效率。聚類過程如圖1所示。
圖1 聚類流程
根據(jù)實(shí)時(shí)標(biāo)簽的聚類結(jié)果,將BP模型與RNN模型融合使用,解決個(gè)性化推薦過程中產(chǎn)生的時(shí)間序列問題。假設(shè)用戶行為在短期內(nèi)發(fā)生頻繁變化,此時(shí)的特征項(xiàng)標(biāo)簽也隨之改變,利用反向傳播算法(BP)在接收輸入數(shù)據(jù)與產(chǎn)生輸出數(shù)據(jù)之間,根據(jù)一定程度的誤差反向傳播,更新網(wǎng)絡(luò)內(nèi)部的各種參數(shù),該誤差值為:
公式中:J表示損失函數(shù),用來描述誤差;R表示隱藏層;c表示神經(jīng)元的偏置。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)具有可多次交互數(shù)據(jù)的能力,可以根據(jù)交互次數(shù)設(shè)置網(wǎng)絡(luò)空間層次,每一空間層代表一次交互過程。將二者融合使用,建立混合推薦模型。已知網(wǎng)絡(luò)的輸入是實(shí)際值,輸出是預(yù)測值,輸入向量的長度等于項(xiàng)目總數(shù),所以讓BP與RNN分享相同的輸出層,合并輸出層后產(chǎn)生單一結(jié)果。則存在:
式中:b(J)i、b(J)0i分別表示合并輸出層和隨機(jī)輸出層的產(chǎn)出結(jié)果[5]。假設(shè)RNN的單元數(shù)為E,則傳感器推薦某一內(nèi)容的概率為:
上述公式無需手動(dòng)操作,而是通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練實(shí)現(xiàn),通過網(wǎng)絡(luò)層對數(shù)據(jù)的不斷采集、更新、匹配,實(shí)現(xiàn)微機(jī)械傳感器的個(gè)性化推薦工作。
本次測試選用的設(shè)備配置Intel Pentium 4處理器,操作系統(tǒng)為Windows XP,包括200G硬盤和4G內(nèi)存。利用Java語言模擬實(shí)現(xiàn),將帶有微機(jī)械傳感器的設(shè)備與互聯(lián)網(wǎng)平臺(tái)之間建立連接,檢查網(wǎng)絡(luò)是否穩(wěn)定。利用SimPy設(shè)計(jì)一個(gè)針對離散事件的仿真框架,該軟件以生成器為基礎(chǔ)模擬實(shí)體,也就是將微機(jī)械傳感器的節(jié)點(diǎn)看作生成器,仿真?zhèn)€性化推薦操作。
根據(jù)推薦質(zhì)量評價(jià)結(jié)果,判斷本文算法是否具有實(shí)用性;根據(jù)響應(yīng)時(shí)間評價(jià)結(jié)果,判斷本文算法是否在短時(shí)間內(nèi)能喚醒網(wǎng)絡(luò)通信節(jié)點(diǎn);根據(jù)平均發(fā)現(xiàn)延遲評價(jià)結(jié)果,判斷本文算法是否能夠快速建立鄰居關(guān)系;根據(jù)節(jié)點(diǎn)能耗評價(jià)結(jié)果,判斷本文算法是否能夠主動(dòng)喚醒更多節(jié)點(diǎn),將額外能量開銷降至最低。推薦質(zhì)量的評價(jià)將平均絕對偏差MAE作為衡量指標(biāo),所得的值越小越能說明算法具有較高的推薦質(zhì)量。該值的計(jì)算公式為:
式中:Ai、Bi分別表示用戶評分的預(yù)測集合和實(shí)際集合。響應(yīng)時(shí)間用RT表示,也就是目標(biāo)發(fā)出推薦請求與傳感器產(chǎn)生推薦的時(shí)刻差值,計(jì)算式為:
式中:t1表示發(fā)出推薦請求的時(shí)刻;t2表示產(chǎn)生推薦結(jié)果的時(shí)刻。平均發(fā)現(xiàn)延遲用RTT表示,計(jì)算公式如下:
式中:t0、t3表示客戶端的發(fā)包與收包時(shí)間;t1、t2表示節(jié)點(diǎn)的發(fā)包與收包時(shí)間。設(shè)置每個(gè)節(jié)點(diǎn)平均能耗為E,則式為:
公式中:k為常數(shù);d表示一跳的距離;i表示節(jié)點(diǎn)數(shù),且i>2。測試設(shè)置2個(gè)對照組,分別為協(xié)同推薦算法和混合推薦算法。以對比測試的方法比較三組方法在四組指標(biāo)上的評價(jià)差異,根據(jù)測試結(jié)果比較不同算法的性能。
本文方法根據(jù)推薦者、被推薦者和推薦目標(biāo)三項(xiàng)參數(shù),在特征項(xiàng)標(biāo)簽的基礎(chǔ)上,利用云計(jì)算模式融合與實(shí)時(shí)更新標(biāo)簽,如圖2所示。
圖2 云模式的應(yīng)用
在融合同類型標(biāo)簽的基礎(chǔ)上,通過實(shí)時(shí)更新標(biāo)簽獲取實(shí)時(shí)數(shù)據(jù),保證標(biāo)簽都是不重疊的。本文研究的算法在此基礎(chǔ)上推薦個(gè)性化數(shù)據(jù)。
2.4.1 推薦質(zhì)量測試
將本文算法與兩組傳統(tǒng)算法分別應(yīng)用到同一型號(hào)的設(shè)備中,已知設(shè)備的微機(jī)械傳感器型號(hào)相同。利用該設(shè)備查詢信息,利用式(14)評價(jià)三組算法的推薦質(zhì)量,結(jié)果如圖3所示。
圖3 推薦質(zhì)量測試結(jié)果
根據(jù)上圖顯示的結(jié)果可知,三組方法的平均絕對偏差MAE均處于0.5以下,但本文算法的評價(jià)結(jié)果比兩組算法分別低了0.21和0.19,說明本文算法的個(gè)性化推薦質(zhì)量更高。
2.4.2 響應(yīng)時(shí)間測試
根據(jù)式(15)計(jì)算三組算法的響應(yīng)時(shí)間,結(jié)果如圖4所示。
圖4 響應(yīng)時(shí)間測試結(jié)果
根據(jù)圖4顯示的結(jié)果可知,本文算法的響應(yīng)時(shí)間RT最短,面對500個(gè)通信網(wǎng)絡(luò)節(jié)點(diǎn)時(shí),平均響應(yīng)時(shí)間比協(xié)同推薦算法和混合推薦算法分別減少了24.1s和19.8s,說明本文算法在短時(shí)間內(nèi),能快速喚醒更多傳感器網(wǎng)絡(luò)通信節(jié)點(diǎn)。
2.4.3 延遲對比
已知傳感器網(wǎng)絡(luò)的能量有限,通常情況下的網(wǎng)絡(luò)節(jié)點(diǎn)會(huì)隨時(shí)進(jìn)入睡眠狀態(tài),比較三組算法的平均發(fā)現(xiàn)延遲,根據(jù)式(16)得到的結(jié)果,繪制圖5所示的實(shí)驗(yàn)結(jié)果。
圖5 平均延遲測試結(jié)果
根據(jù)上述評價(jià)結(jié)果可知,在同樣的測試條件下,隨著節(jié)點(diǎn)數(shù)量的增加,本文算法的平均發(fā)現(xiàn)延遲RTT穩(wěn)定在31~33s之間,協(xié)同推薦算法和混合推薦算法的平均發(fā)現(xiàn)延遲,分別在31~38s和31~40s之間,說明本文算法在快速響應(yīng)的基礎(chǔ)上,將通信節(jié)點(diǎn)之間迅速建立鄰居關(guān)系,能夠以最快速度進(jìn)入到工作狀態(tài)。
2.4.4 能耗對比
利用式(17)評價(jià)節(jié)點(diǎn)能耗并繪制實(shí)驗(yàn)圖,如圖6所示。
圖6 節(jié)點(diǎn)能耗測試結(jié)果
根據(jù)圖6顯示的評價(jià)結(jié)果可知,面對越來越多的節(jié)點(diǎn)數(shù)目,本文算法能夠?qū)⒐?jié)點(diǎn)能耗E始終控制在2.0×103以下,而協(xié)同推薦算法和混合推薦算法的節(jié)點(diǎn)能耗,隨著節(jié)點(diǎn)數(shù)目的增加而逐漸增多,說明本文方法能夠用最小的能耗喚醒更多的節(jié)點(diǎn),將額外能量開銷降至最低。
隨著互聯(lián)網(wǎng)、互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)資源變得更加復(fù)雜、多樣,如何從海量的數(shù)據(jù)中快速獲取目標(biāo)信息,滿足不同使用用戶的需求,是現(xiàn)階段研究的重點(diǎn)問題。面對信息過載這一現(xiàn)狀,本文算法以推薦的及時(shí)性為研究目標(biāo),利用更多智能技術(shù)實(shí)現(xiàn)了對現(xiàn)有推薦算法的優(yōu)化。但此次研究還存在不足,這種算法的及時(shí)性能得到提升,但對于推薦數(shù)據(jù)的準(zhǔn)確性還有待驗(yàn)證。今后在時(shí)間充沛的情況下,可以評價(jià)推薦內(nèi)容的準(zhǔn)確性,完善該算法的其他性能。