王培培
(河北大學(xué)管理學(xué)院 河北保定 071002)
基于協(xié)同過濾算法的農(nóng)業(yè)信息服務(wù)個(gè)性化推薦研究
王培培
(河北大學(xué)管理學(xué)院 河北保定 071002)
為解決農(nóng)業(yè)信息服務(wù)中農(nóng)戶查找所需信息困難,信息服務(wù)平臺(tái)實(shí)用性信息缺乏等問題,文章提出了農(nóng)業(yè)信息個(gè)性化推薦的必要性,并且以農(nóng)業(yè)信息服務(wù)系統(tǒng)中的地域分塊推薦為例引入個(gè)性化推薦算法中的協(xié)同過濾推薦算法,以期能夠在農(nóng)業(yè)信息服務(wù)系統(tǒng)中實(shí)現(xiàn)個(gè)性化推薦,解決農(nóng)業(yè)信息服務(wù)中存在的問題。
農(nóng)業(yè)信息服務(wù) 個(gè)性化推薦 協(xié)同過濾算法
我國(guó)的農(nóng)業(yè)信息服務(wù)基礎(chǔ)設(shè)施建設(shè)已經(jīng)取得很大進(jìn)展,農(nóng)業(yè)科技成果也不少,但真正用于生產(chǎn),產(chǎn)生實(shí)際農(nóng)業(yè)經(jīng)濟(jì)效益的科技成果應(yīng)用卻不多,特別是在信息利用方面還存在不少制約著農(nóng)業(yè)收益的問題。比如農(nóng)民實(shí)際應(yīng)用信息不多,信息供給不能滿足當(dāng)?shù)剞r(nóng)民實(shí)際生產(chǎn)需求等。主要原因就是面對(duì)海量的農(nóng)業(yè)信息供給,用戶找不到針對(duì)自己種植作物的相關(guān)方面信息,而且農(nóng)業(yè)生產(chǎn)有明顯的地域性,季節(jié)性特征,這就使得農(nóng)業(yè)信息服務(wù)的水平有待提高。個(gè)性化推薦是主動(dòng)型信息推送服務(wù),能夠根據(jù)用戶需求推薦用戶感興趣的相關(guān)信息,使得農(nóng)業(yè)信息服務(wù)這一環(huán)節(jié)做的更加到位,從而加強(qiáng)用戶信息利用的效用,增加農(nóng)業(yè)收益[1]。
1.服務(wù)對(duì)象復(fù)雜
農(nóng)業(yè)信息服務(wù)的受眾文化水平參差不齊,一般農(nóng)民的知識(shí)水平都比較低,個(gè)性化農(nóng)業(yè)信息推送技術(shù)不要求農(nóng)業(yè)從業(yè)人員具備專業(yè)的背景知識(shí)和檢索技能,易于被用戶接受,使得廣大農(nóng)民朋友足不出戶就能享受到優(yōu)質(zhì)的農(nóng)業(yè)信息服務(wù)。
2.信息傳播渠道單一
個(gè)性化推薦是實(shí)行信息推送的主動(dòng)信息服務(wù),可以有效緩解文化素質(zhì)較低的農(nóng)民用戶獲取信息方式單一的問題,這也要求推送服務(wù)要構(gòu)建出傳播方式靈活的多種傳播渠道。
3.針對(duì)性不足
農(nóng)業(yè)生產(chǎn)門類眾多,地域性,季節(jié)性特征明顯,一般的農(nóng)業(yè)信息服務(wù)系統(tǒng)的針對(duì)性較差,滿足個(gè)性化程度不高,這就要求我們加強(qiáng)農(nóng)業(yè)信息的個(gè)性化推薦服務(wù)應(yīng)用[2]。
1.地域分塊推薦
依據(jù)農(nóng)業(yè)地域性特點(diǎn),中國(guó)種植業(yè)區(qū)可劃分為:(1)東北大豆、玉米、甜菜區(qū);(2)北部高原小雜糧、甜菜區(qū);(3)黃淮海棉、油、煙、果區(qū)等10個(gè)一級(jí)區(qū)[3]。各個(gè)種植區(qū)由于作物結(jié)構(gòu)不同,對(duì)信息的需求類型也將有所不同,如圖所示,農(nóng)業(yè)信息服務(wù)個(gè)性化推薦可以依據(jù)用戶所在位置確定用戶屬于哪個(gè)種植區(qū),從而推斷用戶對(duì)哪幾種作物的種植信息比較感興趣,從而縮小備選推薦信息的范圍,提高針對(duì)性,在此基礎(chǔ)上,再根據(jù)同一種植區(qū)域內(nèi)的用戶興趣大致相似特點(diǎn),在備選推薦信息基礎(chǔ)上進(jìn)一步縮小推薦信息范圍,把推薦信息限定在用戶感興趣的信息范圍內(nèi),這一過程可以通過協(xié)同過濾推薦算法實(shí)現(xiàn)。
2.協(xié)同過濾推薦算法
協(xié)同過濾推薦與傳統(tǒng)的基于內(nèi)容過濾的推薦不同,它是在用戶群中尋找目標(biāo)用戶的最近鄰居,然后根據(jù)最近鄰居對(duì)某一信息的評(píng)價(jià)或?yàn)g覽記錄,來預(yù)測(cè)目標(biāo)用戶對(duì)某一信息的喜好程度,從而為目標(biāo)用戶推薦信息[4]。協(xié)同過濾算法分為基于用戶的協(xié)同過濾、基于項(xiàng)目的協(xié)同過濾、基于模型的協(xié)同過濾。
在農(nóng)業(yè)信息按地域分塊推送的情況下,事先系統(tǒng)就已經(jīng)把用戶分成了很多興趣不同的模型, 所以只要在模型的基礎(chǔ)上進(jìn)一步縮小推薦信息的范圍, 把推薦給用戶的信息準(zhǔn)確地限定在用戶感興趣的信息范圍內(nèi)就可以了, 所以本文在這里主要介紹的是基于用戶的協(xié)同過濾推薦算法。基于用戶的協(xié)同過濾推薦算法是通過比較目標(biāo)用戶的一系列行為選擇和其他用戶之間的相似性,來識(shí)別出一組相互具有相似興趣偏好的用戶——最近鄰居,一旦系統(tǒng)識(shí)別出目標(biāo)用戶的最近鄰居,就將最近鄰居感興趣的信息推薦給當(dāng)前目標(biāo)用戶,在信息服務(wù)推薦系統(tǒng)中應(yīng)用的基本思想就是:使用與新用戶a相似的用戶a”對(duì)一個(gè)對(duì)象s的評(píng)價(jià)來預(yù)測(cè)s對(duì)新用戶a的效用,進(jìn)而判斷是否推薦s給a。主要有三個(gè)步驟:
一是建立用戶-項(xiàng)目評(píng)分矩陣,將用戶對(duì)項(xiàng)目的評(píng)分表示成m*n的矩陣r,m代表用戶數(shù)量,n代表項(xiàng)目數(shù)量,rij代表第i個(gè)用戶對(duì)第j個(gè)項(xiàng)目的評(píng)分值。
二是尋找目標(biāo)用戶的最近鄰集合,每個(gè)用戶u都有一個(gè)最近鄰集合,通過計(jì)算目標(biāo)用戶與其他用戶之間的相似度來尋找最近鄰,常見的相似度計(jì)算方法有余弦相似性、pearson相關(guān)系數(shù)等。用戶之間的相似值計(jì)算出來后,就根據(jù)用戶間的相似值得出目標(biāo)用戶的最近鄰集合,確定最近鄰居的方法有兩種:一種被稱作“閾值”策略,即把與目標(biāo)用戶的相似值大于閾值的用戶當(dāng)作最近鄰居集合;另一種被稱作“Top-N”策略,即將最近鄰居與目標(biāo)用戶之間的相似值按從大到小排序,最近鄰集合為排在前N位的最相似用戶。
三是產(chǎn)生推薦,使用公式計(jì)算目標(biāo)用戶對(duì)某項(xiàng)目的興趣度預(yù)測(cè)值,選取N個(gè)最高的預(yù)測(cè)值項(xiàng)目推送給用戶。
通過基于協(xié)同過濾算法的個(gè)性化推薦,可以把農(nóng)戶所需要的信息及時(shí)推送給農(nóng)戶,滿足用戶對(duì)信息的需求。
基于用戶的協(xié)同過濾也有局限性,計(jì)算用戶相似度時(shí),是把目標(biāo)用戶的歷史行為記錄與其他每一個(gè)用戶的記錄進(jìn)行比較得出的,若一個(gè)網(wǎng)站有上百萬個(gè)用戶,且用戶數(shù)量逐漸增多,每計(jì)算一個(gè)目標(biāo)用戶都將涉及到上百萬次比較,所以擴(kuò)展性難將成為非常嚴(yán)重的問題?;陧?xiàng)目的協(xié)同過濾推薦算法和基于模型的協(xié)同過濾推薦算法也會(huì)存在數(shù)據(jù)稀疏性,冷啟動(dòng)等問題。因此,如何克服協(xié)同過濾算法中存在的各種問題也是協(xié)同過濾推薦算法研究的一個(gè)重要課題。
本文只是在農(nóng)業(yè)信息服務(wù)系統(tǒng)中的地域分塊方法基礎(chǔ)上對(duì)協(xié)同過濾推薦算法的一個(gè)小型案例分析,協(xié)同過濾算法雖然有一些缺點(diǎn),但也有一定的優(yōu)勢(shì),例如簡(jiǎn)單易于理解,能為用戶推薦新的感興趣的信息等,我們也可以把它與其它算法結(jié)合起來,取長(zhǎng)補(bǔ)短,更好的應(yīng)用到農(nóng)業(yè)信息服務(wù)個(gè)性化推薦中,以加強(qiáng)所提供信息的針對(duì)性,使得信息能夠被更有效的利用。
[1]喬波,聶笑一.基于本體的農(nóng)業(yè)信息服務(wù)個(gè)性化推送研究[J].安徽農(nóng)業(yè)科學(xué),2013,41(27).
[2]張新香.情境感知和興趣適應(yīng)的農(nóng)業(yè)信息推薦模型[J].計(jì)算機(jī)應(yīng)用研究,2015,33.
[3]陳誠(chéng),廖桂平,史曉慧.農(nóng)業(yè)農(nóng)村信息服務(wù)個(gè)性化推送技術(shù)[N].中國(guó)農(nóng)學(xué)通報(bào), 2011,27(29):151-156.
[4]徐穩(wěn).湖南農(nóng)業(yè)信息區(qū)域推送關(guān)鍵技術(shù)研究[D].湖南農(nóng)業(yè)大學(xué),2013,6.
王培培(1992),女,漢族,河北廊坊人,河北大學(xué)情報(bào)學(xué)碩士研究生,研究方向:信息服務(wù),大數(shù)據(jù)。