徐清暄
(江蘇省南京市中華中學,江蘇南京,210019)
在網(wǎng)絡購物中,商品的評價是除商家所提供信息之外消費者唯一可以參考的信息,因此,在網(wǎng)絡購物模式中,為了保證評價的可靠性,平臺只會為已購買并收貨的消費者提供評價權利。但更多的商家不惜選擇“買評價”來提升商品的信譽,極大地擾亂了市場的正常交易,使得單純的評價權利限制已不能適應虛假評價阻斷的需要。
因為基于對賬戶的購買情況分析所進行的識別和基于IP地址的再識別并不準確,現(xiàn)有模式并不能阻止虛假評價的產(chǎn)生。另外,考慮到消費者隱私權,平臺顯然不可以在客戶端種入隱藏的標記,即使在客戶端留下cookies作為平臺對用戶的識別載體,cookies的留存與否也是單一取決于用戶,這使平臺失去了主動識別以及提供服務的契機。
本文將網(wǎng)購平臺的需求與瀏覽器指紋的優(yōu)勢相結合,提出了一套基于瀏覽器的設備指紋用戶識別機制。通過對用戶的指紋識別、黑白灰指紋名單分類、評價查重和用戶驗證等環(huán)節(jié)對虛假評價進行分層級檢測,可以更有效地減少虛假評價允許發(fā)布率,維護消費者權利,規(guī)范市場規(guī)則。
由于HTTP協(xié)議是無狀態(tài)的,因此用戶訪問服務器的時候,網(wǎng)站會在用戶的電腦端保存一個cookies,以用來后期用戶的識別以及會話的保持。在過去很長的一段時間里,cookies都是用戶再識別的載體,但后來微軟披露cookies會泄露個人的隱私,因此一些隱私意識較強的用戶會定期的刪除cookies,這樣服務器就不能再持續(xù)跟蹤用戶。因此后來就出現(xiàn)了瀏覽器指紋,相比于cookies來說,瀏覽器指紋更健壯,瀏覽器指紋主要是通過HTTP和JS獲取用戶瀏覽器屬性配置信息,比如將用戶代理、所用語言、所在的時區(qū)、用戶所在地理位置、屏幕分辨率、可用屏幕分辨率、安裝的插件列表、字體列表等等屬性集合起來,按照一定的順序排列成字符串,之后通過散列函數(shù)進行計算所得到的唯一16進制的序列作為用戶的ID,這個ID可以在一定時間閥值內(nèi)準確的對用戶進行識別確認。
我們經(jīng)常使用的瀏覽器只有幾種,但是瀏覽器的屬性卻有很多種,包含它的內(nèi)核信息、語言、插件、字體等等,正是這些屬性的不同,才使得瀏覽器能夠被區(qū)分出來,這些瀏覽器的屬性,往往可以生成設備指紋,下面對其中一些瀏覽器屬性進行介紹:
User Agent(用戶代理):包含當前系統(tǒng)及瀏覽器的版本相關信息。
Platform(平臺):提供瀏覽器所在硬件環(huán)境和操作系統(tǒng)的信息,這個屬性沒有標準的值空間,但是有一些常用的值。比如WIN32,MACIntel。
Color Depth(色深度):緩沖期或者目標設備上的調(diào)色板的比特深度。
Pixel Ratio(色素率):設備物理像素和設備獨立像素的比例。
IndexedDB(索引數(shù)據(jù)庫):當前設備是否支持索引數(shù)據(jù)庫。
Open DB(開放數(shù)據(jù)庫):當前瀏覽器是否支持開放數(shù)據(jù)庫。
CPU class(cpu種類):瀏覽器所在的計算機系統(tǒng)使用的CPU類型。
canvas(畫布):基于HTML的canvas獲取瀏覽器的指紋信息。
Adblock(廣告屏蔽插件):設備是否安裝了廣告屏蔽插件。
Has_lied_language(修改語言):用戶是否修改了當前瀏覽器或者系統(tǒng)語言。
Has_lied_os(修改操作系統(tǒng)):用戶是否修改了當前操作系統(tǒng)類型和版本。
plugins(插件):提供瀏覽器中安裝的插件信息。
瀏覽器指紋是一種新型的瀏覽器個體識別方式,這種技術是將瀏覽器的相關屬性和信息進行提取和整合,由此生成一個唯一的標識,作為瀏覽器的指紋。
瀏覽器的指紋特性通常包含字體、插件、User Agent、cookies是否開啟,時區(qū)等等,各種特征的提取方法不盡相同。瀏覽器發(fā)送請求的時候,會在http請求頭中包含一些信息,包含User Agent以及可接受數(shù)據(jù)的類型,服務器可以從http請求頭中獲取User Agent、http_accept的值、Cookies的設置信息、所屬時區(qū)、插件信息以及語言等可以通過js直接調(diào)用瀏覽器相關方法獲取得到,系統(tǒng)安裝的字體列表可以通過 fl ash結合js的方法獲取,以上介紹的瀏覽器屬性,大部分都可以通過調(diào)取瀏覽器提供的接口方法獲得,但是還有一些瀏覽器屬性需要比較復雜的過程才能獲取到,比如canvas屬性,這種屬性的獲取方法如下:通過html提供的canvas畫布,畫出一幅圖畫或者寫出一段文字,然后將繪畫或者文字轉換成一串字符串返回,該字符串往往采用base編碼,由于不同的系統(tǒng)環(huán)境下,不同的瀏覽器,不同的圖片處理引擎,對圖片的壓縮尺寸和導出格式等都會有不同的要求,渲染出來繪畫會有差別,因此canvas屬性可以用來區(qū)分不同的瀏覽器。
本文介紹的虛假評價識別系統(tǒng)分為四個環(huán)節(jié),首先是對于用戶瀏覽器指紋的識別,其次是黑白灰指紋名單的認證,再然后是對于評價者自身購買頻率以及評價內(nèi)容重復率的檢測,最后是評價允許發(fā)布以及對于無法發(fā)布評價者提供申訴機會。其中,用戶指紋的生成和識別作為系統(tǒng)運行的前提基本獨立于其他環(huán)節(jié)之外,而另外三個環(huán)節(jié)則協(xié)同運作。下面將給出系統(tǒng)運行的流程圖(見圖1)以及系統(tǒng)運行的詳細描述。
圖1
瀏覽器指紋是一種動態(tài)指紋,平臺僅需要在用戶提出評價申請時收集用戶的瀏覽器頁面屬性和硬件信息即可以生成指紋。但也正因為瀏覽器指紋的動態(tài)性,新的指紋往往具有一部分漸變信息,對于此,系統(tǒng)可以通過指紋重合率來重新聯(lián)系漸變部分和原有信息,那么即使用戶該次操作距離上一次操作已經(jīng)過了一段時間,平臺對用戶的再識別也是有效的。而且,用戶通過虛擬IP地址等信息所進行的識別混淆也會因此失去用武之地。
在對用戶庫中用戶進行識別或者新用戶錄入后,本文所介紹的系統(tǒng)引入了黑白灰分層指紋名單來協(xié)助識別。
對于已存在的白名單用戶,系統(tǒng)將直接給予評價允許發(fā)布的指令。這不僅僅節(jié)省了平臺繁瑣的認證步驟,而且免驗證進行評價發(fā)布也會給用戶提供更好的使用體驗。此外,白名單的準入條件在本系統(tǒng)中被設定為在預設時間閥值內(nèi)未被加入指紋庫中的三色名單體系并在該段時間內(nèi)成功發(fā)布過有效評價,而對于曾經(jīng)被加入黑名單的用戶則采用一票否決制度,對于曾經(jīng)被加入灰名單的用戶則會將需要的冷卻時間閥值延長。這種白名單準入機理也會在一定程度上給予用戶的“刷單”行為一些震懾。
對于已存在的灰名單用戶,系統(tǒng)將進行對于該有用戶近期一段時間內(nèi)訂單成交次數(shù)的檢測以及判斷。如果成交次數(shù)大于某一閥值,則可基本判定該用戶屬于非正常用戶,并基于此將該用戶加入黑名單。如果成交次數(shù)并未超過該閥值,則繼續(xù)對該用戶的評價內(nèi)容進行查重來加強認證,評價內(nèi)容重復率高于預定值的用戶將同樣被判定為非正常用戶并加入黑名單。但若在成交次數(shù)低于閥值的情況下其評價內(nèi)容重復率依舊低于預設值,那么將繼續(xù)進行評價環(huán)境驗證,驗證通過則判定該用戶屬于正常用戶,給予評價允許發(fā)布指令并將其移出指紋灰名單,否則不允許發(fā)布評價。但是,在此環(huán)節(jié)被阻止評價發(fā)布的用戶可以進行申訴,平臺提供人工服務來對該用戶綜合考量并進行判定,若申訴成功則給予評價允許發(fā)布指令并將其移出指紋灰名單,否則不允許發(fā)布評價。
對于已存在的黑名單用戶,系統(tǒng)將直接給予禁止發(fā)布評價的指令并且不會提供申訴機會。但是,如果在一段相當長的預設時間閥值范圍內(nèi)該黑名單用戶都未被再次判定為非正常用戶,系統(tǒng)就會將該用戶移出黑名單并加入灰名單,但是,如同上文所說,該用戶將永久失去進入白名單的許可權,即無法享受免驗證評價發(fā)布的服務。
本文主要分為四個部分,首先是對系統(tǒng)研究背景的概述,然后是關于瀏覽器指紋屬性及其提取的介紹,再然后進行了對于新式虛假評價識別系統(tǒng)內(nèi)容的詳細闡述,最后對研究對象進行了總結與展望。
瀏覽器指紋在本文中的應用可以更好的體現(xiàn)出其優(yōu)越性,這有利于瀏覽器指紋的進一步發(fā)展和推廣。此外,相信在本文介紹的虛假訂單識別系統(tǒng)的協(xié)助下,網(wǎng)購平臺可以大大提升商品評價的可信度,為消費者提供更優(yōu)質(zhì)的服務,規(guī)范市場秩序,建立平臺和用戶雙向信任的交易模式,為網(wǎng)絡購物的發(fā)展注入更多的活力。