趙圓圓 蔡鋒波
(湛江科技學(xué)院 廣東省湛江市 524000)
IP地址定位是一種通過IP地址來確定主機(jī)地理位置的技術(shù)。高精準(zhǔn)IP地理位置定位可以實(shí)現(xiàn)街道級別的、實(shí)時(shí)的IP地理位置查詢。采用超高精度IP實(shí)時(shí)定位技術(shù),通過網(wǎng)絡(luò)測量和大數(shù)據(jù)挖掘,對IP的地理位置和相關(guān)屬性進(jìn)行測量,在無需硬件支持的條件下,即可對被探測目標(biāo)終端IP完成定位。本文從IP地址定位技術(shù)分析、多入口農(nóng)貿(mào)平臺位置服務(wù)應(yīng)用舉例和結(jié)論3個(gè)方面加以介紹。
IP地址是IP協(xié)議提供的一種統(tǒng)一的地址格式,它為互聯(lián)網(wǎng)上的每一個(gè)網(wǎng)絡(luò)和每一臺主機(jī)分配一個(gè)邏輯地址[1]。地區(qū)互聯(lián)網(wǎng)注冊管理機(jī)構(gòu)(Regional Internet Registry,簡稱RIRS)是負(fù)責(zé)將IP地址塊分配給ISP的多家國際組織之一?,F(xiàn)在,全球共有五大RIR機(jī)構(gòu),分別為RIPE(Reseaux IP Europeans),歐洲IP地址注冊中心,服務(wù)于歐洲、中東地區(qū)和中亞地區(qū))、LACNIC(Lation American and Caribbean Internet Address Registry,拉丁美洲和加勒比海Internet地址注冊中心,服務(wù)于中美、南美以及加勒比海地區(qū))、ARIN(American Registry for Internet Numvers,美國Internet編號注冊中心,服務(wù)于北美地區(qū)和部分加勒比海地區(qū))、AFRINIC(Africa Network Information Centre,非洲網(wǎng)絡(luò)信息中心,服務(wù)于非洲地區(qū))以及APNIC(Asia Pacific Network Information Centre,亞太地址網(wǎng)絡(luò)信息中心,服務(wù)于亞洲和太平洋地區(qū)的國家)[2]。APNIC負(fù)責(zé)為互聯(lián)網(wǎng)注冊機(jī)構(gòu)(Internet Registry,以下簡稱IRS)分配IP地址,有時(shí)APNIC也會直接給終端用戶分配地址。國家和本地互聯(lián)網(wǎng)注冊機(jī)構(gòu)(以下分別簡稱為NIRs、LIRs)在APNIC的指導(dǎo)下,根據(jù)各種相關(guān)政策和程序,為其成員和客戶分配地址空間。
APNIC Whois數(shù)據(jù)庫詳細(xì)說明了APNIC在亞太地區(qū)管理范圍內(nèi)的數(shù)字互聯(lián)網(wǎng)資源記錄(IP地址分配情況和AS號碼),是一個(gè)可公開搜索的數(shù)據(jù)庫[3]。每個(gè)記錄都包含許多不同的對象,例如:AS號、地址段、人員等。
IP地址定位方法從基礎(chǔ)數(shù)據(jù)采集、硬件系統(tǒng)搭建、應(yīng)用場景劃分和定位系統(tǒng)研發(fā)4個(gè)方面加以分析。
基礎(chǔ)數(shù)據(jù)采集為IP地理位置定位技術(shù)的研究提供基礎(chǔ)數(shù)據(jù)支撐,是IP地址定位的基礎(chǔ)性工作和關(guān)鍵技術(shù)。首先,按照不同的數(shù)據(jù)采集規(guī)則,針對不同數(shù)據(jù)源的數(shù)據(jù)格式,利用自動化智能化的數(shù)據(jù)采集技術(shù);對采集到的數(shù)據(jù)進(jìn)行篩選、清洗和挖掘,形成基礎(chǔ)數(shù)據(jù)庫,為系統(tǒng)提供基礎(chǔ)數(shù)據(jù)支撐。
基礎(chǔ)數(shù)據(jù)采集的研究內(nèi)容包含確定數(shù)據(jù)源(如Whois開放數(shù)據(jù)等)、分析數(shù)據(jù)采集的方法(如網(wǎng)絡(luò)爬蟲、數(shù)據(jù)交換、地面采集等)、各種數(shù)據(jù)采集方法的可行性分析及實(shí)現(xiàn)方案、確定采集數(shù)據(jù)的屬性值(如地理位置、經(jīng)緯度、所屬運(yùn)營商等)、數(shù)據(jù)的清洗辦法、數(shù)據(jù)的正確性驗(yàn)證、基礎(chǔ)數(shù)據(jù)的迭代更新等。
為了保證數(shù)據(jù)質(zhì)量和數(shù)據(jù)豐富性,針對不同的數(shù)據(jù)源,可以通過三種方式獲取基礎(chǔ)數(shù)據(jù),分別是數(shù)據(jù)挖掘、數(shù)據(jù)采購、地面采集。數(shù)據(jù)挖掘是指通過網(wǎng)絡(luò)爬蟲,從特定網(wǎng)頁如APNIC網(wǎng)站、BGP網(wǎng)站、地圖類網(wǎng)站中獲取IP及地理位置信息[4];數(shù)據(jù)采購是指從可以提供基礎(chǔ)數(shù)據(jù)的公司進(jìn)行數(shù)據(jù)采購,例如某本地服務(wù)網(wǎng)站、某網(wǎng)絡(luò)打車網(wǎng)站等;地面采集是指利用數(shù)據(jù)采集軟件,進(jìn)行人工實(shí)地?cái)?shù)據(jù)采集。數(shù)據(jù)采集技術(shù)已存在多個(gè)開源的第三方框架,例如Scrapy、Nutch、Crawler4j、WebMagic等;數(shù)據(jù)挖掘算法,例如支持向量機(jī)SVM、K-Means等,都已得到廣泛應(yīng)用。數(shù)據(jù)采集和分析情況如圖1所示。
圖1:數(shù)據(jù)采集和分析
硬件系統(tǒng)搭建是指選擇機(jī)器、購買機(jī)器、配置機(jī)器、測試機(jī)器和維護(hù)機(jī)器整個(gè)過程,通過構(gòu)建硬件系統(tǒng),為系統(tǒng)部署提供硬件環(huán)境。硬件系統(tǒng)包括GEO機(jī)器和VP機(jī)器(VantagePoint,探測機(jī)),GEO機(jī)器是系統(tǒng)定位算法的運(yùn)算機(jī),即系統(tǒng)的算法服務(wù)器,VP機(jī)器是系統(tǒng)的探測機(jī),用于獲取網(wǎng)絡(luò)路徑信息。
硬件系統(tǒng)中的GEO機(jī)器,要求網(wǎng)絡(luò)穩(wěn)定、配置高、易于管理即可,與覆蓋ISP及其地理位置無關(guān),通過比較阿里、騰訊、亞馬遜等云服務(wù)器,選擇符合要求的GEO機(jī)器即可。而VP機(jī)器用來獲取網(wǎng)絡(luò)路徑信息,VP機(jī)器覆蓋的ISP越多、位置分布越分散,探測到的路徑信息就越豐富,系統(tǒng)的定位結(jié)果以及網(wǎng)絡(luò)拓?fù)涞睦L制就會越準(zhǔn)確。
按照IP的應(yīng)用場景,將IP分為9類,分別是住宅用戶、企業(yè)專線、學(xué)校單位、數(shù)據(jù)中心、基礎(chǔ)設(shè)施、移動網(wǎng)絡(luò)、公共熱點(diǎn)、組織機(jī)構(gòu)和衛(wèi)星通訊。應(yīng)用場景劃分如圖2所示。
圖2:IP應(yīng)用場景分類方案
以香港地區(qū)網(wǎng)絡(luò)為例,不同應(yīng)用場景IP的用途與特征不同,如表1所示。其中,學(xué)校單位和數(shù)據(jù)中心的活I(lǐng)P率高,地理覆蓋范圍小,時(shí)延小,路由匯聚,與骨干網(wǎng)近;住宅用戶的活I(lǐng)P率低,地理覆蓋范圍小,時(shí)延中,路由匯聚,與骨干網(wǎng)遠(yuǎn)。
表1:IP的9類用途及其特征
通過對IP的相關(guān)數(shù)據(jù)進(jìn)行抽象分析,建立特征工程和數(shù)據(jù)模型;通過機(jī)器學(xué)習(xí)的方法,完成對IP的應(yīng)用場景劃分。該技術(shù)已經(jīng)在香港、臺灣和北京IP地理位置定位系統(tǒng)中使用,技術(shù)具備很強(qiáng)的可行性。
定位系統(tǒng)的研發(fā)核心是IP地理位置定位算法,包含功能塊和地域塊劃分、實(shí)時(shí)網(wǎng)絡(luò)測量兩個(gè)方面[5]。解決如何劃分IP所屬功能塊和地域塊、設(shè)計(jì)IP定位算法、采用什么樣的相似度比較策略、IP地理位置定位返回哪些相關(guān)信息、對IP定位結(jié)果的信心度描述、定義IP定位的精度準(zhǔn)確度和精密度、對IP定位的正確性進(jìn)行評估、IP定位結(jié)果進(jìn)行展示模型、以什么形式給客戶提供IP定位服務(wù)等問題。
1.4.1 功能塊和地域塊劃分
根據(jù)IP分配的區(qū)域特性,首先,以APNIC和應(yīng)用場景將IP塊進(jìn)行功能劃分,將IP塊分成9類功能塊,分別是學(xué)校單位、數(shù)據(jù)中心、住宅用戶、企業(yè)專線、組織機(jī)構(gòu)、基礎(chǔ)設(shè)施、移動網(wǎng)絡(luò)、公共熱點(diǎn)和衛(wèi)星通訊;其次,對每一個(gè)功能塊,按地域分布進(jìn)行地域塊劃分。功能塊是指具有相同應(yīng)用場景的IP塊(IP連續(xù)),地域塊是指同一功能塊下,擁有相同地理位置的IP塊(IP連續(xù))。
IP地域塊劃分的應(yīng)用示例如圖3所示,右側(cè)地圖是香港地區(qū)的一張部分地圖,紅點(diǎn)表示定位系統(tǒng)中基準(zhǔn)點(diǎn)所在的位置。針對香港寬頻的住宅用戶IP段14.136.22.0/21,其前6個(gè)IP塊分布在小區(qū)1和小區(qū)2,其后兩個(gè)IP塊分布在小區(qū)3。也就是說功能塊14.136.22.0/21被劃分為2個(gè)地域塊14.136.16.0/24-14.136.21.0/24和14.136.22.0/24-14.136.23.0/24。那么,如果有目標(biāo)IP(14.136.22.22),即使是非基準(zhǔn)點(diǎn),我們也可以把它定位到小區(qū)3,小區(qū)3的直徑為1公里,我們此次定位的最大誤差距離也就是1公里。如果目標(biāo)IP被定位到小區(qū)1和小區(qū)2,我們可以通過實(shí)時(shí)網(wǎng)絡(luò)測量的方法,確定目標(biāo)IP是在小區(qū)1還是在小區(qū)2。
圖3:IP地域塊劃分的應(yīng)用示例
1.4.2 實(shí)時(shí)網(wǎng)絡(luò)測量
如圖4所示,當(dāng)用戶輸入目標(biāo)IP,首先,定位系統(tǒng)把目標(biāo)IP發(fā)送給中心服務(wù)器(G);其次,中心服務(wù)器把目標(biāo)IP分發(fā)給一組探測服務(wù)器(1-8),探測服務(wù)器對其進(jìn)行實(shí)時(shí)網(wǎng)絡(luò)信息測量,并把測量結(jié)果返回給中心服務(wù)器;然后,定位算法對目標(biāo)IP與基礎(chǔ)數(shù)據(jù)中IP的網(wǎng)絡(luò)相似度進(jìn)行分析,將目標(biāo)IP與基礎(chǔ)數(shù)據(jù)中某個(gè)IP進(jìn)行綁定;最后,將定位結(jié)果返還給用戶,完成定位。
圖4:定位系統(tǒng)研發(fā)的基本原理圖
我國農(nóng)產(chǎn)品種類豐富,然而受到市場信息滯后、農(nóng)產(chǎn)品銷售渠道單一、銷售專業(yè)人員不足等因素影響,眾多優(yōu)質(zhì)農(nóng)產(chǎn)品沒有獲得其應(yīng)有的市場價(jià)值,甚至存在“谷賤傷農(nóng)”,農(nóng)產(chǎn)品滯銷等現(xiàn)象[6]。在“互聯(lián)網(wǎng)+”的背景下,多入口農(nóng)產(chǎn)品推廣交易平臺建設(shè)可以拓寬農(nóng)產(chǎn)品銷售渠道,對農(nóng)產(chǎn)品的消費(fèi)需求進(jìn)行有效收集,迅速地將產(chǎn)品送達(dá)消費(fèi)者,方便農(nóng)產(chǎn)品廠商與消費(fèi)者進(jìn)行安全交易和交流,發(fā)揮農(nóng)產(chǎn)品應(yīng)有的市場價(jià)值。同時(shí)平臺整合線下農(nóng)業(yè)旅游資源,延長農(nóng)業(yè)產(chǎn)業(yè)發(fā)展渠道,促進(jìn)農(nóng)業(yè)持續(xù)綠色發(fā)展。引入線下農(nóng)業(yè)旅游功能,實(shí)現(xiàn)多元發(fā)展,開發(fā)出更多市場廣泛接受的功能,讓用戶在實(shí)現(xiàn)農(nóng)產(chǎn)品購買無憂的同時(shí),享受農(nóng)業(yè)旅游帶來的樂趣。多入口農(nóng)貿(mào)平臺系統(tǒng)通過引入定位技術(shù)提供位置服務(wù),電腦端通過IP地址定位技術(shù)確定用戶當(dāng)前位置,計(jì)算出與農(nóng)家樂的距離,并提供路線規(guī)劃,如圖5所示。
圖5:多入口農(nóng)貿(mào)平臺IP位置服務(wù)功能
可以使用高德地圖提供的api實(shí)現(xiàn)定位服務(wù)。先在高德開發(fā)平臺注冊登錄。然后創(chuàng)建應(yīng)用獲取訪問應(yīng)用的密鑰(Key),最后攜帶密鑰去訪問高德地圖提供的根據(jù)IP獲取定位的接口從而得到位置信息。從而計(jì)算出與農(nóng)家樂的距離,并提供路線規(guī)劃??梢赃x擇不同的導(dǎo)航模式,如:步行、駕車、騎行等模式,得到相對應(yīng)的路徑規(guī)劃。流程如圖6所示。
圖6:系統(tǒng)定位服務(wù)接入流程示意圖
高精度IP地址定位技術(shù)在保證定位精度的前提下,盡量減少測量開銷,同時(shí)兼具良好的擴(kuò)展性,并能保護(hù)用戶隱私,在系統(tǒng)開發(fā)中具備很強(qiáng)的可行性。該技術(shù)對于網(wǎng)站區(qū)分用戶的來源、提供針對性的服務(wù)、保障網(wǎng)絡(luò)安全等網(wǎng)絡(luò)應(yīng)用具有非常重要的作用。