楊倩玉+陳紅倩+馬慧鋆
摘 要:針對全國農(nóng)殘檢測數(shù)據(jù)不同地區(qū)間、多種MRL標準下判定結論間的數(shù)據(jù)對比分析需求,提出一種地理位置相關的多重放射環(huán)可視化方法。該方法首先基于GIS方法指代各部分檢測數(shù)據(jù)所在地區(qū),借鑒氣泡圖形式通過圖元大小映射各地區(qū)檢測樣品采樣量,以及借鑒餅圖形式通過扇區(qū)比例映射樣品中檢出不同毒性農(nóng)藥的比例關系,并提出并行環(huán)方法,映射各地區(qū)的檢測數(shù)據(jù)在不同MRL標準下的超標結論對比情況。實驗結果與領域專家的評價表明,該方法能有效提高全國農(nóng)殘檢測數(shù)據(jù)的分析效率,可實現(xiàn)不同地理位置、不同檢出結果判定類別間的對比分析。
關鍵詞:MRL標準;農(nóng)殘檢測數(shù)據(jù);多重放射環(huán);R語言
DOIDOI:10.11907/rjdk.173112
中圖分類號:TP391
文獻標識碼:A 文章編號:1672-7800(2018)002-0172-03
0 引言
食品安全問題關系到國計民生,國家多部門都會對食品中的農(nóng)藥殘留進行檢測及防范。為規(guī)范食品安全檢測,中國、美國、日本、歐盟、中國香港、國際食品法典委員會(CAC,Codex Alimentarius Commission)均存在相應的MRL標準。
農(nóng)殘檢測數(shù)據(jù)具有層次、空間屬性特征,具有采樣點、農(nóng)產(chǎn)品、農(nóng)藥、檢測數(shù)據(jù)4大屬性。采樣點基于地圖上的行政區(qū)域劃分,農(nóng)產(chǎn)品種類、農(nóng)藥種類均具有層次結構。在進行全國農(nóng)殘檢測數(shù)據(jù)分析過程中,首先需要分析在數(shù)據(jù)集中的哪些地區(qū),農(nóng)產(chǎn)品是需要重點關注或亟需采取措施的。同時,在數(shù)據(jù)分析過程中,農(nóng)藥殘留量超標的判斷結論是相對的,需同時參照多種MRL標準,在不同標準下的同步對比分析是提高分析效率的有效手段。因此,針對數(shù)據(jù)中不同地區(qū)間、多種MRL標準下判定結論間的對比分析是需要解決的首要問題。
在層次型數(shù)據(jù)可視化技術方面,主要技術為節(jié)點-鏈接(Node-Link)法和空間填充(Space-Filling)法兩大類。Xiaotong Liu等[1]在2016年設計了BrandWheel,對社會媒體品牌的公眾認知進行可視化分析;PhenoStacks[2]利用徑向層次結構的sunburst總結表型全局層次結構,輔助進行醫(yī)學領域的表型比較可視化;ViDX[3] 使用同心圓結合條形圖,可快速顯示智能工廠產(chǎn)品裝配過程所需的時間;Lohmann S[4]在2015年提出一種分層詞云布局的可視化方法,利用各層扇區(qū)的交集進行文本交集的詞云展示;Keim[5]提出一種PixelMap算法,通過小范圍移動點改善重疊現(xiàn)象。
在農(nóng)殘檢測數(shù)據(jù)中,地理位置、區(qū)域分布等空間屬性是非常重要的方面。在地理信息與其他屬性同步展現(xiàn)的方法中,Ward[6]提出CityScape方法將地圖區(qū)域劃分為塊,并采用3D柱狀圖表示區(qū)域塊的統(tǒng)計數(shù)據(jù);Li J和Xiao Z[7]結合地圖與外射圓環(huán)表征煙霧分布和隨時間變化情況;Isaac Cho[8]結合地圖與節(jié)點鏈接式的放射環(huán)分析不同時間、地點下的羅馬歷史事件;Lu Y和Steptoe M[9]利用采樣地圖疊加餅圖的方式展現(xiàn)層次、時序屬性;Nivan Ferreira[10]使用地圖疊加矩陣像素塊,以顏色深淺反映各地區(qū)航空公司延遲航班的速度情況。
本文針對農(nóng)藥殘留檢測數(shù)據(jù)多地區(qū)、多MRL標準下的對比分析需求,提出一種能同時表征基于多種MRL標準的判定結果且結合地理位置的可視化方法。該方法首先將每一城市或地區(qū)的數(shù)據(jù)聚合為一個多重放射環(huán),以一種直觀的方式表達多種MRL標準下的農(nóng)殘檢測數(shù)據(jù)統(tǒng)計結果,并結合地圖隱喻直觀地呈現(xiàn)地區(qū)間的采樣量、含量超標的對比情況。
1 基于多重放射環(huán)的多標準對比可視化
1.1 多重放射環(huán)設計
由于各國家/地區(qū)的MRL標準有所差異,不同的判定標準會造成某種農(nóng)產(chǎn)品中某種農(nóng)藥的檢出值是否超標的結果不同,從而造成同一批檢測數(shù)據(jù),在不同MRL標準下超標和未超標樣品數(shù)不同。
本文針對指定城市或區(qū)域的農(nóng)殘檢測結果數(shù)據(jù),設計了一種名為“多重放射環(huán)”的可視化方法,其設計思想源自于Sunburst,方法的示意圖如圖1所示,具體設計思想為:
(1) 根節(jié)點設計為餅圖,分別表示無農(nóng)藥檢出、中低毒農(nóng)藥檢出、高劇毒農(nóng)藥檢出3種情況的比例。
(2) 外射的同心外環(huán)分為兩部分:在中低度農(nóng)藥檢出部分采用堆疊圖的形式表示未超標/超標數(shù)據(jù)的占比,在高劇毒農(nóng)藥檢出部分采用徑向映射表示高劇毒農(nóng)藥的檢出情況。
1.2 內(nèi)層放射環(huán)計算
多重放射環(huán)的內(nèi)層放射環(huán)具體計算方法為:
(1)內(nèi)徑映射與計算。第一重環(huán)(A、B、C區(qū))中餅圖半徑稱為多重放射環(huán)的內(nèi)徑,映射為所指定城市或區(qū)域的“農(nóng)產(chǎn)品樣品采樣量”。內(nèi)徑映射公式如公式(1)所示:
其中,[min,max]為內(nèi)徑的自定義區(qū)間,區(qū)間大小根據(jù)實際效果而定。Num為各地區(qū)樣品數(shù),Num.max為樣品數(shù)最大值,Num.min為樣品數(shù)最小值。根據(jù)公式(1)將各農(nóng)產(chǎn)品樣品數(shù)映射為多重放射環(huán)內(nèi)徑radius.in。
(2)角度占比與著色。根據(jù)農(nóng)產(chǎn)品中的檢出農(nóng)藥情況,將數(shù)據(jù)集分為中低毒農(nóng)藥檢出、高劇毒農(nóng)藥檢出、無農(nóng)藥檢出3類,根據(jù)3類檢出情況的農(nóng)產(chǎn)品占比映射為圖2中A、B、C區(qū)扇區(qū)所占的圓心角角度比。針對中低毒農(nóng)藥檢出、高劇毒農(nóng)藥檢出、無檢出3類情況,依次著色為藍色、紅色、綠色。
1.3 外層放射環(huán)計算
多重放射環(huán)的外層放射環(huán)的環(huán)寬計算方法為: ①無農(nóng)藥檢出扇區(qū),對應環(huán)寬為0;②中低毒農(nóng)藥檢出扇區(qū)(圖2中B1區(qū)),環(huán)寬映射為農(nóng)產(chǎn)品樣例中農(nóng)藥檢出量的最高值或均值,本文實例選擇農(nóng)藥檢出量的均值。
多重放射環(huán)B1區(qū)的外徑計算方法如公式(2)所示:
1.4 多標準并行環(huán)計算endprint
為對比多種MRL檢測標準下超標/未超標判定結果的對比情況,將中低毒農(nóng)藥檢出扇區(qū)(即圖2中B1區(qū))的外徑由內(nèi)到外劃分為6層,分別表示中國、歐盟、日本、香港、美國、CAC的MRL標準下的判定結果。在同一并行環(huán)中,超標部分使用深色著色,未超標部分使用淺色著色。
判定結果中未超標/超標占比將對應圓環(huán)逆時針分割,每個分割區(qū)間圓心角為各類檢出量與總檢出量的比值乘以中低毒檢出扇區(qū)圓心角。
2 實驗結果與分析
2.1 案例數(shù)據(jù)集可視分析
基于R語言實現(xiàn)了本文提出的多重放射環(huán)可視化方法。圖2為多重放射環(huán)應用到農(nóng)藥殘留檢測數(shù)據(jù)的可視化效果圖的一個樣例,從該圖中得出的分析結論有:
(1)從中心的餅圖可以看出,綠色扇形區(qū)代表的未檢出量及紅色扇形區(qū)代表的高劇毒檢出量占比較小,而藍色扇形區(qū)代表的中低毒檢出量占比較大,可見中低毒檢出量相對較多。
(2)從高劇毒農(nóng)藥總檢出頻次映射區(qū)間看,其檢出頻次在所有城市或地區(qū)的農(nóng)產(chǎn)品采樣中基本處于中等。
(3)從同心圓環(huán)對比多國/地區(qū)MRL標準下的檢出超標情況看,中國、香港、美國、CAC標準下超標量較少,但歐盟、日本標準下的超標量相對較多,因此該批次農(nóng)產(chǎn)品仍需引起注意。
針對多地區(qū)的農(nóng)殘檢測情況的對比,本文基于leaflet地圖庫實現(xiàn)了多重放射環(huán)與地圖結合的全國農(nóng)殘檢測數(shù)據(jù)概覽效果圖,如圖3所示為其中一個數(shù)據(jù)集的可視化效果。
該圖共展示了26個省會城市以及4個直轄市的主要檢測信息,通過對比圖3中表征各城市的多重放射環(huán),可得到以下結論:
(1)根據(jù)不同城市/地區(qū)中的多重放射環(huán)大小,可對比其農(nóng)產(chǎn)品樣品采樣數(shù)量。如本例中北京、石家莊、廣州的采樣量相對較多,有些地區(qū)的采樣量相對較少,可以考慮加大其采樣量。
(2)根據(jù)多重放射環(huán)的內(nèi)層環(huán)各扇區(qū)占比,可對比各城市不同農(nóng)藥檢出情況的農(nóng)產(chǎn)品樣品占比情況。如本例中烏魯木齊、南寧、長沙等城市無農(nóng)藥化學物檢出的樣品比例較高,說明其農(nóng)殘檢測的結果總體較好。
(3)根據(jù)高劇毒農(nóng)藥檢出扇區(qū)的外層環(huán)環(huán)寬值,可對比各城市的農(nóng)產(chǎn)品樣品中的高劇毒農(nóng)藥檢出情況。如本例中武漢、南寧等城市的高劇毒農(nóng)藥平均檢出量較少。
(4)根據(jù)中低毒農(nóng)藥檢出扇區(qū)的外層環(huán)環(huán)寬,可對比各城市的中低毒農(nóng)藥平均檢出量。如在本例中石家莊、北京、廣州等城市的農(nóng)產(chǎn)品采樣量較多,但中低毒農(nóng)藥的平均檢出量較小。
(5)根據(jù)中低毒農(nóng)藥對應區(qū)域的外層環(huán)各標準下超標/未超標情況占比,可對比各城市農(nóng)產(chǎn)品樣品中的超標/未超標情況。如本例中大部分城市含中低毒農(nóng)產(chǎn)品化學物的樣品超標比例都較低,但在日本MRL標準下各城市樣品的超標比例明顯高于其他標準。這是由于日本MRL標準的限量值較低,標準要求更為嚴格。
2.2 本文方法性能分析
本文設計的對比可視化方法,從多重放射環(huán)的可視編碼和布局設計上,同現(xiàn)有的類Sunburst層次可視化布局方法相比,本文方法采用創(chuàng)新的可視化元素編碼,并可以較好地實現(xiàn)數(shù)據(jù)集的多屬性和多標準對比,展現(xiàn)的信息量增多,且空間利用率高。
3 結語
本文針對農(nóng)殘檢測數(shù)據(jù)多地區(qū)間、多MRL標準下的對比分析,提出了一種多重放射環(huán)的可視化方法,并與地圖相結合,實現(xiàn)了農(nóng)殘檢測數(shù)據(jù)的對比分析可視化以及多MRL標準下的判定結果比較。該方法有利于專家快速瀏覽數(shù)據(jù)集,分析區(qū)域間數(shù)據(jù)的差異性,并根據(jù)各項數(shù)據(jù)指標針對指定區(qū)域進行深入分析。實驗結果表明,本方法能幫助食品安全領域專家對指定城市/地區(qū)的農(nóng)殘檢測結果數(shù)據(jù)作一個快速了解,根據(jù)可視結果重點關注超標嚴重或高劇毒農(nóng)藥占比較大的地區(qū),以便對農(nóng)產(chǎn)品中農(nóng)藥殘留檢測情況作進一步分析。下一步工作將設計農(nóng)產(chǎn)品及農(nóng)藥的分類統(tǒng)計可視化方法,利用交互手段進行協(xié)同展示,通過多視圖實現(xiàn)多角度的綜合評價。
參考文獻:
[1] LIU X, XU A, GOU L, et al. SocialBrands: visual analysis of public perceptions of brands on social media[C].IEEE Conference on Visual Analytics Science and Technology. IEEE Computer Society, 2016:71-80.
[2] GLUECK M, GVOZDIK A, CHEVALIER F, et al. PhenoStacks: cross-sectional cohort phenotype comparison visualizations[J]. IEEE Transactions on Visualization & Computer Graphics, 2016,23(1):191.
[3] XU P, MEI H, LIU R, et al. ViDX: visual diagnostics of assembly line performance in smart factories[J].IEEE Transactions on Visualization & Computer Graphics, 2016,23(1):291-300.
[4] LOHMANN S, HEIMERL F, BOPP F, et al. Concentri cloud: word cloud visualization for multiple text documents[C].International Conference on Information Visualisation. IEEE, 2015:114-120.
[5] KEIM D, PANSE C, SIPS M, et al. Visual data mining in large geospatial point sets[J]. Computer Graphics and Applica-tions, IEEE, 2004,24(5):36-44.
[6] WARD M O, GRINSTEIN G, KEIM D. Interactive data visuali-zation: foundations, techniques, and applications[M]. CRC Press, 2010.
[7] LI J, XIAO Z, ZHAO H Q, et al. Visual analytics of smogs in China[J]. Journal of Visualization, 2016(3):1-14.
[8] CHO I, DOU W, WANG D X, et al. VAiRoma: a Visual Analytics system for making sense of places, times, and events in roman history[J]. IEEE Transactions on Visualization & Computer Graphics, 2016,22(1):210-219.
[9] LU Y, STEPTOE M, BURKE S, et al. Exploring evolving media discourse through event cueing[J].IEEE Transactions on Visualization & Computer Graphics, 2015,22(1):220-229.
[10] WANG Z, FERREIRA N, WEI Y, et al. Gaussian cubes: real-time modeling for visual exploration of large multidimensional datasets[J]. IEEE Transactions on Visualization & Computer Graphics, 2016,23(1):681-690.endprint