趙 蕾 牛會永 黎經(jīng)雷 李石林
湖南科技大學 資源環(huán)境與安全工程學院
隨著移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、云計算、數(shù)字家庭等各種新興技術(shù)的快速發(fā)展,我們已經(jīng)進入大數(shù)據(jù)時代。在這個時代,我們的身邊充滿了大量的數(shù)據(jù)信息,比如職業(yè)事故、職業(yè)病、職業(yè)史、職業(yè)危害因素和人口流動資料等信息內(nèi)容。因此大數(shù)據(jù)的應用讓人們格外關注,特別是關于職業(yè)健康領域的大數(shù)據(jù)應用,現(xiàn)在越來越多的研究者投身到職業(yè)健康領域的應用中,目的是為了保護職工的身心安全與健康。本文主要介紹了大數(shù)據(jù)的概念,分析了大數(shù)據(jù)的五個主要特征,闡述了大數(shù)據(jù)在職業(yè)健康領域的相關應用,對今后人們運用大數(shù)據(jù)技術(shù)解決工作中的問題具有指導幫助性作用[1]。
大數(shù)據(jù)是一個具有概括性的概念,如同信息學領域的大多數(shù)新興概念,大數(shù)據(jù)至今還沒有得出確切的、統(tǒng)一的定義[2]。在長期的科學研究中,人們總結(jié)出了一系列定義來闡述大數(shù)據(jù),其中主要有:麥肯錫定義[3]、亞馬遜定義、維基百科定義、研究機構(gòu)Gartner定義[4]。上述大數(shù)據(jù)的種種定義對于人們了解大數(shù)據(jù)技術(shù)起到了很好的作用,尤其是研究機構(gòu)Gartner的定義已經(jīng)被大多數(shù)學者所接受,并且在實踐中也逐漸得到了證實。大數(shù)據(jù)是指沒有辦法在可容忍的時間內(nèi),用傳統(tǒng)的科學技術(shù)和信息技術(shù)對其進行感知、獲取、管理、處置和服務的數(shù)據(jù)結(jié)合[5]。因此,我們生活在大數(shù)據(jù)時代,更應該學會用數(shù)據(jù)存儲、數(shù)據(jù)發(fā)掘等方法對復雜龐大的數(shù)據(jù)進行整理分析利用,體驗大數(shù)據(jù)技術(shù)給人們生活帶來的便利。
大數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)有所差別,它不僅可以用來描述海量的數(shù)據(jù),還可以進一步指出數(shù)據(jù)的復雜類型、數(shù)據(jù)的快速時間特性以及對數(shù)據(jù)的分析處理能力,最終獲得有價值意義的信息。大數(shù)據(jù)技術(shù)的特點可以用4V+1C來總結(jié),即數(shù)據(jù)規(guī)模巨大(Volume)、數(shù)據(jù)類型繁多(Variety)、處理速度快(Velocity)、價值密度低(Value)和復雜性(Complexity)[6]。
大數(shù)據(jù)時代,數(shù)據(jù)存儲量總是以TB、PB,甚至ZB來衡量(1ZB等于1萬億GB),傳統(tǒng)的信息處理單位已經(jīng)不能滿足人們的實際要求。大數(shù)據(jù)的規(guī)模并無詳細的標準,僅僅只因為規(guī)模大是不屬于大數(shù)據(jù)范疇的。規(guī)模大本身要從兩個維度去衡量,一是從時間序列積累的大量數(shù)據(jù),二是在深度上更為細化的數(shù)據(jù)。以人均每月互聯(lián)網(wǎng)流量的變化為例,2008年用戶人均月流量才0.98GB,2014年達到9.76GB,而2016年平均一個用戶每月互聯(lián)網(wǎng)流量達到24GB,據(jù)推測到2021年,人均每月互聯(lián)網(wǎng)流量將高達61GB。如今,數(shù)據(jù)大量增長已成為公認的事實。
從數(shù)據(jù)的結(jié)構(gòu)特點來看可以分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩類[7]。結(jié)構(gòu)化數(shù)據(jù)是將事物向便于人類和計算機保存、處置、查詢的方法概括的結(jié)果,在概括的過程中,忽略了一些特定的應用下不必考慮的細節(jié),從中只選取有價值的信息供人們運用。相對于結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)沒有相同的屬性,很難用結(jié)構(gòu)化形式表達出來,并且存儲方式復雜。因此,選擇合適的存儲系統(tǒng)來保存和運用相關的信息是非結(jié)構(gòu)化數(shù)據(jù)管理的重要問題?,F(xiàn)在,非結(jié)構(gòu)化數(shù)據(jù)形式越來越多樣化,包括電子郵件、圖片、音頻、視頻等,這些多類型的數(shù)據(jù)對處理能力提出了更高的要求[8]。因此,如何及時快速地篩選出對職業(yè)健康領域有用的信息成為一個關鍵的研究性主題。
大數(shù)據(jù)的第三個特征是處理速度快,這是區(qū)別于傳統(tǒng)數(shù)據(jù)挖掘的最明顯特點。它是指數(shù)據(jù)采集、保存、處置和傳輸速率較快,具有時效性。比如各種社交軟件產(chǎn)生的聊天、語音、圖片、視頻記錄等,都會自動生成一張網(wǎng)絡,系統(tǒng)會快速地做出反饋。
大數(shù)據(jù)技術(shù)作為一種主要的信息收集方式,它的一個特征就是價值密度低。大數(shù)據(jù)為了獲得事物的全部細節(jié),會對所有數(shù)據(jù)進行收集整理,保留最原始的數(shù)據(jù)。由于減少了采樣和提取過程,會產(chǎn)生許多沒有意義的數(shù)據(jù),所以價值密度很低。價值密度的高低與數(shù)據(jù)總量的大小成反比[9]。因此,怎樣利用強大的計算機技術(shù)快速獲取有價值的信息成為目前大數(shù)據(jù)背景下急迫解決的困難之一。
大數(shù)據(jù)的一個傳統(tǒng)特點就在于它的復雜性。大數(shù)據(jù)的復雜性體現(xiàn)在海量性、多變性、異構(gòu)性和分布性等方面,這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)的四個特點。大數(shù)據(jù)技術(shù)處于不斷的更新和發(fā)展中,但并沒有達到成熟狀態(tài)。這并不妨礙我們運用此項技術(shù)去獲取有價值的內(nèi)容,但是我們心里必須清楚:大數(shù)據(jù)的價值是永無止境的。
目前,噪聲、粉塵、放射性物質(zhì)和其他有毒有害物質(zhì)的危害相當突出[10],實現(xiàn)科學有效的管理,就應該充分發(fā)揮大數(shù)據(jù)技術(shù)的作用。政府相關部門應該依托大數(shù)據(jù)的挖掘技術(shù),實現(xiàn)對職業(yè)病和職業(yè)事故的有效控制和管理,建立職業(yè)健康安全管理體系,提高數(shù)據(jù)分析在職業(yè)健康領域的作用。充分運用大數(shù)據(jù)技術(shù),了解事故發(fā)生的原因,進而準確分析問題,為職業(yè)健康的管理提供可靠的數(shù)據(jù)。
據(jù)統(tǒng)計,每天全世界大約有6300人死于職業(yè)事故或職業(yè)病,導致年死亡總數(shù)為230多萬人[11]。每年,我國因職業(yè)病、工傷事故造成的經(jīng)濟損失約1000億元,損失非常慘重,后果不堪設想。發(fā)生災害后再采取措施需要投入大量的人力物力資源,還會影響正常的工作進度,而且惡劣的做法會造成嚴重經(jīng)濟負擔,給生產(chǎn)帶來許多不便。對于發(fā)病率高的地區(qū),相關部門可以利用大數(shù)據(jù)手段及時獲取有用的信息,采取預防措施減少事故的發(fā)生率。同時,應用大數(shù)據(jù)手段,還可以準確掌握每個地區(qū)的職業(yè)健康情況,實現(xiàn)全面監(jiān)控,控制事故發(fā)生的概率[12]。例如,2017年8月以來,湖南桃江縣第四中學發(fā)現(xiàn)肺結(jié)核疫情,至11月17日,已確診肺結(jié)核病例29例,疑似病例5例,預防性服藥38例。經(jīng)國家衛(wèi)生和計劃生育委員會、湖南省衛(wèi)生和計劃生育委員會確認,這是一起聚集性肺結(jié)核公共衛(wèi)生事件。相關部門應做好預防、調(diào)查、宣傳工作,實現(xiàn)全面監(jiān)控。
應用大數(shù)據(jù)技術(shù)管理職業(yè)健康領域,需要建立相關規(guī)章制度來進行規(guī)范和指導[14]。職業(yè)健康管理部門應制定大數(shù)據(jù)收集、存儲、挖掘和分析的能力,制定職業(yè)安全健康目標[15],為相關工作人員熟悉職業(yè)健康情況提供重要依據(jù)。同時,相關工作部門還應對評價體系提出建議與指導,增設大數(shù)據(jù)分析的應用指標。此外,收集的信息數(shù)據(jù)會涉及到個人和企業(yè)的隱私,因此,需要建立保密規(guī)范及隱私制度,加強監(jiān)管力度,利用不同渠道對數(shù)據(jù)進行集中管理,使個人和企業(yè)的隱私得到法律保護。
職業(yè)健康是最大限度的保護職工的身心安全和身體健康。如果我們能夠充分利用大數(shù)據(jù)信息,就能夠?qū)ψ鳂I(yè)人員提供更好的保護[16]。利用大數(shù)據(jù)手段發(fā)展虛擬現(xiàn)實技術(shù),改善現(xiàn)有的職業(yè)健康安全狀況。為了職業(yè)健康安全管理體系的順利進行,可以設置大數(shù)據(jù)路徑,借鑒澳大利亞職業(yè)健康安全管理體系[17],為工作人員提供便利,使大數(shù)據(jù)技術(shù)成為職業(yè)健康領域中“一只看不見的手”。
之前了解某個地區(qū)的職業(yè)健康狀況,主要是通過各地區(qū)上報的數(shù)據(jù)來實現(xiàn),但是這種方式是有局限性的,另外上報數(shù)據(jù)不一定真實反映職業(yè)健康領域現(xiàn)狀。通過構(gòu)建大數(shù)據(jù)平臺,實現(xiàn)數(shù)據(jù)開放與共享[18],對信息內(nèi)容進行統(tǒng)一的整理分析,可以建立相關的職業(yè)健康預測模型,對未來某地區(qū)的職業(yè)健康狀況進行模擬,進而全面掌握該領域的職業(yè)健康狀況。
綜上所述,在職業(yè)健康領域,利用大數(shù)據(jù)技術(shù)可以對信息內(nèi)容進行有效的提取、分析和處理,這不僅可以為職業(yè)健康領域的預測提供參考依據(jù),還可以為工作人員掌握基本情況提供便利。在未來一段時間內(nèi),應該加大相關方面的研究力度,對大數(shù)據(jù)技術(shù)進行不斷的優(yōu)化和完善,使其能夠更好地為職業(yè)健康領域服務。