亓小龍
摘要:大數(shù)據(jù)是在互聯(lián)網(wǎng)高速發(fā)展的前提下產(chǎn)生的名詞,在新聞中曽多次被提到,大數(shù)據(jù)也是當今互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的一種趨勢。此文將會從一個高中生的角度來看待這個問題,簡單的解讀一下大數(shù)據(jù)這個新名詞,同時也給諸多的高中生普及一下相關(guān)知識。
關(guān)鍵詞:大數(shù)據(jù);高中生;科普
大數(shù)據(jù)是互聯(lián)網(wǎng)時代產(chǎn)生的新定義,也是最近幾誕生的互聯(lián)網(wǎng)名詞,雖然高中生并不會直接涉及到里面的專業(yè)知識,但是我們也應該作為時事熱點關(guān)注一下這個新名詞,即便是不能夠做到熟知,但至少要有大體的了解。
一、大數(shù)據(jù)的定義和特點
首先,我們來解釋一下這個名詞的含義。數(shù)據(jù)可以理解為社會生活中多種多樣、色彩斑斕的信息,其中包含平時的聊天記錄、照片以及地圖中我們行進的路線等等,毫不客氣的說,這個世界所包含的所有東西都可以稱之為數(shù)據(jù)。
根據(jù)IDC《數(shù)字世界》研究項目的統(tǒng)計,2010年的全球數(shù)字世界的規(guī)模首次達到了ZB的級別(1ZB=1萬億GB),到目前為止,數(shù)據(jù)量早翻了好幾番了。由此可見,我們目前所擁有的數(shù)據(jù)根本不能用海量來說明了。由2010年2月《The Economist》雜志發(fā)表的一篇題為“The data deluge”的文章,“大數(shù)據(jù)”這個新名詞首次進入了人們的視野中。但是需要說明的是,“大數(shù)據(jù)”并不僅僅是指規(guī)模龐大的數(shù)據(jù),它應當還包括了對這些數(shù)據(jù)得到、整理、使用等一個整體的運用。依據(jù)現(xiàn)在比較常用的說法,大數(shù)據(jù)具體是指運用現(xiàn)在所具有的技術(shù)很難進行管理的大量數(shù)據(jù)的全部內(nèi)容,就是現(xiàn)在關(guān)系到的資料的規(guī)模和數(shù)量無法用現(xiàn)在的流行軟件達到,在合理的前提下實現(xiàn)得到、整理、使用并且能夠有效的輔助企業(yè)的關(guān)鍵的信息[1]。
上一段中我們可能注意到了這幾個關(guān)鍵詞:“運用現(xiàn)在所具有的技術(shù)難以實現(xiàn)管理”指的是這些數(shù)據(jù)的內(nèi)在的形式很復雜、早已經(jīng)超越了我們?nèi)祟惉F(xiàn)有的處理事務的能力,也或是能夠處理,但是處理所消耗的時間已經(jīng)遠遠地超出了我們可以接受的時間。所以,大數(shù)據(jù)需要更強大的數(shù)據(jù)處理能力。對于這些數(shù)據(jù)處理的具體方式我們不太清楚,所以此文中不會進行探究。
大數(shù)據(jù)可以通過下面的三個特點相協(xié)調(diào)而定義
(一)Volume(數(shù)量)。
大數(shù)據(jù)中的“大”并沒有一個嚴格意義的標準,就目前的情況來說,具體指的就是幾十TB(1TB=1024GB)到幾PB(1PB=1024TB)這樣的數(shù)量級。但是隨著時代的發(fā)展和互聯(lián)網(wǎng)技術(shù)的更新,這個數(shù)量級也在不斷的變化。目前來看我們的數(shù)據(jù)總量在不斷的變大,但是我們能夠處理的數(shù)據(jù)比例在逐漸的減少。在今后的探索道路中,怎樣高效率的處理大比例的大數(shù)據(jù)是當今的一個主要的問題。
(二)Variety(種類、多樣性)
這里所指的多樣性指的是所有數(shù)據(jù)的類型。通常我們可能會認為數(shù)據(jù)是Excel中的數(shù)字、Word中的文字圖片還有各種各樣的視頻等。隨著社會的發(fā)展,電子產(chǎn)品設備的利用越來越廣泛,其產(chǎn)生的數(shù)據(jù)類型也是多種多樣,比如:瀏覽網(wǎng)上商品時留下的瀏覽記錄、查詢車票時產(chǎn)生的購買記錄、訪問其他人空間時產(chǎn)生的訪問記錄,甚至是道路旁邊和路口的電子攝像頭所拍到的視頻信息都可以成為我們分析的目標。由于這類數(shù)據(jù)沒有關(guān)聯(lián)任何的其他數(shù)據(jù),如果直接想從信息中得到其他有用的信息,存在一定的挑戰(zhàn)。
(三)Velocity(速度)
數(shù)據(jù)發(fā)生和換新的次數(shù)也是衡量大數(shù)據(jù)的一個重要的條件。同存儲和搜集的數(shù)據(jù)量和類別都發(fā)生了變化,產(chǎn)生和處理數(shù)據(jù)的速度也在變化。以上所指的數(shù)據(jù)速度不僅僅是指數(shù)據(jù)產(chǎn)生和增長的速度,更應該考慮數(shù)據(jù)進行流通的速度。我們對此進行分析時,最主要的任務就是在數(shù)據(jù)變化過程中對數(shù)據(jù)的數(shù)量和種類進行多樣化的分析,而不是分析一個一成不變的數(shù)據(jù)。
二、大數(shù)據(jù)在生活中的具體應用
大數(shù)據(jù)在我們生活中已經(jīng)有了很多實際的應用,但是我們并沒有過多地關(guān)注到。本段中我們會通過生活中的幾個小例子來講述大數(shù)據(jù)在平時生活中的應用。
當我們點擊進入一個網(wǎng)絡購物平臺的時候,后臺會記錄你所登錄時的IP地址,簡單來講IP地址就是你在互聯(lián)網(wǎng)世界中的門牌號,它與你登沒登錄賬號沒有直接的聯(lián)系,當然當你登錄了這個賬號,這個信息也更加的透明了。
當我們在搜索引擎中查找一個東西時,搜索引擎同時也會記錄我們的瀏覽行為,每當搜索一個實物的時候,系統(tǒng)都會主動的給我們一個標簽。我們在搜索引擎中搜索的次數(shù)多了之后,我們自己所占有的標簽頁也變得多了。由此可見,系統(tǒng)可以通過我們搜索的一系列行為來給我們推薦我們感興趣的產(chǎn)品。
當我們在搜索出來的待選項中點擊一部分商品,系統(tǒng)會主動的記錄我們所點擊的商品,然后系統(tǒng)會記錄你選擇的商品的大體價位、使用方法等一些相關(guān)聯(lián)的信息,這些信息結(jié)合起來就是一個用戶對商品的喜愛的標簽。如果當你再次進入這個網(wǎng)站時,系統(tǒng)會根據(jù)標簽自動的給你推送你所喜愛的商品??梢怨?jié)省大量的時間。這就是大數(shù)據(jù)在我們生活中的實際應用的例子。
三、大數(shù)據(jù)的發(fā)展形式
隨著智能手機的普及和互通式網(wǎng)絡的發(fā)展,數(shù)據(jù)的采集逐漸趨向于自動化,所采集的數(shù)據(jù)量必定會加大。在這個信息越來越透明的時代中,我們基本可以不用花費任何的費用便可得知國家和地方政府的一些形勢與政策以及平時我們需要的地圖信息和社交媒體中的一些數(shù)據(jù)[2]。
另外一個方面,相對于企業(yè)而言,有一些數(shù)據(jù)(比如競爭對手中的顧客的購買記錄)是無法得到的。從商場的戰(zhàn)略角度來說,獲取其他公司的數(shù)據(jù)顯得尤為重要,這能夠得知自己公司與對手存在什么樣的差距,購買顧客有什么的不同。如果自己有大量的資源,在這個數(shù)據(jù)化的時代中會占有得天獨厚的優(yōu)勢,而他們要做的就是在這些巨大資源中挖掘內(nèi)在的價值。
總而言之,未來的大數(shù)據(jù)會將信息變得更加的透明化,通過對數(shù)據(jù)的分析更好的確定自己的優(yōu)勢。
總結(jié):
本文從大數(shù)據(jù)的定義出發(fā),講述了大數(shù)據(jù)的特點和在日常生活中的應用,并對未來的發(fā)展進行了預測,也提醒同學們時刻關(guān)注這類的熱點。
參考文獻:
[1]大開眼界新視角——美國歐幾里德系統(tǒng)公司 [期刊論文] -2017年13期
[2] 黃昭文 .VoLTE 端到端客戶感知評估方法的研究 [A].TD 產(chǎn)業(yè)聯(lián)盟、《移動通 信》雜志社.面向5G的LTE 網(wǎng)絡創(chuàng)新研討會(2017)論文集[C].TD產(chǎn)業(yè)聯(lián)盟、 《移動通信》雜志社,2017 :5