国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新興媒介技術背景下的大數(shù)據(jù)再認知

2019-07-11 05:03趙鵬
新媒體研究 2019年9期
關鍵詞:相關性大數(shù)據(jù)

趙鵬

摘 ?要 ?近年來,眾多新興媒介科技概念背后的技術指向都是基于大數(shù)據(jù)技術,這些科技概念正以極快地速度進入到我們的生活中。作為基礎性技術指向的大數(shù)據(jù),明確其概念是正確運用它的前提和基礎。文章從數(shù)據(jù)的發(fā)展歷程及大數(shù)據(jù)對信息分析帶來的“三個轉變”這兩個方面著手,反向推導出大數(shù)據(jù)的樣本量應為全體樣本數(shù)據(jù),同時應具備既有性、多源性和實時性;面對全體數(shù)據(jù)的復雜性不應刻意追求數(shù)據(jù)的精確性;大數(shù)據(jù)所呈現(xiàn)出兩個變量間的相關性關系某種程度上可以代替因果關系。

關鍵詞 ?大數(shù)據(jù);媒介技術;全體樣本;相關性

中圖分類號 ?G2 ? ? ?文獻標識碼 ?A ? ? ?文章編號 ?2096-0360(2019)09-0024-02

人類總是在制造一些新的概念,并且對其賦予新的意義,然后使用它、利用它、魔幻它,最后重新認識它,周而復始地進行著我們對這個世界的認知升級。近年來,媒介科技領域出現(xiàn)了很多新興的概念例如“人工智能”“數(shù)據(jù)新聞”“智媒體”等,這些熱點媒介技術以極快地速度進入到我們的生活,成為我們討論的話題和研究的對象。分析這些新興概念后可以得出,它們背后的技術指向都是基于大數(shù)據(jù)技術,或與其有著很高的關聯(lián)度。大數(shù)據(jù)正逐漸成為推動這個時代不斷向前發(fā)展的基礎性技術,在理解、認知、運用它之前,我們有必要對其追本溯源、厘清概念。

1 ?關于大數(shù)據(jù)的界定

目前,學界與業(yè)界基于大數(shù)據(jù)的復雜性并沒有給出一個明確的界定,大多都為描述性的概念為主。麥肯錫全球研究所把大數(shù)據(jù)描述為一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征[1]。它對大數(shù)據(jù)的描述是以數(shù)據(jù)本身為主體,在數(shù)據(jù)規(guī)模上提出了海量化,在數(shù)據(jù)類型上提出了多樣化,把數(shù)據(jù)流轉迅速和價值密度低作為其特點。Gartner在其研究報告中提出:大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[2]。它是從數(shù)據(jù)運用的角度上提出了運用新的處理模式才能恰當?shù)睦么髷?shù)據(jù)。以上兩種概念從不同維度對大數(shù)據(jù)做出了解釋,但并不全面與明確。筆者認為,對于大數(shù)據(jù)的界定首先應從數(shù)據(jù)發(fā)展的歷程著手,找出大數(shù)據(jù)區(qū)別于其他傳統(tǒng)數(shù)據(jù)形態(tài)的主要特征。然后再從數(shù)據(jù)的來源、數(shù)據(jù)的分析方法與數(shù)據(jù)的解釋應用三個方面得出對大數(shù)據(jù)的判定與理解標準,由此基礎上再對大數(shù)據(jù)做一個相對完善的界定。

2 ?數(shù)據(jù)的發(fā)展及大數(shù)據(jù)的特征

2.1 ?數(shù)據(jù)的發(fā)展

收集、整理分析大量的數(shù)據(jù)一直以來都是一個比較難以真實、準確完成的事情,學者涂子沛以美國為主體,以統(tǒng)計學為參照,把數(shù)據(jù)的發(fā)展劃分為七個時代[3]。在初數(shù)據(jù)時代中,美國建國初期為了解決政治體制與權力分配的問題,采取了以逐一清點人頭的方式開始了美國第一次人口普查,由于在普查中一些人的不配合和瞞報以及普查人員的工作疏忽,這份報告在一開始便受到了廣泛的質疑。在內戰(zhàn)時代、鍍金時代中,由于問卷問題的細化和人口的增長,數(shù)據(jù)量急速增多,普查工作耗時多年。在抽樣時代中,美國當時統(tǒng)計界的領袖人物喬治·蓋勒普用“科學抽樣”的方法,憑借5 000人的樣本量打敗了《文學文摘》240萬人的調查,準確預測出了羅斯福當選為美國總統(tǒng)。在開放時代中,他闡述了數(shù)據(jù)的開放是逐步形成且不可逆轉的。在大數(shù)據(jù)時代中,他提出了大數(shù)據(jù)不僅包含結構性數(shù)據(jù),其還應包括文字、圖片、音頻、視頻等非結構性的數(shù)據(jù),這種非結構性的數(shù)據(jù)在某些數(shù)據(jù)類型中的分析將會呈現(xiàn)為實時性等觀點。

數(shù)據(jù)的發(fā)展起始于一味追求數(shù)據(jù)量的增加階段。在這一階段中,數(shù)據(jù)量的增加并不能增強結果的準確性。對于龐雜的研究對象來說,我們的做法通常是對數(shù)據(jù)樣本進行結構性的優(yōu)化,由此數(shù)據(jù)的發(fā)展進入了憑借抽取較少的樣本量,以達到獲取較大信息量的抽樣時代。在這一階段中,由于干擾抽樣樣本收集和分析的客觀性因素較多,所以導致研究結果準確性不足的現(xiàn)象。這一現(xiàn)象究其根本是因為數(shù)據(jù)的收集與處理受限于當時的技術手段,我們難以掌握全體數(shù)據(jù)。隨著技術的進步,當前的某些領域已經(jīng)可以收集到全體數(shù)據(jù),具備了分析海量數(shù)據(jù)的能力,我們已經(jīng)初步進入了大數(shù)據(jù)時代。

2.2 ?大數(shù)據(jù)的特征

大數(shù)據(jù)的邏輯起點起始于統(tǒng)計學并在其參照下不斷發(fā)展,它與其他數(shù)據(jù)發(fā)展階段相比較,在樣本數(shù)據(jù)為全體數(shù)據(jù)的基礎上,從數(shù)據(jù)來源的角度可初步得出大數(shù)據(jù)的三個基本特征。首先是“既有性”。既有性就是指非人工清點、非抽樣得出的一種數(shù)據(jù),是一種客觀存在、客觀產(chǎn)生的數(shù)據(jù)形態(tài),它排除了在樣本收集和數(shù)據(jù)分析時的一些干擾因素。其次是“多源性”。多源性是指數(shù)據(jù)來源非單一,對于某一研究對象來說,測量數(shù)據(jù)、非結構化數(shù)據(jù)等都應作為不可或缺的數(shù)據(jù)來源。第三是“實時性”,由于某些數(shù)據(jù)是實時產(chǎn)生的,所以基于對某一動態(tài)樣本的分析應當具有實時性。

3 ?大數(shù)據(jù)的判定與理解標準

維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代》一書中提出了大數(shù)據(jù)的精髓在于我們分析信息時的“三個轉變”。第一個轉變?yōu)椋翰皇请S機樣本,而是全體數(shù)據(jù)[4]27。這一轉變隨著科學技術的不斷進步和摩爾定律的不斷顯現(xiàn),使得我們有了掌握某一研究對象全體數(shù)據(jù)的可能。第二個轉變?yōu)椋翰皇蔷_性,而是混雜性[4]45。一方面,非結構性數(shù)據(jù)的難以整合所造成的現(xiàn)實困境使得我們不得不暫時忽視其所產(chǎn)生的誤差。另一方面,基于數(shù)據(jù)樣本量的提升和不同數(shù)據(jù)間的相互驗證會不斷提高數(shù)據(jù)的精確性。所以大數(shù)據(jù)得出的“非精確結論”會比其他統(tǒng)計方法得出的“精確結論”更加趨向于準確。第三個轉變?yōu)椋翰皇且蚬P系,而是相關關系[4]67。用數(shù)據(jù)變量間的相關性代替因果性是舍恩伯格提出的在應用大數(shù)據(jù)所得出結論后,我們應具備的思維

模式。

依據(jù)在大數(shù)據(jù)時代中分析信息時的“三個轉變”,首先,我們可以反向推導得出大數(shù)據(jù)界定的判定條件為大數(shù)據(jù)的樣本量應為全體樣本數(shù)據(jù)。其次,我們在理解大數(shù)據(jù)時應該認識到大數(shù)據(jù)時代的“非精確性”比其他統(tǒng)計方法所得出的精確結論更加趨向于準確。最后,應用大數(shù)據(jù)所得出的兩個量化了的變量之間所存在的強相關系,會比我們認為的兩個看似為因果關系變量的弱相關關系更加趨向于

真實。

4 ?結論

通過對大數(shù)據(jù)基本特征的分析和對大數(shù)據(jù)判定與理解的探究,筆者認為大數(shù)據(jù)是在掌握被研究對象全體數(shù)據(jù)的前提下,對多個變量進行相關性分析的數(shù)據(jù)研究方法。對被研究對象的全體數(shù)據(jù)來說,其還應當具備既有性、多源性和全體性,對動態(tài)樣本的分析還應當具備實時性。我們在理解大數(shù)據(jù)時應轉變我們的認知觀念,對于大數(shù)據(jù)所呈現(xiàn)的非精確性與相關關系給予足夠的寬容與理解。

大數(shù)據(jù)作為“人工智能”“數(shù)據(jù)新聞”“智媒體”等新興媒介技術概念背后的技術指向,在眾多領域發(fā)揮著重要作用。值得注意的是,在現(xiàn)階段某些數(shù)據(jù)樣本從來源上看還難以具備既有性、多源性與全體性,對動態(tài)樣本的分析還難以做到實時挖掘與分析。數(shù)據(jù)樣本存在的先天缺陷,會導致所得出的結論與真相產(chǎn)生偏離,所以我們現(xiàn)在所處的數(shù)據(jù)發(fā)展階段是介于數(shù)據(jù)逐步開放環(huán)境下的抽樣時代與大數(shù)據(jù)時代之間的數(shù)據(jù)發(fā)展階段,這一階段筆者將它稱之為“初級大數(shù)據(jù)階段”。在這一階段中,抽樣的方法與大數(shù)據(jù)應用將同時存在。我們只有在分清二者的基本概念與了解二者的前提條件之后才能依據(jù)其各自的特點對其得出的結論做出正確的判斷,也只有這樣我們這個時代才不會被“偽大數(shù)據(jù)”所

綁架。

參考文獻

[1]Beyer,Mark:“Gartner Says Solving‘Big DataChallenge Involves More Than Just Managing Volumes of Data",Gartner, 10 July 2011.

[2]See McKinsey&Company Report:”Big Data:The Next Frontier for Innovation, Competition, and Productivity",F(xiàn)ujitsu North America Technology Forum,January 25,2012.

[3]涂子沛.數(shù)據(jù)之巔:大數(shù)據(jù)革命,歷史、現(xiàn)實與未來[M].北京:中信出版社,2014.

[4]維克多·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013:27,45,67.

猜你喜歡
相關性大數(shù)據(jù)
基于Kronecker信道的MIMO系統(tǒng)通信性能分析
小兒支氣管哮喘與小兒肺炎支原體感染相關性分析
腦梗死與高同型半胱氨酸的相關性研究(2)
腦梗死與高同型半胱氨酸的相關性研究
會計信息質量可靠性與相關性的矛盾與協(xié)調
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
基于大數(shù)據(jù)背景下的智慧城市建設研究
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
決策有用觀下財務會計信息質量研究
宜章县| 瑞金市| 隆子县| 城步| 阳信县| 株洲市| 徐水县| 游戏| 自治县| 凉城县| 漳州市| 阿坝县| 阆中市| 庄浪县| 玛沁县| 高邑县| 陇南市| 思南县| 绥江县| 华坪县| 湘乡市| 龙井市| 灌南县| 教育| 珠海市| 本溪市| 若羌县| 孝昌县| 时尚| 双鸭山市| 阳东县| 沙雅县| 准格尔旗| 伊川县| 且末县| 沽源县| 项城市| 兴山县| 峡江县| 石台县| 望江县|