国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

更多的數(shù)據(jù),更大的麻煩

2017-12-06 06:14:02賀琴川
大科技·百科新說 2017年10期
關(guān)鍵詞:數(shù)據(jù)量權(quán)重決策

賀琴川

大數(shù)據(jù)也有大麻煩

我們身處于這樣一個數(shù)據(jù)爆炸的時代,尤其是最近這些年來我們生產(chǎn)的數(shù)據(jù)量和分析量都在激增。據(jù)統(tǒng)計分析,過去的30年里,每兩年,世界上的數(shù)據(jù)量就增加了約10倍——這一比率甚至使得摩爾定律都相形見絀。而現(xiàn)在世界上90%的數(shù)據(jù)是在過去兩年里創(chuàng)造出來的。對于數(shù)據(jù)分析來說,這是偉大的,現(xiàn)在的我們得到了比人類歷史上任何時候都要多得多的數(shù)據(jù)供我們分析和操縱。很了不起不是嗎?但是這就代表著我們可以高枕無憂地隨意使用這些數(shù)據(jù)了嗎?

在大數(shù)據(jù)時代,人們越來越傾向于“用數(shù)據(jù)說話”。由數(shù)據(jù)驅(qū)動的決策被認為是一種明智的做法,但數(shù)據(jù)的真實性又會很大程度上影響決策的正確與否。因為數(shù)據(jù)是有偏見的,或者說人類收集和分析數(shù)據(jù)時是有偏見的。數(shù)據(jù)并不是越多越好,魚龍混雜的結(jié)果就是可能讓我們更加難以接近真相。

在許多分析算法中,篩選信息起著非常重要的作用。如果沒有篩選,我們可能會經(jīng)歷“無用輸入/無用輸出”的情形。但是篩選的依據(jù)是什么?是以數(shù)量決定權(quán)重嗎?毋庸置疑,肯定是越近期的事件可參考的數(shù)據(jù)越多,如果將此定為高權(quán)重的部分,那么我們很容易得到一個不太準確的結(jié)論,因為我們拋棄了那些因為年代久遠而被認為是低權(quán)重的重要事實。

最新的就一定更好?

喜新厭舊似乎是我們每個人的天性,我們對他人或是事件的最新認知往往會在做判斷時占據(jù)主要的地位。比如兩個本來很要好的朋友,小A一直很照顧小B。小A最近因為其他事情上的不順而好幾次把氣撒在小B身上。小B也很是生氣,覺得小A根本就沒把自己當朋友,兩人關(guān)系破裂,形同陌路。為何只是小小的幾次不和就會對一段親密關(guān)系造成如此之大的殺傷力?原因在于我們對近期發(fā)生的事情的印象過于深刻,反而忽略了以往存在的事實。

如果世界上90%的數(shù)據(jù)都是最近兩年里創(chuàng)造出來的,那么我們的數(shù)據(jù)就存在固有的“近因偏差”。這種認知偏差讓人們傾向于認為,我們在近期觀察到的趨勢和模式將在未來繼續(xù)存在。因此人們會增加對近期所發(fā)生的事件的重視,并假設(shè)這些模式會與即將要發(fā)生的事情有直接的聯(lián)系,并以此作為制定決策的關(guān)鍵。

比如,你所居住的城市最近幾年的夏天都溫度較低,你就認為當?shù)氐臍夂蛟谧兝?,但很可能明年氣溫就回升了;你看到這支股票近期的勢頭很好,一直在上漲,你可能會預測它會一直這樣無限期地持續(xù)下去,而這顯然也是不太可能的;尤其是,在中國,房價已經(jīng)連續(xù)上漲了幾十年,幾乎已經(jīng)沒人相信中國房價未來會跌了。

雖然歷史會重演,但近期的表現(xiàn)并不能直接表明未來的成功或失敗。因此,重要的是,不要給一個信息不成比例的關(guān)注。當我們給我們的大數(shù)據(jù)系統(tǒng)塞進大量過多的近期數(shù)據(jù)時,數(shù)據(jù)分析將會被近因效應(yīng)極大地扭曲,很有可能你因此得出的預測結(jié)論還不如你擲硬幣來得可靠些。

如果想做出明智的決策,不僅要學會降低對近期表現(xiàn)的關(guān)注度,還要對以往的表現(xiàn)考慮得多一些。僅僅通過是六個月或一年的表現(xiàn)去分析可能并不扎實,如果不懂得從更遙遠的過去收集更多的信息數(shù)據(jù),反過來,就會誤導自己做出草率的決定,成為目光短淺之人。

學會刪除數(shù)據(jù)更為重要

當然,最新的數(shù)據(jù)不一定是最好的,以往的老數(shù)據(jù)也同樣不等于就是絕對有用的。關(guān)鍵是在時間的錘煉過程中,學會刪除有缺陷和無效的數(shù)據(jù)。

比如你是一個喜歡拍照的人,時間久了你的手機相冊里會存有很多張照片。假設(shè)你手機的存儲空間是固定的,那么你就必須定期清理那些照片。你需要想想哪些是值得你留下來作為以后會回顧的相片,而哪些是你將來看都不會再看一眼的。如果你為了省事,只留下新照片,直接把那些老照片都刪除了,你可能會刪除許多珍貴的值得留念的照片,反而留下了一些無意義的照片。

在這個大數(shù)據(jù)的背景下,我們所擁有的數(shù)據(jù)集合,比以往的任何時刻對我們的研究所產(chǎn)生的影響都要大。而數(shù)據(jù)的科學性越弱,數(shù)據(jù)規(guī)模和數(shù)據(jù)的質(zhì)量就越可能呈現(xiàn)負相關(guān),此時時間本身就成為更加重要的過濾工具。我們?nèi)绻蛔屑氝x擇過去保存下來的有價值、有意義的事物,它們就會被迅速膨脹的信息洪流悄無聲息地吞沒掉。

因此,如果我們正在大數(shù)據(jù)中尋找一些可以告訴我們未來將會是如何發(fā)展的依據(jù),我們需要知道當前的數(shù)據(jù)中什么是重要的,我們需要沖洗掉那些不重要的東西。新鮮的事物更能吸引我們的眼球,但卻不一定重要,我們需要克服這一點。

我們常用的搜索工具的算法基本上還是偏向于新鮮事物的,越近期發(fā)生的越排得靠前,越容易被我們所看到。而那些以往的舊聞,很可能點擊進去后已經(jīng)變成了失效的網(wǎng)址。也許我們應(yīng)該考慮設(shè)計一個智能程序,使得信息系統(tǒng)能夠變通,懂得忽略不重要但卻是最近產(chǎn)生的信息。

大數(shù)據(jù)時代機遇與挑戰(zhàn)并存,我們要善于利用我們所擁有的數(shù)據(jù),應(yīng)該懂得只分析那些有意義的數(shù)據(jù),以質(zhì)為主而不是以數(shù)取勝。數(shù)據(jù)只會如滾雪球一般越來越大,懂得主動選擇放棄哪些事情,與選擇做何事同樣重要。

猜你喜歡
數(shù)據(jù)量權(quán)重決策
為可持續(xù)決策提供依據(jù)
基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
權(quán)重常思“浮名輕”
當代陜西(2020年17期)2020-10-28 08:18:18
高刷新率不容易顯示器需求與接口標準帶寬
寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
電子制作(2019年13期)2020-01-14 03:15:18
決策為什么失誤了
為黨督政勤履職 代民行權(quán)重擔當
基于公約式權(quán)重的截短線性分組碼盲識別方法
電信科學(2017年6期)2017-07-01 15:44:57
層次分析法權(quán)重的計算:基于Lingo的數(shù)學模型
河南科技(2014年15期)2014-02-27 14:12:51
高州市| 禹城市| 通江县| 武夷山市| 枞阳县| 长泰县| 太仆寺旗| 龙里县| 岳西县| 老河口市| 博乐市| 黎川县| 遂宁市| 台南市| 绥棱县| 鲁山县| 吐鲁番市| 巴彦淖尔市| 搜索| 荃湾区| 奎屯市| 韶关市| 威海市| 漳平市| 元氏县| 雷山县| 泗水县| 库伦旗| 八宿县| 宁化县| 通河县| 吉木乃县| 眉山市| 鄂托克前旗| 张家港市| 阳城县| 确山县| 水城县| 尼玛县| 文山县| 电白县|