大可
世界排名第一的中國圍棋選手柯潔,與阿爾法狗大戰(zhàn)三個(gè)回合,三戰(zhàn)全輸。在人類棋手面前自信滿滿的柯潔,落下了眼淚。
面對網(wǎng)上千奇百怪的圖畫“試題”,不到半分鐘,小詩機(jī)就創(chuàng)作出一首詩,什么“雨引鳥聲過路上,日移花影到窗邊。賴有公園夏風(fēng)地,欣喜玩沙遍河山。”什么“啼鳥古藤古清壁,樹蔭花草磚墻旁。約公快活重來此,延納北風(fēng)盡一觴?!?哇哇哇,這不跟我們背的唐詩一個(gè)套路嗎?
這些機(jī)器人也太逆天了吧?
呵呵,只不過是大數(shù)據(jù)幫了它們的忙!
小鏈接:
阿爾法狗(Alpha Go)的“狗”是對英文“Go”的音譯,而“Go”在英文中不僅僅有走、離開等意思,還表示“圍棋”呢!
到處可見
大數(shù)據(jù)的作用到處可見。
十字路口的紅綠燈,多久轉(zhuǎn)換一次能讓道路更順暢?這要統(tǒng)計(jì)有多少車、多少行人經(jīng)過路口等數(shù)據(jù)。設(shè)置合理的紅綠燈,對降低交通事故也有很大作用,這要統(tǒng)計(jì)人們的開車習(xí)慣、忍耐等待過馬路的最長時(shí)間等。
公共場所的警力安排,則要統(tǒng)計(jì)不同時(shí)段的人流,如工作日、雙休日、各類國定假等。沒看到“熱門”假期連武警都在維持秩序嗎?
小詩機(jī)是“消化”了幾百位詩人的作品、跟詩詞有關(guān)的語文和景物知識、圖片識別方法等大量數(shù)據(jù),才會“看圖寫詩”。
小鏈接:警察“先知”
美國某小城的地圖,會根據(jù)“賊情”不斷畫出賊們出沒的動(dòng)向,在與小偷的較中,警察屢戰(zhàn)屢勝。這也是托了大數(shù)據(jù)的福。從大量信息中提煉出的數(shù)據(jù),讓犯罪行為無所遁形:竊賊通常出沒的社區(qū)、最有可能犯罪的時(shí)間段、犯罪的類型……
4步大數(shù)據(jù)
從信息到數(shù)據(jù)不是一蹴而就,有人說有10個(gè)步驟,有人說要8種方法。我們浮光掠影地看一看。
首先是從信息中采集數(shù)據(jù)。
自從有了互聯(lián)網(wǎng),人人都可發(fā)信息:公眾號、博客、微信、社交網(wǎng)絡(luò)聊天……這就是大數(shù)據(jù)的生長土壤。大數(shù)據(jù)講究的是數(shù)據(jù)的全體性、完整性,而不是以前常用的報(bào)刊摘錄、抽樣調(diào)查,這樣的數(shù)據(jù)才更有用。比如網(wǎng)上商城會持續(xù)收集人們的網(wǎng)購記錄、聊天記錄等。這需要有極速容納信息的設(shè)施。有些網(wǎng)上商城在“購物節(jié)”網(wǎng)絡(luò)癱瘓,影響了數(shù)據(jù)采集。
海量的信息有的有價(jià)值,有的是垃圾,讓信息變成有用的數(shù)據(jù),是第2步要做的事:將信息迅速分門別類歸入便于查詢的數(shù)據(jù)庫,同時(shí)“清洗”掉無用信息。想象一下中藥柜:各種藥材被收入各自的抽屜,雜質(zhì)則被拋棄。藥柜設(shè)計(jì)要滿足這樣的需要:可隨時(shí)根據(jù)藥方從抽屜中取材配藥。當(dāng)然,數(shù)據(jù)庫構(gòu)成要復(fù)雜多啦。
接下來是分析、統(tǒng)計(jì)數(shù)據(jù)。比如,某類人的購買熱點(diǎn),什么樣的優(yōu)惠會增強(qiáng)網(wǎng)購,某種商品購買量的變化……優(yōu)秀的分析、統(tǒng)計(jì)工具,會做到數(shù)據(jù)實(shí)時(shí)更新、秒級響應(yīng)。
最后一步是對數(shù)據(jù)的挖掘應(yīng)用。比如對于“網(wǎng)紅”商品,要挖掘與“網(wǎng)紅”原因、購買人群的年齡、季節(jié)等之間的關(guān)系。這要經(jīng)過大量的數(shù)據(jù)計(jì)算,才能得出結(jié)論。而根據(jù)結(jié)論及時(shí)調(diào)整,是網(wǎng)上商城成功的秘訣之一。
大數(shù)據(jù)與學(xué)習(xí)
全班同學(xué)聽同一位老師講課,考同樣的卷子。分?jǐn)?shù)高被認(rèn)為聰明、努力,分?jǐn)?shù)低的簡直與“差生”畫上等號。你再不服氣,說自己多努力也沒用。
別泄氣,大數(shù)據(jù)出招了。
有家公司建立的學(xué)習(xí)平臺,無論你是花幾分鐘還是幾個(gè)小時(shí)在上面,它都會跟蹤收集信息,并通過答題情況來分析用戶的學(xué)習(xí)方式,統(tǒng)計(jì)大多數(shù)人會對哪些問題困惑,哪類人群容易犯某些錯(cuò)誤等。比如,他們發(fā)現(xiàn)說西班牙語的人要學(xué)好英語,有些詞應(yīng)該晚點(diǎn)學(xué),于是調(diào)整了課程。
這樣看來,分?jǐn)?shù)低很可能并不是你不努力,而是學(xué)習(xí)方式不對。當(dāng)有了可靠的大數(shù)據(jù)依據(jù)后,教育方法將會有所改變。
輝煌的明天
早期的阿爾法狗“吃”了人類幾百萬個(gè)棋譜,用獲得的大量數(shù)據(jù)進(jìn)行訓(xùn)練,掌握了各種最有勝率的棋招。
后來的阿爾法狗拋棄了人類棋譜,只學(xué)習(xí)圍棋規(guī)則,然后自己跟自己下,憑借人類望塵莫及的運(yùn)算速度,迅速積累了大量棋譜數(shù)據(jù)。隨后,阿爾法狗就像一個(gè)真正的人類棋手那樣,運(yùn)用多種“深度學(xué)習(xí)”模式,一邊拋棄那些明顯的“蠢招兒”,一邊推演、判斷局勢,擁有了最好的、甚至人類從未想到過的棋路,直逼得柯潔潸然淚下。
發(fā)現(xiàn)沒有,大數(shù)據(jù)進(jìn)入了新旅程:數(shù)據(jù)庫不依賴信息搜集,而是來源于“機(jī)器學(xué)習(xí)”。超越了人類的信息提供,大數(shù)據(jù)是否將走向更快、更多和更強(qiáng)?