国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)的奧秘

2017-03-10 18:12張澤玲
科學(xué)Fans 2017年1期
關(guān)鍵詞:例子分支習(xí)題

張澤玲

不可或缺的算法

要想弄明白機(jī)器學(xué)習(xí),我們必須得了解計(jì)算機(jī)科學(xué)里一個(gè)重要的概念:算法。什么是算法呢?舉個(gè)“栗子”,如果我們要算自然數(shù)1到100的和,既可以1+2+3+……+100 這樣一步步計(jì)算,也可以像數(shù)學(xué)家高斯小時(shí)候那樣,機(jī)智地用(1+100)x 50來(lái)計(jì)算。對(duì)于同一個(gè)數(shù)學(xué)計(jì)算問(wèn)題,不同的計(jì)算方法就可以稱(chēng)之為一種“算法”。計(jì)算機(jī)科學(xué)中,科學(xué)家們經(jīng)常要考慮,對(duì)于某個(gè)問(wèn)題用哪種算法又快又準(zhǔn)。對(duì)某些問(wèn)題,如果現(xiàn)有的算法中沒(méi)有高效的算法,計(jì)算機(jī)科學(xué)家們還需要為該類(lèi)問(wèn)題設(shè)計(jì)新的算法。聽(tīng)到這里,可能你會(huì)覺(jué)得有點(diǎn)疑惑:關(guān)于算法的研究感覺(jué)更像是數(shù)學(xué)研究啊?沒(méi)錯(cuò),你的感覺(jué)是對(duì)的,深厚的數(shù)學(xué)功底確實(shí)有利于算法研究,比如計(jì)算機(jī)科學(xué)的兩位祖師爺阿蘭·圖靈和馮·諾依曼,他們也都是厲害的數(shù)學(xué)家,所以算法研究本身確實(shí)也可以歸類(lèi)為應(yīng)用數(shù)學(xué)。有了對(duì)算法的基本概念,我們就可以說(shuō)機(jī)器學(xué)習(xí)其實(shí)是一類(lèi)算法的統(tǒng)稱(chēng)。

機(jī)器學(xué)習(xí)的三大分支

由于訓(xùn)練方法和應(yīng)用領(lǐng)域的不同,機(jī)器學(xué)習(xí)主要有三個(gè)分支,分別是監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。它們各不相同,依靠著各自的特點(diǎn)在人工智能研究領(lǐng)域中大顯身手。

第一分支:監(jiān)督學(xué)習(xí)(Supervised Learning)

所謂的監(jiān)督學(xué)習(xí),其實(shí)就像老師沒(méi)講知識(shí)點(diǎn),先給我們留作業(yè)題讓我們自己學(xué)著做,然后再出個(gè)測(cè)試看我們學(xué)習(xí)的效果。這個(gè)過(guò)程中,我們會(huì)給程序一個(gè)數(shù)據(jù)集,稱(chēng)之為訓(xùn)練集,其中一部分稱(chēng)為例子,相當(dāng)于習(xí)題;一部分稱(chēng)為目標(biāo),相當(dāng)于答案。然后設(shè)定一個(gè)函數(shù)模型,讓程序不斷把訓(xùn)練集的例子代入函數(shù)模型,算答案,對(duì)答案。算的答案不對(duì),程序就去調(diào)整這個(gè)函數(shù)模型里的某些參數(shù),再重復(fù)之前的過(guò)程,直到能得出較高的正確率。 接著再給程序一個(gè)測(cè)試集,相當(dāng)于考試。如果程序?qū)y(cè)試集里的例子算出的答案正確率也比較高,表明訓(xùn)練成功。在監(jiān)督學(xué)習(xí)的訓(xùn)練過(guò)程中,用到了許多數(shù)學(xué)里的回歸近似方法。當(dāng)然,具體應(yīng)用中的數(shù)學(xué)模型并不只是回歸這樣簡(jiǎn)單,還包括一些方法來(lái)避免訓(xùn)練集本身帶來(lái)的偏差,就好像老師給你的習(xí)題有答案是錯(cuò)的,這些方法會(huì)避免錯(cuò)誤答案干擾AI的訓(xùn)練。在人工智能中,監(jiān)督學(xué)習(xí)主要被應(yīng)用于快速高效地教受AI現(xiàn)有的知識(shí)。例如在2016年3月打敗圍棋世界冠軍的著名AI,AlphaGo, 就是利用監(jiān)督學(xué)習(xí)來(lái)“記憶理解”上千萬(wàn)盤(pán)的人類(lèi)對(duì)弈棋譜。

第二分支:無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning)

無(wú)監(jiān)督學(xué)習(xí)說(shuō)起來(lái)比監(jiān)督學(xué)習(xí)更難一點(diǎn),因?yàn)檫@個(gè)過(guò)程非常像老師沒(méi)講知識(shí)點(diǎn)就給我們一堆沒(méi)有答案的習(xí)題,然后讓我們自己做,看我們能不能從中學(xué)到什么。再舉個(gè)“栗子”,假設(shè)我們還不知道貓、老虎、獅子、豹子這幾個(gè)動(dòng)物同屬于“貓科”,狼、狐貍、狗屬于犬科,但是經(jīng)過(guò)觀察,我們發(fā)現(xiàn)前種動(dòng)物在外形上都跟貓比較相似,后幾種都跟狗比較相似,所以我們可以猜測(cè)它們分別屬于兩個(gè)分類(lèi)。這個(gè)過(guò)程中并沒(méi)有什么人來(lái)“監(jiān)督”指導(dǎo)我們學(xué)習(xí),我們自己就得出了這兩種分類(lèi)。而計(jì)算機(jī)程序也有類(lèi)似的算法實(shí)現(xiàn)這個(gè)過(guò)程,我們稱(chēng)之為“聚類(lèi)分析”。 無(wú)監(jiān)督學(xué)習(xí)還有另一類(lèi)任務(wù)是尋找所給數(shù)據(jù)例子之間的關(guān)系,比如說(shuō),根據(jù)一個(gè)人的購(gòu)物記錄,算出他買(mǎi)了牛奶和黃油以后有多大的可能還會(huì)買(mǎi)面包,得出了這個(gè)概率以后,下一次這個(gè)人買(mǎi)了牛奶和黃油,程序就可以預(yù)測(cè)這個(gè)人會(huì)不會(huì)買(mǎi)面包。從廣義上來(lái)講,無(wú)監(jiān)督學(xué)習(xí)在AI應(yīng)用中的內(nèi)容并不僅限于此,比如說(shuō),目前的無(wú)監(jiān)督學(xué)習(xí)都需要讓程序從比較大量的數(shù)據(jù)里學(xué)習(xí)得到規(guī)律,我們希望AI像人一樣只通過(guò)很少的例子得出可靠的結(jié)論。但是由于我們本身對(duì)人類(lèi)學(xué)習(xí)思維活動(dòng)的認(rèn)知還非常有限,計(jì)算機(jī)科學(xué)家在尋找新的算法和方法模擬人類(lèi)“無(wú)監(jiān)督學(xué)習(xí)”過(guò)程中依舊困難重重。

第三分支:強(qiáng)化學(xué)習(xí)(Reinforcement Learning)

強(qiáng)化學(xué)習(xí),有點(diǎn)像平時(shí)老師讓我們用學(xué)到的知識(shí)去解決某些答案并不確定的復(fù)雜問(wèn)題。比如說(shuō),我們雖然下棋前就熟知了五子棋的規(guī)則,也知道一些基本的下棋策略,但是在下五子棋的過(guò)程中,我們每下一步之前,還是需要猜測(cè)一下對(duì)手會(huì)怎么走,自己下一步如何走,來(lái)評(píng)估下這一步的優(yōu)劣。我們下棋這個(gè)過(guò)程就是一個(gè)強(qiáng)化學(xué)習(xí)的過(guò)程。同時(shí)我們也有這樣的體驗(yàn):下棋盤(pán)數(shù)多了,之后再下棋的速度會(huì)變快,錯(cuò)誤也會(huì)變少。讓我們?cè)?AlphaGo上具體感受一下:AlphaGo利用監(jiān)督學(xué)習(xí)參照人類(lèi)的走法大致學(xué)會(huì)了預(yù)測(cè)下一步,但是缺乏實(shí)戰(zhàn)經(jīng)驗(yàn),于是計(jì)算機(jī)科學(xué)家讓兩個(gè)非監(jiān)督學(xué)習(xí)下建立的AlphaGo互相下棋并不斷調(diào)整,看哪邊下贏了就保留勝方的模式和參數(shù),這樣下過(guò)3000萬(wàn)盤(pán)后,AlphaGo便通過(guò)“左右互搏”提高了“實(shí)戰(zhàn)能力”。強(qiáng)化學(xué)習(xí)這一方法背后的數(shù)學(xué)原理,與監(jiān)督/非監(jiān)督學(xué)習(xí)略有差異。監(jiān)督/非監(jiān)督學(xué)習(xí)更多地應(yīng)用了統(tǒng)計(jì)學(xué),而強(qiáng)化學(xué)習(xí)更多地結(jié)合了離散數(shù)學(xué)、隨機(jī)過(guò)程這些數(shù)學(xué)方法。在強(qiáng)化學(xué)習(xí)領(lǐng)域,依然還有很多未知的方法等待我們發(fā)現(xiàn)。

猜你喜歡
例子分支習(xí)題
從一道課本習(xí)題說(shuō)開(kāi)去
一道課本習(xí)題及其拓展的應(yīng)用
抓住習(xí)題深探索
《團(tuán)圓之后》:“戲改”的“一個(gè)鮮明的例子”
巧分支與枝
精心設(shè)計(jì)習(xí)題 構(gòu)建高效課堂
一類(lèi)擬齊次多項(xiàng)式中心的極限環(huán)分支
初中英語(yǔ)課堂妙用“舉例子”
用通俗的例子打比方
縮宮素聯(lián)合米索前列醇防治90例子宮收縮乏力性產(chǎn)后出血臨床觀察
衡阳市| 普陀区| 漳州市| 那坡县| 胶南市| 香河县| 阳曲县| 密云县| 石阡县| 万盛区| 蒙山县| 关岭| 汨罗市| 英山县| 临洮县| 西乌| 嘉义市| 广宗县| 赞皇县| 沧州市| 万安县| 托克托县| 弋阳县| 兴化市| 博湖县| 平果县| 延吉市| 鄂伦春自治旗| 东阳市| 九龙坡区| 阜城县| 松潘县| 科尔| 常熟市| 都江堰市| 秭归县| 关岭| 龙井市| 南召县| 镇康县| 蒙自县|