国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從AlphaGo看深度學(xué)習(xí)

2016-05-14 16:51:18邱元陽(yáng)
中國(guó)信息技術(shù)教育 2016年7期
關(guān)鍵詞:棋手人機(jī)戰(zhàn)勝

邱元陽(yáng)

備受關(guān)注的世紀(jì)“人機(jī)大戰(zhàn)”終于落下帷幕,谷歌公司研發(fā)的圍棋程序AlphaGo經(jīng)過(guò)五番棋的激戰(zhàn),以4比1完勝圍棋世界冠軍韓國(guó)職業(yè)九段棋手李世石。

在AlphaGo贏得第一局的比賽時(shí),就激起了人們熱烈的討論,因?yàn)楹芏鄰氖氯斯ぶ悄苎芯康摹凹夹g(shù)派”也對(duì)電腦圍棋程序戰(zhàn)勝人類棋手沒(méi)有足夠的信心。但第一局的結(jié)果仍然讓人震驚,因?yàn)樵谖鍌€(gè)月前,AlphaGo的棋力水平也只是達(dá)到戰(zhàn)勝職業(yè)二段棋手的程度,人們吃驚的是它的棋藝水平提高的速度。

與20年前深藍(lán)在國(guó)際象棋人機(jī)大戰(zhàn)中戰(zhàn)勝世界冠軍卡斯帕羅夫不同,AlphaGo并非僅僅依賴強(qiáng)悍的計(jì)算能力和龐大的棋譜數(shù)據(jù)庫(kù)取勝,而是具有深度學(xué)習(xí)的能力,能在實(shí)戰(zhàn)和練習(xí)中不斷學(xué)習(xí)和積累經(jīng)驗(yàn),這已經(jīng)非常類似于人類棋手的成長(zhǎng)過(guò)程了,不過(guò)它成長(zhǎng)的速度非常之快。

普通大眾會(huì)認(rèn)為,機(jī)器人獲勝是因?yàn)樗鼉?nèi)部存儲(chǔ)有極為豐富的棋譜,以及很多一流棋手的經(jīng)驗(yàn),再配合它強(qiáng)大的邏輯判斷能力,是一群人對(duì)一個(gè)人的戰(zhàn)斗,是機(jī)器計(jì)算對(duì)人腦計(jì)算的碾軋,結(jié)果是必然的。這樣的歸納未免有些草率和簡(jiǎn)單,完全無(wú)視機(jī)器學(xué)習(xí)在程序中的作用。

機(jī)器學(xué)習(xí)(Machine Learning,ML)是一種讓計(jì)算機(jī)在事先沒(méi)有明確的程序的情況下做出正確反應(yīng)的能力,是計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身性能的一種方法,是人工智能的核心,也是使計(jì)算機(jī)具有智能的根本途徑。但是它仍然主要是使用歸納、綜合而不是演繹的方式來(lái)進(jìn)行學(xué)習(xí)。

早在1959年,塞繆爾的下棋程序就具有了學(xué)習(xí)能力,能在不斷對(duì)弈中改善自己的棋藝。這個(gè)程序已經(jīng)涉及到了關(guān)于學(xué)習(xí)的令人頭疼的哲學(xué)問(wèn)題,此后就有各種各樣的棋類程序誕生,演繹出一個(gè)又一個(gè)電腦程序戰(zhàn)勝人類棋手的傳說(shuō),不斷刷新博弈難度的記錄。

而圍棋,因?yàn)槠灞P(pán)的復(fù)雜性(大約10的172次方種狀態(tài),是計(jì)算機(jī)不可能窮盡的天文數(shù)字),則被看作是“人類智力的最后防線”,是僅存的人類能夠擊敗電腦的完全信息博弈游戲。AlphaGo的獲勝,宣告了機(jī)器學(xué)習(xí)的重大突破。

AlphaGo是一套為圍棋優(yōu)化的深度學(xué)習(xí)引擎,它使用了神經(jīng)網(wǎng)絡(luò)和蒙特卡羅算法,可以讓機(jī)器充分學(xué)習(xí),并能在不斷自我對(duì)決中提升水平。

深度學(xué)習(xí)(Deep Learning)的概念在10年前就已提出,又叫深層神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks),是機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域,通過(guò)建立模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦機(jī)制來(lái)解釋數(shù)據(jù)。深度學(xué)習(xí)提出了一種讓計(jì)算機(jī)自動(dòng)學(xué)習(xí)出模式特征的方法,有深度置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等不同的機(jī)器學(xué)習(xí)模型,但都需要大量的并行計(jì)算。非監(jiān)督貪心逐層訓(xùn)練算法可以解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題,卷積神經(jīng)網(wǎng)絡(luò)可以利用空間相對(duì)關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能,這些特點(diǎn)正適合用于復(fù)雜的博弈程序。

但是,在具有不確定性的對(duì)決中,即使深度學(xué)習(xí)也發(fā)揮不了作用,無(wú)法幫助程序來(lái)確定對(duì)手的狀態(tài)。

學(xué)習(xí)還不等同于思維,目前的人工智能還不可能具有思維、情感、道德等特點(diǎn),明顯區(qū)別于人的智能。人們對(duì)于人工智能的倫理?yè)?dān)憂和控制擔(dān)憂還為時(shí)過(guò)早。

也許若干年后,進(jìn)行人機(jī)大戰(zhàn)就是很可笑的事了,因?yàn)榭赡苣菚r(shí)機(jī)器的強(qiáng)悍程度是人根本無(wú)法相比的。當(dāng)然,這不是機(jī)器的進(jìn)步,而是人的進(jìn)步。

猜你喜歡
棋手人機(jī)戰(zhàn)勝
戰(zhàn)勝假日憂郁
人機(jī)“翻譯員”
戰(zhàn)勝“可怕”的一刻
從內(nèi)到外,看懂無(wú)人機(jī)
南都周刊(2021年3期)2021-04-22 16:43:49
2019年下半年男子棋手等級(jí)分
棋藝(2019年8期)2019-12-25 01:25:06
我戰(zhàn)勝了自己
“人機(jī)大戰(zhàn)”人類智慧遭遇強(qiáng)敵
海外星云(2016年7期)2016-12-01 04:17:50
未來(lái)深空探測(cè)中的人機(jī)聯(lián)合探測(cè)
太空探索(2016年5期)2016-07-12 15:17:58
90后棋手走在路上
金色年華(2016年8期)2016-02-28 01:40:27
戰(zhàn)勝美軍“絞殺戰(zhàn)”
軍事歷史(2004年4期)2004-11-22 06:50:08
五常市| 梨树县| 武鸣县| 阿图什市| 平定县| 江永县| 南召县| 汽车| 邛崃市| 东阿县| 淮北市| 仁化县| 科尔| 建湖县| 洪湖市| 黎平县| 广宗县| 浑源县| 娱乐| 灵丘县| 林西县| 岱山县| 永安市| 营口市| 太保市| 泸水县| 周口市| 颍上县| 叶城县| 荔波县| 忻州市| 资中县| 吉林省| 岳池县| 五台县| 许昌市| 托里县| 临猗县| 泰顺县| 沂水县| 姚安县|