蘭州大學(xué)信息科學(xué)與工程學(xué)院 郭 睿 宋忠江
人工智能是集控制論、信息論、計(jì)算機(jī)科學(xué)、神經(jīng)生理學(xué)、語(yǔ)言教育學(xué)、哲學(xué)、心理學(xué)、醫(yī)學(xué)、數(shù)理邏輯及模糊數(shù)學(xué)等多個(gè)學(xué)科領(lǐng)域互相滲透而成的交叉學(xué)科,其研究目標(biāo)是使機(jī)器更加智能,更具有人腦智慧,從而具有識(shí)別事物、學(xué)習(xí)知識(shí)、解決實(shí)際問(wèn)題的能力[1]。人工智能技術(shù)一般由認(rèn)知、預(yù)測(cè)、決策和集成解決方案這四個(gè)部分組成,它的研究領(lǐng)域也在不斷擴(kuò)大,研究的分支包括專家系統(tǒng)、機(jī)器學(xué)習(xí)、進(jìn)化計(jì)算、模糊邏輯、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等。
機(jī)器學(xué)習(xí)是人工智能研究的核心,也是使計(jì)算機(jī)具備人工智能的根本途徑。在信息時(shí)代,信息咆哮現(xiàn)象尤為顯著。網(wǎng)絡(luò)中每天都會(huì)生成海量的數(shù)字化數(shù)據(jù),如數(shù)字化的聊天記錄、網(wǎng)頁(yè)瀏覽記錄等。針對(duì)這些海量數(shù)據(jù),大數(shù)據(jù)處理方式必將成為研究的熱門話題。在這種數(shù)據(jù)爆炸的環(huán)境下,如何對(duì)海量數(shù)據(jù)進(jìn)行處理并依據(jù)嚴(yán)密的數(shù)學(xué)定理攝取其中有價(jià)值的信息顯得尤為重要,機(jī)器學(xué)習(xí)在日后的學(xué)科研究中必將獨(dú)有其重[2]。
機(jī)器學(xué)習(xí)是基于嚴(yán)格的數(shù)學(xué)理論經(jīng)眾多領(lǐng)域的學(xué)科交叉融合而成[2],其本質(zhì)是通過(guò)運(yùn)用計(jì)算機(jī)強(qiáng)大的運(yùn)算能力及數(shù)據(jù)處理能力,借由大批的數(shù)據(jù)進(jìn)行訓(xùn)練,使計(jì)算機(jī)具備自發(fā)模仿人類學(xué)習(xí)行為,通過(guò)學(xué)習(xí)獲取經(jīng)驗(yàn)和知識(shí),在不斷地改進(jìn)自身性能的同時(shí)實(shí)現(xiàn)人工智能的能力。針對(duì)某種情形或事物所采集的用于訓(xùn)練的數(shù)據(jù)樣本集是對(duì)其直觀上的描繪,其中包含著大量和該情形或事物相關(guān)的先驗(yàn)經(jīng)驗(yàn)和知識(shí)[3]。
機(jī)器學(xué)習(xí)的發(fā)展經(jīng)歷了三個(gè)階段——“只具有邏輯并不能使機(jī)器具有智能,具備智能的同時(shí)還必須兼具先驗(yàn)知識(shí)”的萌芽階段、“機(jī)器自發(fā)學(xué)習(xí)的設(shè)想逐漸成型,從樣本集中主動(dòng)提取經(jīng)驗(yàn)和知識(shí)成為可能”的發(fā)展階段、“機(jī)器學(xué)習(xí)成為一個(gè)獨(dú)立的學(xué)科分支并開(kāi)始迅速成長(zhǎng)”的機(jī)器學(xué)習(xí)算法呈現(xiàn)多元化的繁榮階段[2]。如今,機(jī)器學(xué)習(xí)持續(xù)高溫發(fā)展,并已衍生出了數(shù)據(jù)挖掘、生物信息學(xué)、深度學(xué)習(xí)、語(yǔ)音識(shí)別等許多分支,眾多機(jī)器學(xué)習(xí)算法被廣泛應(yīng)用到信息處理特別是互聯(lián)網(wǎng)時(shí)代所帶來(lái)的海量數(shù)據(jù)的分析處理當(dāng)中。
傳統(tǒng)的機(jī)器學(xué)習(xí)算法在指紋識(shí)別、基于HoG特征的物體檢測(cè)等范疇的運(yùn)用基本達(dá)到了商業(yè)化的要求或特定場(chǎng)景的商業(yè)化水平,但每前進(jìn)一步都異常艱難,直到深度學(xué)習(xí)算法的出現(xiàn)。
自2006年以來(lái),機(jī)器學(xué)習(xí)領(lǐng)域中的“深度學(xué)習(xí)”課題開(kāi)始受到學(xué)術(shù)界的普遍關(guān)注,到今天已經(jīng)成為互聯(lián)網(wǎng)大數(shù)據(jù)的人工智能的浪潮。深度學(xué)習(xí)的本質(zhì)是通過(guò)構(gòu)建具有海量的訓(xùn)練數(shù)據(jù)和許多隱層的機(jī)器學(xué)習(xí)模型,來(lái)學(xué)習(xí)更多有用的特征,從而最終提高分類或預(yù)測(cè)的準(zhǔn)確性。因此,“深度模型”是手段,“特征學(xué)習(xí)”是目的。從對(duì)實(shí)際應(yīng)用的貢獻(xiàn)來(lái)看,深度學(xué)習(xí)在語(yǔ)音圖像的智能識(shí)別和理解方面取得了驚人的進(jìn)展,從而推動(dòng)了人工智能和人機(jī)交互的大幅度前進(jìn),這可能是近這十年來(lái)機(jī)器學(xué)習(xí)領(lǐng)域最成功的研究方向[4]。
目前,業(yè)界有一種較為普遍的錯(cuò)誤的認(rèn)識(shí),即“深度學(xué)習(xí)最終可能會(huì)淘汰掉其他所有的機(jī)器學(xué)習(xí)算法”。這種意識(shí)的出現(xiàn)主要是因?yàn)楫?dāng)前深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理方面的應(yīng)用遠(yuǎn)遠(yuǎn)超過(guò)其他傳統(tǒng)的機(jī)器學(xué)習(xí)方法,并且媒體對(duì)深度學(xué)習(xí)進(jìn)行了眾多夸大的報(bào)道。深度學(xué)習(xí)并不意味著是機(jī)器學(xué)習(xí)的終點(diǎn),其目前主要存在著以下三個(gè)問(wèn)題:
其一,深度學(xué)習(xí)模型需要大批的訓(xùn)練數(shù)據(jù)才可以顯示出神奇的效果,但在現(xiàn)實(shí)生活中經(jīng)常會(huì)遇到小樣本問(wèn)題,此時(shí)深度學(xué)習(xí)方法無(wú)法入手,傳統(tǒng)的機(jī)器學(xué)習(xí)方法卻可以很好地解決;
其二,某些領(lǐng)域采用簡(jiǎn)單的傳統(tǒng)的機(jī)器學(xué)習(xí)方法就可以很好地解決,不必一定使用復(fù)雜的深度學(xué)習(xí)方法;
其三,深度學(xué)習(xí)的思想來(lái)源于人腦的啟發(fā),但絕對(duì)不是人腦的模擬,因?yàn)槿祟惖膶W(xué)習(xí)過(guò)程往往不需要大批的訓(xùn)練數(shù)據(jù)。
近年來(lái),機(jī)器學(xué)習(xí)在很多需要“智能”的領(lǐng)域都取得了非常大的成功,如信貸決策、醫(yī)學(xué)診斷、天氣預(yù)報(bào)、城鄉(xiāng)規(guī)劃設(shè)計(jì)、智慧教育、太空探索等。例如,在智慧教育方面,機(jī)器學(xué)習(xí)通過(guò)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化分析來(lái)發(fā)現(xiàn)新知識(shí),實(shí)現(xiàn)了在傳統(tǒng)教育中人工難以完成的功能,其應(yīng)用主要集中于學(xué)生建模、失學(xué)風(fēng)險(xiǎn)預(yù)警、學(xué)習(xí)行為預(yù)測(cè)、資源推薦和學(xué)習(xí)支持評(píng)測(cè)等方面[5];在城鄉(xiāng)規(guī)劃設(shè)計(jì)方面,機(jī)器學(xué)習(xí)對(duì)于非結(jié)構(gòu)性信息的提取和結(jié)構(gòu)性預(yù)測(cè)模型的結(jié)合,可對(duì)社會(huì)經(jīng)濟(jì)、交通運(yùn)輸、土地資源利用、產(chǎn)業(yè)發(fā)展等多目標(biāo)約束下的發(fā)展愿景進(jìn)行更精細(xì)的模擬推演,并逐步實(shí)現(xiàn)從靜態(tài)分裂的藍(lán)圖片段向動(dòng)態(tài)連續(xù)的協(xié)同化數(shù)字平臺(tái)成果的轉(zhuǎn)變,進(jìn)而將規(guī)劃師從繁重的素材梳理、編排、抄寫等高強(qiáng)度工作中解脫出來(lái),更好地發(fā)揮人類獨(dú)有的創(chuàng)意和思辨能力[6]。
同時(shí),機(jī)器學(xué)習(xí)也漸漸參與到計(jì)算機(jī)的“底層”研究設(shè)計(jì)中,如編譯器、處理器及軟件工程等方面的設(shè)計(jì)開(kāi)發(fā)工作都參照了機(jī)器學(xué)習(xí)理論,同時(shí)分布式系統(tǒng)、新的編程語(yǔ)言、面向機(jī)器學(xué)習(xí)的處理器芯片也已經(jīng)逐步開(kāi)始借鑒機(jī)器學(xué)習(xí)模型,從而對(duì)自身的邏輯設(shè)計(jì)模式進(jìn)行不斷學(xué)習(xí)和改進(jìn),眾多互聯(lián)網(wǎng)公司更是盡心竭力地興建相關(guān)實(shí)驗(yàn)室和招攬人才以研究機(jī)器學(xué)習(xí)的理論并將其投入實(shí)際應(yīng)用中[7]。
在機(jī)器學(xué)習(xí)模型方面,深度人工神經(jīng)網(wǎng)絡(luò)模型近年來(lái)取得了很大成功,關(guān)注度增長(zhǎng)非常迅速,但歷史發(fā)展中也同樣曾存在過(guò)神經(jīng)網(wǎng)絡(luò)的冷熱交替,因此從長(zhǎng)遠(yuǎn)來(lái)看機(jī)器學(xué)習(xí)的發(fā)展道路應(yīng)當(dāng)是多種模型優(yōu)勢(shì)互補(bǔ)、強(qiáng)強(qiáng)聯(lián)手、螺旋上升[7]。
機(jī)器學(xué)習(xí)的發(fā)展前景相當(dāng)可觀。人工智能技術(shù)受機(jī)器學(xué)習(xí)在眾多領(lǐng)域突破性發(fā)展的影響,已在實(shí)際生活中得到普遍應(yīng)用,并吸引了眾多專家學(xué)者積極投入其中并開(kāi)展研究,如近年來(lái)正在如火如荼開(kāi)展的人工智能醫(yī)療影像研究,這都是機(jī)器學(xué)習(xí)促進(jìn)人工智能技術(shù)推廣應(yīng)用的表現(xiàn)。
從當(dāng)前的趨勢(shì)來(lái)看,接下來(lái)機(jī)器學(xué)習(xí)的發(fā)展將主要集中在兩個(gè)方面展開(kāi)[2]:
其一是在神經(jīng)生物學(xué)方面,從人類自身出發(fā)找出大腦本身的生物學(xué)習(xí)機(jī)制,進(jìn)而繼續(xù)加強(qiáng)對(duì)人腦學(xué)習(xí)動(dòng)作的探索研究,最終實(shí)現(xiàn)對(duì)人腦自主學(xué)習(xí)體系的數(shù)字化呈現(xiàn)并應(yīng)用于機(jī)器學(xué)習(xí)領(lǐng)域;
其二是在算法方面,一方面開(kāi)展對(duì)現(xiàn)有算法的優(yōu)化和全新算法的開(kāi)發(fā),與此同時(shí)加強(qiáng)各類機(jī)器學(xué)習(xí)算法的聯(lián)系統(tǒng)一,避免使用單一算法導(dǎo)致限制系統(tǒng)性能情況的出現(xiàn);另一方面建立切實(shí)可行的算法應(yīng)用系統(tǒng),特別是結(jié)合當(dāng)下互聯(lián)網(wǎng)時(shí)代的背景,對(duì)多種學(xué)習(xí)算法的一體化和集成化進(jìn)行進(jìn)一步探索,使眾多的機(jī)器算法走出“象牙塔”。這兩個(gè)方面的進(jìn)步都將推動(dòng)人工智能技術(shù)的升級(jí),使其能夠脫離龐大數(shù)據(jù)庫(kù)和程序算法的限制。
雖然機(jī)器學(xué)習(xí)對(duì)未來(lái)社會(huì)的發(fā)展至關(guān)重要,但并不是沒(méi)有自己的挑戰(zhàn)。一方面,機(jī)器學(xué)習(xí)算法的開(kāi)發(fā)和部署在很大程度上都依賴于大量的計(jì)算和存儲(chǔ)資源來(lái)執(zhí)行其任務(wù),這種依賴關(guān)系使得它們?cè)趫?zhí)行時(shí)受限于大數(shù)據(jù)和云服務(wù)。因此,在執(zhí)行邊緣計(jì)算機(jī)集成解決方案時(shí)它們更具挑戰(zhàn)性。另一方面,機(jī)器學(xué)習(xí)在某些方面具有不透明性。隨著算法復(fù)雜化程度的提高,人類越來(lái)越難以解釋它們是如何做出決定的。在做出一些關(guān)鍵性決定時(shí),它們的透明性是非常重要的。此外還存在一些偏見(jiàn)問(wèn)題,機(jī)器學(xué)習(xí)往往會(huì)吸收它們?cè)诮邮苡?xùn)練時(shí)數(shù)據(jù)中包含的一些傾向與習(xí)慣,在某些情況下,它們的極深的嵌入度使得人類往往難以察覺(jué)和消除。
機(jī)器學(xué)習(xí)在推動(dòng)人工智能技術(shù)革命進(jìn)步的過(guò)程中提供了強(qiáng)大助力,必將在未來(lái)的信息化社會(huì)取得更為矚目的成就。對(duì)此,我認(rèn)為有以下趨勢(shì):
機(jī)器智能終將無(wú)法全面超越人類智能。隨著機(jī)器學(xué)習(xí)領(lǐng)域的不斷進(jìn)步,計(jì)算機(jī)借由其自身強(qiáng)大的數(shù)據(jù)運(yùn)算和存儲(chǔ)能力,對(duì)于完成學(xué)習(xí)人類歷史發(fā)展過(guò)程中所積累的完整知識(shí)的能力將會(huì)愈加強(qiáng)大,借助完整的知識(shí)庫(kù)進(jìn)行精細(xì)預(yù)測(cè)復(fù)雜事務(wù)和準(zhǔn)確判斷的能力將會(huì)全面超越人類。由此可推斷,將來(lái)不僅僅是簡(jiǎn)單瑣碎的手工、體力勞動(dòng)將會(huì)被機(jī)器完全取代,那些需要評(píng)估、判斷并預(yù)測(cè)復(fù)雜事務(wù)的工作如財(cái)務(wù)投資和企業(yè)管理等也很有可能被機(jī)器智能所取代。但同時(shí),與機(jī)器相比,人類的最大優(yōu)勢(shì)在于邏輯推理能力和想象創(chuàng)造力。盡管機(jī)器智能在未來(lái)很可能在某些方面完全超越人類智能,但目前現(xiàn)有的機(jī)器學(xué)習(xí)模型卻不能模仿人類的想象創(chuàng)造力,科學(xué)研究和發(fā)明創(chuàng)造仍將是人類的最大優(yōu)勢(shì),社會(huì)對(duì)每個(gè)人的知識(shí)積累和發(fā)明創(chuàng)造的要求將會(huì)隨之越來(lái)越高。所以,就目前而言,機(jī)器智能全面超越人類智能的預(yù)測(cè)將不會(huì)成為現(xiàn)實(shí)[3]。
數(shù)據(jù)飛輪、算法經(jīng)濟(jì)以及云端人工智能將得到重大發(fā)展。當(dāng)更多的數(shù)據(jù)日漸產(chǎn)生,提取、存儲(chǔ)和計(jì)算數(shù)據(jù)的成本也隨之下降后,機(jī)器學(xué)習(xí)將開(kāi)始向云端遷移,其中的機(jī)器智能基石將在云端實(shí)現(xiàn),由此產(chǎn)生了算法經(jīng)濟(jì)。在云上,可擴(kuò)展網(wǎng)絡(luò)服務(wù)是隨時(shí)可用的應(yīng)用程序接口。相關(guān)科學(xué)家不再需要編寫自定義的代碼或管理基礎(chǔ)設(shè)施,系統(tǒng)將會(huì)自動(dòng)實(shí)現(xiàn)這些功能并實(shí)時(shí)產(chǎn)生新的所需模型,并以最快速度提供更準(zhǔn)確的結(jié)果。但同時(shí),機(jī)器學(xué)習(xí)也將從云端走向各類本地智能終端、傳感器等設(shè)備,云端和本地的機(jī)器學(xué)習(xí)將有機(jī)結(jié)合。正在涌現(xiàn)的機(jī)器智能平臺(tái)可以采用以模型作為服務(wù)的方式,托管已得到預(yù)訓(xùn)練的機(jī)器學(xué)習(xí)模型,從而使企業(yè)能夠更容易地進(jìn)行機(jī)器學(xué)習(xí),大規(guī)模利用算法智能,從而快速地將應(yīng)用從原型轉(zhuǎn)化為產(chǎn)品[8][10]。
機(jī)器智能和進(jìn)化論將聯(lián)系發(fā)展。在機(jī)器學(xué)習(xí)日漸過(guò)渡邁向自主無(wú)監(jiān)督學(xué)習(xí),并且在將來(lái)形成自主智能時(shí),機(jī)器智能自身也將適應(yīng)達(dá)爾文的進(jìn)化論而具有進(jìn)化能力,順應(yīng)適應(yīng)環(huán)境、適者生存的自然規(guī)律。將來(lái)許多人類行為會(huì)被機(jī)器日漸取代,人類也許會(huì)由于機(jī)器智能帶來(lái)的互補(bǔ)和競(jìng)爭(zhēng)而呈現(xiàn)人口減少的趨勢(shì)[9]。
倫理、“智控”問(wèn)題逐漸凸顯。當(dāng)機(jī)器學(xué)習(xí)還是以監(jiān)督為主時(shí),機(jī)器智能比較容易“受控”。但當(dāng)機(jī)器智能全面邁向無(wú)監(jiān)督學(xué)習(xí)時(shí),人類將很難繼續(xù)控制機(jī)器只會(huì)自發(fā)學(xué)習(xí)對(duì)人類友好有利的知識(shí),這樣很有可能會(huì)使機(jī)器學(xué)習(xí)出對(duì)人類而言有害的知識(shí)。雖然機(jī)器智能在很多方面能夠幫助人類,但與此同時(shí)機(jī)器智能與人類智能的結(jié)合也可能會(huì)產(chǎn)生負(fù)面的影響,甚至引發(fā)社會(huì)倫理問(wèn)題[9]。
推理、學(xué)習(xí)和聯(lián)想是如今的人工智能技術(shù)中最主要的三大功能[10],推理和聯(lián)想的功能都需要通過(guò)學(xué)習(xí)功能的完善來(lái)提高。機(jī)器學(xué)習(xí)是人工智能領(lǐng)域發(fā)展的基礎(chǔ),只有不斷完善機(jī)器學(xué)習(xí)的研究,才能使人工智能領(lǐng)域尤其是人機(jī)系統(tǒng)發(fā)揮巨大的力量。因此,把握機(jī)器學(xué)習(xí)的發(fā)展趨勢(shì)并進(jìn)行相應(yīng)的深入探究,對(duì)自主學(xué)習(xí)過(guò)程進(jìn)行具體歸納分析,并將各類機(jī)器學(xué)習(xí)算法的內(nèi)在數(shù)學(xué)原理提高到靈活應(yīng)用的高度,通過(guò)訓(xùn)練數(shù)據(jù)樣本集使未來(lái)的計(jì)算機(jī)具備持續(xù)自主學(xué)習(xí)的能力并能自發(fā)提升水平,將對(duì)人工智能的推動(dòng)發(fā)展產(chǎn)生強(qiáng)大的助力,實(shí)現(xiàn)人工智能在更廣闊領(lǐng)域的實(shí)際應(yīng)用,從而為未來(lái)社會(huì)經(jīng)濟(jì)的發(fā)展提供持續(xù)動(dòng)力。
[1]曹雪.機(jī)器學(xué)習(xí)——人工智能革命的助推劑[J].電子技術(shù)與軟件工程,2017,(13):255.
[2]余殷博.基于人工智能下的機(jī)器學(xué)習(xí)歷史及展望[J].電子技術(shù)與軟件工程,2017,(04):129.
[3]龔怡宏.人工智能是否終將超越人類智能——基于機(jī)器學(xué)習(xí)與人腦認(rèn)知基本原理的探討[J].人民論壇·學(xué)術(shù)前沿,2016,(07):12-21.
[4]余凱,賈磊,陳雨強(qiáng),徐偉.深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(09):1799-1804.
[5]余明華,馮翔,祝智庭.人工智能視域下機(jī)器學(xué)習(xí)的教育應(yīng)用與創(chuàng)新探索[J].遠(yuǎn)程教育雜志,2017,35(03):11-21.
[6]黃鼎曦.基于機(jī)器學(xué)習(xí)的人工智能輔助規(guī)劃前景展望[J].城市發(fā)展研究,2017,24(05):50-55.
[7]祝葉華.人工智能革命“助燃劑”:機(jī)器學(xué)習(xí)[J].科技導(dǎo)報(bào),2016,34(07):64-66.
[8]朱煥.2016機(jī)器學(xué)習(xí)三大趨勢(shì):算法經(jīng)濟(jì)將引導(dǎo)人工智能走向何方?[A].科學(xué)與現(xiàn)代化,2017(1)(總第070期)2017:8.
[9]黃廣斌.智能革命:人工智能、機(jī)器學(xué)習(xí)、生物學(xué)習(xí)和智能材料的合力[J].軟件和集成電路,2017,(04):18-24.
[10]姜雅慧.人工智能中的機(jī)器學(xué)習(xí)研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2013,16(21):237-239.