徐躍勇
人工智能是當(dāng)今的一個熱點話題。人工智能與機器學(xué)習(xí)有什么關(guān)系?機器是如何進(jìn)行深度學(xué)習(xí)的呢?我們一起來了解一下人工智能與機器學(xué)習(xí),揭開人工智能的神秘面紗。
機器學(xué)習(xí)是一種試圖讓計算機像人類一樣學(xué)習(xí)獲得知識與技能,并像人類一樣感知世界、認(rèn)識世界的技術(shù)。
小孩在成長過程中,通過接觸外部世界,形成對各類事物的認(rèn)知,例如,當(dāng)有人跟你提到狗時,你的頭腦會想到什么?你的大腦會有一個狗的特征模型,那么我們經(jīng)過什么樣的過程才能在大腦中形成狗的特征模型呢?腦科學(xué)家們進(jìn)行了大量的研究,試圖揭開人腦活動的秘密。但到目前為止,對人類的大腦,我們知道的還很少。關(guān)于人是如何學(xué)習(xí)的問題,科學(xué)家們看法各異。我們試圖從小孩認(rèn)識狗的過程描繪人類學(xué)習(xí)的過程模型,以便于理解機器學(xué)習(xí)的過程。但它還僅僅是一個建立在現(xiàn)有認(rèn)識水平上的推測模型,人類學(xué)習(xí)的科學(xué)描述需要青年們在未來的研究中去探索。
計算機“能聽會看”源于機器具備了學(xué)習(xí)能力。計算機也能通過對某一對象的圖片、聲音、文字等內(nèi)容學(xué)習(xí),建立起對該對象的特征模型。計算機建立某一對象的特征模型需要大量技術(shù)與方法的支持才能實現(xiàn)。計算機不同于人,并不能自己形成動物的外貌特征模型。我們必須提前設(shè)計和開發(fā)狗的外貌初始特征模型,然后利用大量的動物圖片對計算機中動物的外貌特征模型進(jìn)行整合,最終計算機才能得到狗的外貌特征模型。
筆者所在的學(xué)校于2020年9月創(chuàng)建了人工智能實驗室,該人工智能實驗室采用的是Intel的機器人,該機器人采用的是linux操作系統(tǒng),使用python軟件編程,自帶小電腦,可以直接在機器人上調(diào)試操作,也可以遠(yuǎn)程操作。該機器人能夠自主學(xué)習(xí),通過識別二維碼、實物就可以辨別不同的東西,并能自主導(dǎo)航,還能夠?qū)θ梭w結(jié)構(gòu)進(jìn)行辨別,可用于人臉識別,可以進(jìn)行二次開發(fā)。
人工智能就是通過大量的數(shù)據(jù)模型的訓(xùn)練,能對未知的事件進(jìn)行決策和預(yù)測,所以具備了一定的人的“智能”。
一、機器學(xué)習(xí)算法與傳統(tǒng)基于規(guī)則的區(qū)別
機器學(xué)習(xí)與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,傳統(tǒng)解決問題方式的代碼是邏輯判斷,通過制定邏輯規(guī)則來解決問題,不具備智能。機器學(xué)習(xí)則是用大量的數(shù)據(jù)來“訓(xùn)練”,通過各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。
二、什么時候該使用機器學(xué)習(xí)
機器學(xué)習(xí)可以使機器變得智能起來,那么我們應(yīng)該在什么情況下使用機器學(xué)習(xí)呢?當(dāng)一個問題的解決方案很復(fù)雜,或者問題可能涉及大量的數(shù)據(jù)卻沒有明確的數(shù)據(jù)分布函數(shù)的時候可以使用機器學(xué)習(xí)。比如,我們沒有辦法通過以往的編程方式讓計算機去識別人臉,也沒有辦法給時刻變化的問題進(jìn)行編程,像生產(chǎn)線上的瑕疵檢測,股票或者彩票這種數(shù)據(jù)跟隨時間變化的問題,通過硬編碼進(jìn)行解決效果不好,通常這些問題我們需要通過機器學(xué)習(xí)來解決,使預(yù)測效果更優(yōu)。
三、機器學(xué)習(xí)解決的主要問題
機器學(xué)習(xí)可以解決很多問題,總結(jié)有以下幾個最經(jīng)典的類型:
(1)分類問題:通過數(shù)據(jù)訓(xùn)練,讓機器能夠認(rèn)識新東西。比如手寫數(shù)字、人臉識別、物體識別等。
(2)回歸問題:通過模型訓(xùn)練,對未知結(jié)果進(jìn)行預(yù)測。比如股票預(yù)測、房價預(yù)測等,通過回歸模型可以預(yù)測未來房價或者股票走勢。
(3)聚類問題:類似分類問題,但是也有很大的區(qū)別。分類問題,對于訓(xùn)練和測試的數(shù)據(jù)類型、數(shù)量、名稱都是確定的。聚類問題不清楚具體的類型數(shù)量以及名稱,需要根據(jù)經(jīng)驗來分類。常見應(yīng)用如照片分類等,可以把模糊照片、風(fēng)景照、人像照形成單獨相冊。
四、機器學(xué)習(xí)分類
機器學(xué)習(xí)是一個很復(fù)雜的學(xué)科,下面又分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)。監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)是根據(jù)訓(xùn)練數(shù)據(jù)的標(biāo)簽來分的,每一個樣本數(shù)據(jù)都有對應(yīng)的標(biāo)簽。無監(jiān)督學(xué)習(xí)則是沒有對應(yīng)的標(biāo)簽,例如聚類問題,有一堆圖片,但是沒有標(biāo)簽,通過模型訓(xùn)練,可以將這堆圖片根據(jù)規(guī)則分成兩類、三類或者多類,但是每類結(jié)果標(biāo)簽不知道。而半監(jiān)督學(xué)習(xí)介于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間,訓(xùn)練的樣本只有部分有對應(yīng)的標(biāo)簽。強化學(xué)習(xí)跟標(biāo)簽沒有關(guān)系,強化學(xué)習(xí)主要是通過智能體狀態(tài)改變后環(huán)境反饋的獎勵信息去進(jìn)行訓(xùn)練。有了大致了解后,我們對每種類型再做一個詳細(xì)的介紹。
如有三個樣本,分別是蘋果、梨和香蕉,通過監(jiān)督學(xué)習(xí)算法進(jìn)行模型訓(xùn)練,如果拿一個新的蘋果,只要符合蘋果的特征,就能進(jìn)行正確的分類。
計算機進(jìn)行監(jiān)督學(xué)習(xí)形成狗的外貌特征模型需要以下三個核心環(huán)節(jié)。
(1)準(zhǔn)備數(shù)據(jù)。需要準(zhǔn)備大量用于訓(xùn)練的狗外貌特征模型的圖片。
(2)訓(xùn)練模型。當(dāng)我們把大量的圖片輸入計算機的同時,還要把每張圖片標(biāo)記為“是狗”,計算機會把“是狗”這種標(biāo)記對應(yīng)到所有輸入的圖片上。這些標(biāo)記過的圖片形成了狗的特征模型訓(xùn)練數(shù)據(jù)。計算機提取訓(xùn)練數(shù)據(jù)的特征,并且建立特征和標(biāo)記之間的關(guān)系:具有這些特征的圖片是狗的圖片。給計算機輸入圖片數(shù)據(jù)并標(biāo)記“是狗”的過程就是監(jiān)督學(xué)習(xí)的過程。
(3)驗證模型。模型訓(xùn)練完成后,我們再給計算機輸入不做任何標(biāo)記的圖片數(shù)據(jù)。這些不做標(biāo)記的圖片數(shù)據(jù)叫做測試數(shù)據(jù)。計算機提取測試數(shù)據(jù)特征,然后與最近一次的狗的外貌特征模型進(jìn)行對比,判斷新輸入圖片的特征是否在狗的外貌特征模型識別的范圍內(nèi),根據(jù)對比結(jié)果輸出是否是狗的判斷。我們根據(jù)計算機的判斷結(jié)果做出狗的特征模型是否訓(xùn)練成功的結(jié)論。
1.監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)主要應(yīng)用在回歸問題和分類問題上,回歸反映了樣本數(shù)據(jù)的屬性值特性,也就是通過函數(shù)來表達(dá)樣本數(shù)據(jù)與標(biāo)簽的依賴關(guān)系。如可以根據(jù)以往每周的股票收益來預(yù)測下周的股票收益等。分類主要是將樣本數(shù)據(jù)映射到某個給定的類別中,比如給機器10張貓的照片,告訴機器這是貓,以后機器再遇到貓的時候,就能通過模型得出是貓的結(jié)論。再如,根據(jù)道路車流量等交通數(shù)據(jù)的分析對明天交通情況預(yù)測。通過比較10元代金券或者75折消費哪個更優(yōu)惠,可以判斷哪種方式更吸引顧客。
2.無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)只有樣本,沒有標(biāo)簽,而如何進(jìn)行分類需要人為指定,訓(xùn)練是通過樣本內(nèi)部特征的相似性。
比如不同年齡段男女進(jìn)行游戲充值的情況,我們根據(jù)數(shù)據(jù)分成兩類,模型可根據(jù)性別信息,或者年齡信息進(jìn)行分類。
無監(jiān)督學(xué)習(xí)通常用來解決聚類問題,如,哪些觀眾喜歡同一類電影,會根據(jù)觀眾觀看電影的信息,對觀眾進(jìn)行分類。
3.半監(jiān)督學(xué)習(xí)
半監(jiān)督學(xué)習(xí)樣本只有部分標(biāo)簽,比如有一萬張貓的圖片,一萬張狗的圖片,但是貓跟狗的標(biāo)簽都不完全,貓可能有400張圖片有對應(yīng)的標(biāo)簽,狗有600張圖片有標(biāo)簽,通過對有標(biāo)簽的樣本進(jìn)行訓(xùn)練,得出模型之后,用這個模型去預(yù)測沒有標(biāo)簽的圖片,然后將預(yù)測的結(jié)果作為偽標(biāo)簽再去進(jìn)行后續(xù)的訓(xùn)練。
4.強化學(xué)習(xí)
強化學(xué)習(xí),又稱再勵學(xué)習(xí)、評價學(xué)習(xí)或增強學(xué)習(xí),是機器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體在與環(huán)境的交互過程中通過學(xué)習(xí)策略以達(dá)成回報最大化或?qū)崿F(xiàn)特定目標(biāo)的問題。
強化學(xué)習(xí)可以讓機器能夠像人一樣通過不斷地試錯積累經(jīng)驗。比如自動駕駛的汽車,在遇到黃燈閃爍的情況下,是剎車還是加速通過?可能經(jīng)過無數(shù)次的嘗試以及獎懲機制,可以得出結(jié)論:剎車比較安全。
五、機器學(xué)習(xí)基礎(chǔ)算法及相應(yīng)軟、硬件
機器學(xué)習(xí)現(xiàn)在已經(jīng)有了很多算法,這些算法在應(yīng)用領(lǐng)域都取得了非常好的效果。
1.機器學(xué)習(xí)軟件及發(fā)展
機器學(xué)習(xí)中需要對大量數(shù)據(jù)進(jìn)行處理和計算,比如復(fù)雜的神經(jīng)網(wǎng)絡(luò)中可能需要計算十幾萬個權(quán)重參數(shù),同時機器學(xué)習(xí)的很多算法已經(jīng)很成熟了,在簡單的一些應(yīng)用上,可以直接使用,這會導(dǎo)致一些算法寫很多次。為了避免這些情況,很多大公司都推出了自己的機器學(xué)習(xí)框架,這些框架中集成了很多機器學(xué)習(xí)算法,我們只需要調(diào)用傳遞參數(shù)就可以了。
人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)是實現(xiàn)機器學(xué)習(xí)的技術(shù)。
人體內(nèi)有大量的神經(jīng)網(wǎng)絡(luò),也叫神經(jīng)元。神經(jīng)細(xì)胞通過相互聯(lián)系構(gòu)成了一個功能強大、結(jié)構(gòu)復(fù)雜的信息處理系統(tǒng)——人體神經(jīng)系統(tǒng)。人們能夠思考并從事各種很難的工作,就是因為我們身體內(nèi)部有許多微小的神經(jīng)細(xì)胞,它起著很大的作用。
科學(xué)家受人體神經(jīng)細(xì)胞的啟發(fā),把每個神經(jīng)細(xì)胞抽象成一個叫作神經(jīng)元模型的基本信息單元,把許多這樣的信息單元按一定的層次結(jié)構(gòu)連接起來,就得到人工神經(jīng)網(wǎng)絡(luò)。但人工神經(jīng)網(wǎng)絡(luò)的信息處理能力距離人體神經(jīng)系統(tǒng)處理信息能力相差甚遠(yuǎn)。人工神經(jīng)網(wǎng)絡(luò)的種類很多,有卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)等,不同的算法其實現(xiàn)用途是不同的。
2.人工智能軟件(庫,框架)
框架將參數(shù)計算,神經(jīng)網(wǎng)絡(luò)搭建等變成了簡單函數(shù),大大降低了人工智能的開發(fā)難度,使不具備很專業(yè)的人工智能知識的人也能借助框架快速搭建自己的神經(jīng)網(wǎng)絡(luò)。
3.機器學(xué)習(xí)、深度學(xué)習(xí)硬件
人工智能第一次浪潮因為計算機算力的問題而終止。但是現(xiàn)在,我們有高性能的CPU、GPU、FPGA芯片以及AI專用的芯片組件。這些硬件設(shè)備保證了人工智能的硬件環(huán)境。如GPU提供了快速的浮點運算,可以大大縮短神經(jīng)網(wǎng)絡(luò)訓(xùn)練時間。
機器學(xué)習(xí)是人工智能領(lǐng)域的核心技術(shù),是使計算機具有人工智能的重要方式。它已經(jīng)應(yīng)用在人工智能的各個領(lǐng)域。機器學(xué)習(xí)同時作為人工智能最有效的實現(xiàn)方式,已經(jīng)在教育、醫(yī)療和工業(yè)等眾多領(lǐng)域得到了廣泛的應(yīng)用。作為人工智能教師,我們要不斷學(xué)習(xí)人工智能的知識,充分了解并掌握好機器學(xué)習(xí)和深度學(xué)習(xí)模式,并應(yīng)用于教育教學(xué)中,為教學(xué)服務(wù)。