吳建華
摘? 要:機器學習技術(shù)是人工智能的核心,是計算機智能化的基礎(chǔ)。機器學習技術(shù)逐步成為計算機科學、人工智能等信息產(chǎn)業(yè)的主要發(fā)展方向。文章結(jié)合機器學習技術(shù)的發(fā)展對目前機器學習技術(shù)的應用現(xiàn)狀進行了簡要分析,并提出了幾點建議。
關(guān)鍵詞:機器學習技術(shù);應用經(jīng)驗;建議
中圖分類號:G434 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)07-0138-02
Abstract: Machine learning technology is the core of artificial intelligence and the foundation of computer intelligence. Machine learning technology has gradually become the main development trend of computer science, artificial intelligence and other information industry. Taking into consideration the development of machine learning technology, this paper briefly analyzes the application status of machine learning technology, and puts forward some suggestions.
Keywords: machine learning technology; application experience; suggestion
機器學習技術(shù)是人工智能的核心,是計算機智能化的基礎(chǔ)。21世紀以來,機器學習技術(shù)逐步成為計算機科學、人工智能等信息產(chǎn)業(yè)的主要發(fā)展方向。其實早在計算機科學創(chuàng)立的同時,計算機科學的鼻祖圖靈就為人類打開了人工智能的大門,他曾說過“A computer would deserve to be called intelligent,if it could deceive a human into believing that it was human.”意思就是“當一個計算機能成功欺騙人類,讓他們覺得它是一個人的時候,這樣就能被稱為人工智能?!币源藖砜矗胍嬲貙崿F(xiàn)計算機的人工智能,必須依靠機器學習技術(shù),只有機器具備了和人類一樣的學習能力,才能被稱為是人工智能。
機器學習是一門綜合性、多領(lǐng)域交叉滲透的學科,主要涉及統(tǒng)計學、凸分析、逼近論、概率論、算法復雜度理論等學科。機器學習技術(shù)的主要研究目的是通過研究計算機如何學習和模擬人類的學習行為,讓計算機獲取新的技能或知識,并通過對所學知識的整合改善自身性能。
1 機器學習技術(shù)的發(fā)展歷程
機器學習技術(shù)的發(fā)展歷程根據(jù)研究途徑及研究目的大致可分為四個階段。
第一階段為二十世紀五十年代中葉至六十年代中葉,這段時期機器學習技術(shù)主要研究機器“有無知識的學習”。具體方法是通過對機器的相關(guān)性能參數(shù)和所處環(huán)境的變化來檢測機器系統(tǒng)所反饋出的相應數(shù)據(jù),即給系統(tǒng)一個運行程序,然后改變其自由空間作用,而系統(tǒng)將受程序的影響而改變自身的組織結(jié)構(gòu),最終系統(tǒng)會選擇最優(yōu)環(huán)境生存。該階段內(nèi)最具代表性的機器學習研究就是Samuet的下棋程序,該階段機器學習技術(shù)還處于啟蒙階段,研究方式和結(jié)果相對簡單,無法滿足人們的生產(chǎn)生活需要[1]。
第二階段為二十世紀六十年代中葉至七十年代中葉,該階段機器學習技術(shù)主要研究將不同領(lǐng)域的知識信息植入到系統(tǒng)中,通過圖結(jié)構(gòu)及邏輯結(jié)構(gòu)方面的系統(tǒng)描述語言將相關(guān)知識轉(zhuǎn)化為機器語言,以此來達到讓機器模擬人類學習的目的。但在進行相關(guān)研究過程中,人們發(fā)現(xiàn)人類的學習過程是一個長期、復雜的過程,而在該階段的機器學習無法讓系統(tǒng)進行更深入的學習。在此階段機器學習方面最有代表性的成果就是Winson和Hayes-Roth的對結(jié)構(gòu)學習系統(tǒng)方法。
第三階段為二十世紀七十年代中葉至八十年代中葉,該階段又被稱為機器學習技術(shù)的復興時期。通過前兩個發(fā)展階段的積累,人們在此階段將系統(tǒng)學習單個概念擴展至學習多個概念,并探索出各種不同的機器學習方法和策略,最重要的是,在該階段內(nèi)人們開始將機器學習技術(shù)與其他體系的應用進行結(jié)合。相關(guān)的應用和專家系統(tǒng)對知識獲取的需求也相應地激勵了機器學習技術(shù)的發(fā)展,機器學習技術(shù)的發(fā)展主流也從專家學習系統(tǒng)轉(zhuǎn)變?yōu)閷嵗龤w納學習系統(tǒng),這就表示機器學習技術(shù)的研究目的已經(jīng)發(fā)展為如何讓機器系統(tǒng)自主獲取知識。在此期間,第一屆機器學習國際研討會在美國卡內(nèi)基梅隆召開,標志著機器學習技術(shù)的發(fā)展受到了人們的廣泛關(guān)注[2]。
第四階段即從二十世紀八十年代中葉至今,該階段是機器學習技術(shù)發(fā)展的最新階段,伴隨機器學習技術(shù)不斷發(fā)展,其逐漸具備了下列特點:
(1)機器學習技術(shù)發(fā)展成為新的系統(tǒng)學科,其綜合應用了生物學、數(shù)學、心理學、神經(jīng)生理學、計算機技術(shù)、自動化技術(shù)等學科的相關(guān)知識。
(2)機器學習技術(shù)融合和發(fā)展了不同的學習方法,形式更加靈活、更加高效的集成式學習系統(tǒng)研究也正在慢慢興起。
(3)關(guān)于機器學習技術(shù)與人工智能技術(shù)在一些基礎(chǔ)問題上形成了統(tǒng)一性的觀點。
(4)隨著機器學習技術(shù)中各種類型的學習方式的應用,其應用范圍不斷擴展,相關(guān)的研究成果逐步在向產(chǎn)品轉(zhuǎn)化。
(5)機器學習技術(shù)及相關(guān)技術(shù)的研究空前活躍。
2 機器學習技術(shù)的應用及建議
隨著計算機技術(shù)的不斷發(fā)展,大數(shù)據(jù)及云計算等技術(shù)日益成熟,這給機器學習技術(shù)的發(fā)展帶來了廣闊的空間和完備的技術(shù)條件。2016年3月,阿爾法狗(AlphaGo)與圍棋世界冠軍李世石進行了一場人機大戰(zhàn),最終總比分4:1。之后,阿爾法狗在網(wǎng)上以“Master”為名與中日韓數(shù)十位高手進行了切磋,60局無一敗績,并在2017年5月舉行的中國烏鎮(zhèn)圍棋峰會上戰(zhàn)勝世界排名第一的圍棋冠軍柯潔。國家語委和教育部于2017年7月18日在北京發(fā)布了2016年《中國語言生活狀況報告》,“阿爾法狗”一詞成為2016年中國媒體年度新詞[3]?!鞍柗ü贰钡暮诵脑砭褪巧疃葘W習,它的圍棋水平證明了機器學習技術(shù)的發(fā)展已經(jīng)有了一定成果。目前,機器學習技術(shù)的應用范圍越來越廣泛,主要應用范圍如下:
2.1 數(shù)據(jù)挖掘與分析
“數(shù)據(jù)挖掘”與“數(shù)據(jù)分析”在機器學習領(lǐng)域是相似的意思,主要是指從大量數(shù)據(jù)中識別出有效的、特殊的、有價值的數(shù)據(jù)信息。在信息技術(shù)應用之前,人們只能通過人工對數(shù)據(jù)進行挖掘和分析,而隨著信息時代來臨,數(shù)據(jù)信息呈爆炸式發(fā)展,人們在無時無刻的創(chuàng)造數(shù)據(jù),也在不斷地使用數(shù)據(jù)來進行工作和生活[4]。數(shù)據(jù)挖掘與分析是機器學習技術(shù)中數(shù)據(jù)存儲技術(shù)與算法的結(jié)合,通過目前高效的數(shù)據(jù)存儲技術(shù)進行數(shù)據(jù)的高效讀寫,再通過機器學習技術(shù)提供的知識發(fā)現(xiàn)、數(shù)據(jù)統(tǒng)計分析等方式分析海量數(shù)據(jù)中的有用信息。由此可見,機器學習技術(shù)在數(shù)據(jù)挖掘和分析方面具有無可比擬的優(yōu)勢。
2.2 模式識別
模式識別最早屬于工程學科的范疇,而機器學習技術(shù)屬于計算機科學,兩者的結(jié)合給模式識別領(lǐng)域帶來新的發(fā)展機遇。其主要研究方面有兩部分:
(1)研究生命體如何感知外界環(huán)境和其他生物,也就是認識科學的研究范疇。
(2)在特定的環(huán)境或需求下,通過計算機技術(shù)實現(xiàn)模式識別,這就是機器學習技術(shù)的研究內(nèi)容,也是機器學習的長項。
在信息時代,模式識別的應用越來越廣泛,通過圖像分析、計算機視覺、光學文字識別、語音識別、手寫識別、自然語言處理、生物特征識別等方式的應用,能讓人們在工作和生活中更加便捷、更加智能化。例如基于生物特征識別和語音識別等技術(shù),我們現(xiàn)在可以通過人臉開手機或開鎖、可以刷臉支付、可以語音控制智能家居,而這些模式識別正式機器學習技術(shù)所擅長的。
2.3 在生物信息學上的應用
隨著基因技術(shù)的發(fā)展,人們對基因組及相關(guān)測序項目的研究不斷深入,并積累了大量的數(shù)據(jù)信息,生物信息學的研究重點會逐步從提取數(shù)據(jù)轉(zhuǎn)變?yōu)榉治鰯?shù)據(jù)。如此龐大和復雜的數(shù)據(jù)對計算機軟件和理論算法提出了極高的要求,而機器學習技術(shù)目前日趨成熟,遺傳算法、神經(jīng)網(wǎng)絡、支持向量機和決策樹等相關(guān)方法正適合處理生物信息學中海量、缺乏統(tǒng)一理論標準且還有噪聲的數(shù)據(jù)[5]。
2.4 具體應用
(1)虛擬助手。目前,虛擬助手的應用越來越廣泛,例如百度旗下的“小度”和小米旗下的“小艾同學”等都屬于近年來比較火熱的虛擬助手產(chǎn)品,它們能通過語音或生物識別技術(shù)識別你的具體指令,然后通過機器學習技術(shù)幫你控制家用電器或幫你規(guī)劃最優(yōu)交通路線等等。
(2)無人駕駛。無人駕駛至今已經(jīng)發(fā)展了近五十年,目前世界上最先進的無人駕駛汽車已經(jīng)測試行駛近五十萬公里,且其后八萬公里的行駛過程中完全沒有人為干預。無人駕駛技術(shù)即通過機器學習技術(shù)感知周邊環(huán)境并自行對環(huán)境信息進行處理,然后再進行駕駛操作[6]。
綜上所述,隨著信息革命的深入和大數(shù)據(jù)時代的來臨,人們只有通過機器學習技術(shù)對數(shù)據(jù)、知識進行高效獲取和處理,才能有效提高生產(chǎn)效率和生活質(zhì)量。特別是針對工程應用和科學研究領(lǐng)域的復雜問題的解決,機器學習技術(shù)具有明顯的優(yōu)勢。因此,未來科技的發(fā)展、社會的進步離不開機器學習技術(shù)的合理應用。
參考文獻:
[1]黃魯成,薛爽.機器學習技術(shù)發(fā)展現(xiàn)狀與國際競爭分析[J].現(xiàn)代情報,2019,39(10):165-176.
[2]張軍英.機器真智能與現(xiàn)行機器學習技術(shù)[J].新教育時代電子雜志(教師版),2019(1):91,88.
[3]馬振.AlphaGo背后的機器學習技術(shù)[J].電腦迷,2018(16):81.
[4]劉偉佳,李博權(quán).物聯(lián)網(wǎng)、大數(shù)據(jù)分析和機器學習技術(shù)在災備中的應用研究[J].微電子學與計算機,2018,35(12):55-58.
[5]薛明峰.機器學習安全性問題及其防御技術(shù)研究[J].中國戰(zhàn)略新興產(chǎn)業(yè),2018(26):213.
[6]林泓宇.大數(shù)據(jù)背景下的機器學習及其關(guān)鍵技術(shù)[J].電腦迷,2018(6):122.