国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機器學習理論淺談

2012-12-31 00:00:00孫璐
考試周刊 2012年76期

摘 要: 本文介紹了人工智能學科中機器學習的概念、發(fā)展、分類及應用情況。

關鍵詞: 機器學習 人工智能 基本模型

1.引言

“機器學習”是人工智能的重要研究領域之一。機器學習的定義是“系統(tǒng)通過積累經(jīng)驗而改善系統(tǒng)自身的性能”。通俗地說,就是讓機器去學習,利用學到的知識來指導下一步的判斷。最初研究機器學習,是讓計算機具有學習的能力,以實現(xiàn)智能化。因為人們認為具有人工智能的系統(tǒng)首先必須具有學習能力。機器學習的研究始于神經(jīng)元模型研究,此后又經(jīng)歷了符號概念獲取、知識強化學習研究階段,至今已發(fā)展到連接學習和混合型學習研究階段。

2.機器學習系統(tǒng)的基本模型

根據(jù)機器學習的定義,建立如圖1所示的機器學習基本模型。

模型中包含學習系統(tǒng)的四個基本組成環(huán)節(jié)。

環(huán)境和知識庫是以某種知識表示形式表達的信息的集合,分別代表外界信息來源和系統(tǒng)具有的知識。學習環(huán)節(jié)和執(zhí)行環(huán)節(jié)代表兩個過程。學習環(huán)節(jié)處理環(huán)境提供的信息,以便改善知識庫中的知識。執(zhí)行環(huán)節(jié)是整個機器學習系統(tǒng)的核心。利用知識庫中的知識來完成某種任務,并把執(zhí)行中獲得的信息送還給學習環(huán)節(jié)。

2.1機器學習的分類

很多學者從不同的角度對機器學習進行了分類,這里簡單闡述一下繼續(xù)學習策略的機器學習的種類。按照學習策略的不同,機器學習分為機械學習、歸納學習、基于解釋的學習、基于神經(jīng)網(wǎng)絡的學習和基于遺傳算法的學習。

2.1.1機械學習

機械學習(Rote Learning)就是“死記硬背式的學習”,靠記憶存儲知識,需要時檢索已經(jīng)存下來的知識使用,不需要計算和推理。機械學習的模式如下:需要解決的問題為{y,y,...,yn},輸入已知信息{x,x,...x}后,解決了該問題,于是將記錄對{{x,x,...,x},{y,y,...,y}}存入數(shù)據(jù)庫,以后當遇到問{y,y,...,y}時,檢索數(shù)據(jù)庫,即可得到問題{y,y,...,y}的解答是{x,x,...,x}。

能實現(xiàn)機械式學習算法的系統(tǒng)只需具備兩種基本技能:記憶與檢索。此外,存儲的合理安排,信息的合理結合,以及檢索最優(yōu)方向的控制也是系統(tǒng)應該考慮的問題。該算法簡單、容易實現(xiàn)、計算快速,但是由于系統(tǒng)不具備歸納推理的功能,對每個不同的問題,即使是類似的問題,也需要知識庫中有不同的記錄。因此占用大量的存儲空間,這是典型的以空間換時間的算法。

2.1.2歸納學習

歸納學習是應用歸納推理進行學習的一種方法。歸納學習的過程是由特殊實例推導出一般情況的過程,這樣就使類似的問題可以利用同樣的方法求解。歸納學習的過程就是示例空間與規(guī)則空間的相互利用與反饋。1974年,Simon和Lea提出了雙空間模型,形象地對這一執(zhí)行過程進行了描述,如圖2所示。

歸納學習算法簡單,節(jié)省存儲空間,在一段時間內得到了廣泛的應用。在應用過程中,該算法逐漸顯現(xiàn)出它的缺點:(1)歸納結論是通過對大量的實例分析得出的,這就要求結論的得出要有大量實例作支撐,而這在許多領域都是無法滿足的。(2)歸納結論是由不完全訓練集得出的,因而其正確性無法保證,只能使結論以一定概率成立。(3)該算法通過對實例的分析與對比得出結論,對于信息的重要性與相關關系無法辨別。

2.1.3基于解釋的學習

基于解釋的學習(Explanation-Based Learning)是運用已知相關領域的知識及訓練實例,對某個目標概念進行學習,并通過后繼的不斷練習,得到目標概念的一般化描述。該學習的執(zhí)行過程如圖3所示。

這種方式的學習得到一個領域完善的知識往往是比較困難的,這就對該算法提出了更高的要求。為解決知識不完善領域的問題,有以下兩個研究方向[2]:(1)改進該算法使其在不完善的領域理論中依然有效。(2)擴充該領域的知識使其擁有更強的解釋能力。通常情況下,第二種改進方法更重要些。

2.1.4基于神經(jīng)網(wǎng)絡的學習

神經(jīng)網(wǎng)絡是由許多類似神經(jīng)元的節(jié)點和它們之間帶權的連接組成的復雜網(wǎng)絡結構,是為模仿人類大腦的復雜神經(jīng)結構而建立起來的抽象數(shù)據(jù)模型,希望相似的拓撲結構可以使機器像人腦一樣進行數(shù)據(jù)的分析、存儲與使用。神經(jīng)網(wǎng)絡學習的過程就是不斷修正連接權的過程。在網(wǎng)絡的使用過程中,對于特定的輸入模式,神經(jīng)網(wǎng)絡通過前向計算,產(chǎn)生一個輸出模式,并得到節(jié)點代表的邏輯概念,通過對輸出信號的比較與分析可以得到特定解。在整個過程中,神經(jīng)元之間具有一定的冗余性,且允許輸入模式偏離學習樣本,因此神經(jīng)網(wǎng)絡的計算行為具有良好的并行分布、容錯和抗噪能力。

神經(jīng)網(wǎng)絡學習算法是一種仿真算法,擁有良好的認識模擬能力和有高度的并行分布式處理能力。但神經(jīng)網(wǎng)絡模型及其參數(shù)設置難以確定,需要長時間的試驗摸索過程。并且,對于最后得到的神經(jīng)網(wǎng)絡,其反映的知識往往難以讓人理解。為解決這些問題,構造神經(jīng)網(wǎng)絡集成并從神經(jīng)網(wǎng)絡或神經(jīng)網(wǎng)絡集成中抽取規(guī)則成為當前研究的熱點。

2.1.5基于遺傳算法的學習

遺傳算法以自然進化和遺傳學為基礎,通過模擬自然界中生物的繁殖與進化過程,使訓練結果逐漸優(yōu)化。與遺傳過程類似,在學習過程中,通過選擇最好結果并使其組合產(chǎn)生下一代,使“優(yōu)秀的遺傳因子”逐代積累,最后得到最優(yōu)的解。遺傳算法解決了神經(jīng)網(wǎng)絡學習中的一個缺點,它不需要知道原始信息而只需知道學習的目的即可進行,具有很強的并行計算能力和適應能力。此外,遺傳算法采取的隨機搜索方法提高了該學習算法對全局搜索的能力。遺傳算法的缺點主要體現(xiàn)在三個方面:無法確定最終解的全局最優(yōu)性;無法控制遺傳過程中變異的方向;無法有效地確定進化終止條件?;谶@三個缺點,有人提出了遺傳算法與其他學習算法的結合,優(yōu)點互補已達到更好的效果。

3.結語

機器學習在過去十幾年中取得了飛速的發(fā)展,目前已經(jīng)成為子領域眾多、內涵非常豐富的學科領域?!案?、更好地解決實際問題”成為機器學習發(fā)展的驅動力。事實上,過去若干年中出現(xiàn)的很多新的研究方向,例如半監(jiān)督學習、代價敏感學習等,都起源于實際應用中抽象出來的問題,而機器學習的研究進展,也很快就在眾多應用領域中發(fā)揮作用。機器學習正在逐漸成為基礎性、透明化、無處不在的支持技術、服務技術。

參考文獻:

[1]周志華.機器學習與數(shù)據(jù)挖掘[J].

[2]郭亞寧,馮莎莎.機器學習理論研究[J].科技教育創(chuàng)新,2010(14).

[3]于鳳.機器學習方法及其技術應用[J].電腦學習,2003.</

镇江市| 兴化市| 遂平县| 肇庆市| 贺州市| 孙吴县| 蛟河市| 福海县| 石门县| 平凉市| 建宁县| 太和县| 罗山县| 康定县| 汽车| 长海县| 建湖县| 浮梁县| 安义县| 芜湖市| 龙井市| 榆社县| 高台县| 全州县| 霞浦县| 略阳县| 清丰县| 琼中| 新和县| 武胜县| 海安县| 元阳县| 锡林浩特市| 禄劝| 天台县| 通海县| 湾仔区| 台中县| 吴忠市| 安国市| 伊宁市|