摘要:機(jī)器學(xué)習(xí)通過(guò)以往數(shù)據(jù),運(yùn)用相關(guān)算法,得出可以預(yù)測(cè)的模型,計(jì)算出對(duì)應(yīng)結(jié)果。它基于電腦科學(xué)、統(tǒng)計(jì)學(xué)和數(shù)學(xué)的交互,處在了人工智能與數(shù)據(jù)科學(xué)的核心地位。由于新的機(jī)器學(xué)習(xí)算法和理論的不斷出現(xiàn)和發(fā)展,以及數(shù)據(jù)可用性和CPU處理速度的飛速提高,使得機(jī)器學(xué)習(xí)得到了迅猛的發(fā)展。機(jī)器學(xué)習(xí)對(duì)于當(dāng)代企業(yè)經(jīng)營(yíng)是非常重要的,它關(guān)系到企業(yè)的各行各業(yè)。
關(guān)鍵詞:機(jī)器學(xué)習(xí);數(shù)據(jù)挖掘;算法
中圖分類號(hào):TP182 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2017)013-0-01
一、機(jī)器學(xué)習(xí)的應(yīng)用
機(jī)器學(xué)習(xí)的方法可以應(yīng)用到許多領(lǐng)域中,包括研究,科技、商業(yè)領(lǐng)域等,這些領(lǐng)域的機(jī)器學(xué)習(xí)運(yùn)用越來(lái)越成熟和高效。研究中運(yùn)用機(jī)器學(xué)習(xí)發(fā)現(xiàn)人類不容易發(fā)現(xiàn)的規(guī)律;科技中運(yùn)用機(jī)器學(xué)習(xí)提高了科技解決實(shí)際生活的能力;商業(yè)領(lǐng)域運(yùn)用機(jī)器學(xué)習(xí)更好的挖掘客戶和滿足客戶。除此之外,機(jī)器學(xué)習(xí)也為其他領(lǐng)域帶來(lái)不小的突破。機(jī)器學(xué)習(xí)集中解決兩個(gè)問(wèn)題:其一,如何讓電腦系統(tǒng)利用經(jīng)驗(yàn)數(shù)據(jù)提高我們工作效率。其二,如何有效率地提高機(jī)器學(xué)習(xí)算法的準(zhǔn)確率。機(jī)器學(xué)習(xí)對(duì)于解決科學(xué)和工程中的問(wèn)題和在各種生活領(lǐng)域的實(shí)踐問(wèn)題是重要的。
二、機(jī)器學(xué)習(xí)的發(fā)展
過(guò)去的二十年機(jī)器學(xué)習(xí)的發(fā)展取得了極大的進(jìn)步。走出了實(shí)驗(yàn)室,走向了包括商業(yè)領(lǐng)域的廣泛運(yùn)用。在人工智能(AI)中,機(jī)器學(xué)習(xí)被作為一種重要的方法應(yīng)用到電腦可視化,語(yǔ)音識(shí)別,自然語(yǔ)言處理,機(jī)器人控制和其他應(yīng)用中。許多人工智能的開(kāi)發(fā)者開(kāi)始認(rèn)識(shí)到,對(duì)于許多應(yīng)用場(chǎng)景,訓(xùn)練一個(gè)系統(tǒng)去出示輸入輸出的結(jié)果,比人工分析內(nèi)在機(jī)理更容易。機(jī)器學(xué)習(xí)的準(zhǔn)確性在很多應(yīng)用中比人類自己的分析結(jié)果要高得多。機(jī)器學(xué)習(xí)的影響已經(jīng)廣泛傳播到運(yùn)用計(jì)算機(jī)和數(shù)據(jù)庫(kù)的行業(yè)里,例如,顧客服務(wù),醫(yī)療診斷系統(tǒng),資源分配。在以經(jīng)驗(yàn)為主的學(xué)科,像歷史學(xué),醫(yī)學(xué)到人文學(xué)科,機(jī)器學(xué)習(xí)也有其用武之地。學(xué)習(xí)問(wèn)題可能被定義為當(dāng)執(zhí)行某些任務(wù)時(shí),通過(guò)不斷的訓(xùn)練提高解決能力[1]。例如,在學(xué)習(xí)偵察信用卡詐騙時(shí),我們需要給所有的信用卡交易貼上一個(gè)是不是詐騙的標(biāo)簽。測(cè)量表現(xiàn)將會(huì)由于這個(gè)詐騙鑒別分類器被提高,而它的訓(xùn)練是由以前的一系列詐騙案例所構(gòu)成。
三、機(jī)器學(xué)習(xí)的模型與算法
在不同的現(xiàn)實(shí)問(wèn)題中機(jī)器學(xué)習(xí)算法也依據(jù)數(shù)據(jù)與模型的不同有了很大的差別。概念上機(jī)器學(xué)習(xí)算法被視為在一堆候選算法中選取一種對(duì)原始表現(xiàn)擬合最好的程序。機(jī)器學(xué)習(xí)算法的結(jié)論好壞差別非常大,很大程度上因?yàn)樗玫降臄?shù)據(jù)和模型的差別。這里的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集。它努力從不同的程序中收集最好的算法。許多方法集中在函數(shù)取值問(wèn)題,它們集中研究函數(shù)。給定一個(gè)輸入,就有一個(gè)輸出。學(xué)習(xí)問(wèn)題就是如何找出一個(gè)更精確的函數(shù)。通常函數(shù)以參數(shù)化的形式呈現(xiàn),而在另一些情況下,函數(shù)具體形式不太清楚,它是由一個(gè)搜索過(guò)程、一個(gè)因子分解、一個(gè)極大化過(guò)程、一個(gè)仿真過(guò)程等構(gòu)成。即使函數(shù)形式不太清楚,其一般都依賴于參數(shù)與自由度,訓(xùn)練找到這些參數(shù)的過(guò)程往往使得表現(xiàn)測(cè)度最優(yōu)化[2]。
下面是機(jī)器學(xué)習(xí)主流的各種算法, 算法是機(jī)器學(xué)習(xí)的核心,要了解不同算法的難點(diǎn)所在,更要了解不同算法的優(yōu)勢(shì)以及應(yīng)用場(chǎng)合。算法離不開(kāi)對(duì)于數(shù)學(xué)基礎(chǔ),也與統(tǒng)計(jì)學(xué)的建模有關(guān)系;由于算法的計(jì)算難度比較大,更與計(jì)算機(jī)的計(jì)算性能有關(guān),所以算法研究顯得非常重要但也比較困難。算法可以說(shuō)是機(jī)器學(xué)習(xí)的內(nèi)核,一種好算法的提出,對(duì)于機(jī)器學(xué)習(xí)是劃時(shí)代的貢獻(xiàn)。
四、機(jī)器學(xué)習(xí)的商業(yè)重要性
這個(gè)時(shí)代是一個(gè)互聯(lián)網(wǎng)信息爆炸的時(shí)代,隨著網(wǎng)絡(luò)的迅速發(fā)展和普及,使得信息量極大豐富,由于我們獲得海量數(shù)據(jù)的便捷性,我們可以利用的數(shù)據(jù)進(jìn)行分析變得越來(lái)越容易,收集的信息門類五花八門。對(duì)于各個(gè)行業(yè),還能收集與行業(yè)、競(jìng)爭(zhēng)對(duì)手、客戶和市場(chǎng)有關(guān)的信息,能夠很好的分析和處理那些對(duì)企業(yè)有重大價(jià)值的信息成為未來(lái)企業(yè)脫穎而出的關(guān)鍵。根據(jù)分析結(jié)果找出企業(yè)面臨的問(wèn)題和漏洞,更好的管理企業(yè),讓企業(yè)取得生存發(fā)展空間。
可見(jiàn)數(shù)據(jù)挖掘?qū)τ谄髽I(yè)的重要性,未來(lái)從事機(jī)器學(xué)習(xí)相關(guān)崗位的人員將會(huì)越來(lái)越多,數(shù)據(jù)挖據(jù)不僅在一些大的公司有重要的作用,在小企業(yè)里也是不可或缺的。數(shù)據(jù)在公司經(jīng)營(yíng)中提供了非常有價(jià)值的商業(yè)信息,數(shù)據(jù)中蘊(yùn)含了巨大的商業(yè)潛力。數(shù)據(jù)像一個(gè)盒子。不是我們隨便看看的就能得到指導(dǎo)性的意見(jiàn)。大數(shù)據(jù)時(shí)代的到來(lái)尤其為管理者既帶來(lái)了機(jī)會(huì),又增加了困難。因?yàn)樗麄円鎸?duì)的是更加龐雜的數(shù)據(jù)系統(tǒng),從中找出他們需要的具體規(guī)律,這本身不是一件容易的事。所以以后機(jī)器學(xué)習(xí)會(huì)越來(lái)越走向我們的企業(yè),為企業(yè)帶來(lái)價(jià)值。
參考文獻(xiàn):
[1]M.I.Jordan1 and T.M.Mitchell2.MachineL earning: Treads, perspective, prospects ,science,2015.
[2]Hanjw,MiehelineK.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟曉峰,譯.北京:機(jī)械工業(yè)出版社,2001.
作者簡(jiǎn)介:劉曉龍(1992-),男,學(xué)歷:碩士,單位:天津財(cái)經(jīng)大學(xué),主要從事數(shù)據(jù)挖掘與經(jīng)濟(jì)統(tǒng)計(jì)研究。