張昊澤
摘要
現(xiàn)如今,數(shù)據(jù)挖掘中機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用非常廣泛,遍及金融、醫(yī)療等領(lǐng)域,這就要求企業(yè)應(yīng)該提升自身辮別方法和技術(shù)優(yōu)劣的能力,面對(duì)不同的環(huán)境,選擇應(yīng)用與任務(wù)相匹配的數(shù)據(jù)挖掘技術(shù)。本篇文章首先對(duì)機(jī)器學(xué)習(xí)技術(shù)的界說作了簡述,其后對(duì)機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘任務(wù)的商業(yè)應(yīng)用作了兩點(diǎn)詳細(xì)的研究,以期促進(jìn)企業(yè)的可持續(xù)發(fā)展。
【關(guān)鍵詞】機(jī)器學(xué)習(xí)技術(shù) 數(shù)據(jù)挖掘 商業(yè)應(yīng)用
隨著科學(xué)技術(shù)的發(fā)展,存在于數(shù)據(jù)挖掘領(lǐng)域的機(jī)器學(xué)習(xí)技術(shù)憑借其強(qiáng)大的數(shù)據(jù)處理能力和在商業(yè)領(lǐng)域上巨大的應(yīng)用潛力越發(fā)得到數(shù)據(jù)挖掘領(lǐng)域?qū)W術(shù)界以及商界的廣泛關(guān)注。因此,對(duì)機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應(yīng)用進(jìn)行探究有著十分重要的現(xiàn)實(shí)意義。
1 機(jī)器學(xué)習(xí)技術(shù)的界說
通過自動(dòng)化的計(jì)算方法來獲取知識(shí)的學(xué)習(xí)就是機(jī)器學(xué)習(xí)。人工智能研究中,機(jī)器學(xué)習(xí)占據(jù)著十分重要的位置??杀环Q作真正的智能系統(tǒng),一定具有非常強(qiáng)悍的學(xué)習(xí)能力,由此可得出,以往的大多數(shù)系統(tǒng)都不能稱作智能系統(tǒng)。比如,不能進(jìn)行錯(cuò)誤的自我校正;不能經(jīng)過經(jīng)驗(yàn)改良系統(tǒng)性能;不能自發(fā)的取得和找尋系統(tǒng)所需的大量知識(shí)。這些系統(tǒng)的推理都是演繹推理,缺少歸納推理,這使得僅能在最大程度上證明已知的定理和事實(shí),不可能有新的發(fā)現(xiàn)。這個(gè)局限隨著人工智能發(fā)展的逐漸深化變得更加明顯。在此種情況下,機(jī)器學(xué)習(xí)技術(shù)己然是人工智能的研究重心之一。其應(yīng)用廣布人工智能領(lǐng)域的智能機(jī)器人、自然語言理解等分支。
2 機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘任務(wù)的商業(yè)應(yīng)用
2.1 機(jī)器學(xué)習(xí)技術(shù)的分類
機(jī)器學(xué)習(xí)可依據(jù)不同的推理方法,劃分為歸納、分析式以及非符號(hào)這三種學(xué)習(xí)方式。在例子存在的空間中,歸納學(xué)習(xí)的系統(tǒng)利用一般操作和特殊操作的方法對(duì)給出的正、反這兩種有關(guān)于某個(gè)概念的集合例子進(jìn)行在空間中的搜查和檢索,還要進(jìn)行經(jīng)過學(xué)習(xí)傾向標(biāo)準(zhǔn)的抉擇過程,最終得到這個(gè)關(guān)于某概念的一般描述。這是從特殊到一般的推理,可稱做從事實(shí)出發(fā)來進(jìn)行理論的最終建立過程。學(xué)習(xí)進(jìn)程一般由大量的專業(yè)領(lǐng)域知識(shí)的運(yùn)用來驅(qū)動(dòng),是分析式學(xué)習(xí)的一個(gè)特點(diǎn)。此時(shí)實(shí)力已在特定的知識(shí)背景環(huán)境中得到大量的考察,不再是無關(guān)特征的、單純的幾何,對(duì)學(xué)習(xí)結(jié)果進(jìn)行了傾向影響的消除。其還可劃分為類比、基于案例以及解釋這三種學(xué)習(xí)方式。網(wǎng)絡(luò)神經(jīng)與算法基因都屬于非符號(hào)學(xué)習(xí)的范疇,將學(xué)習(xí)行為在數(shù)值層次中體現(xiàn)是其主要的特點(diǎn)。博斯和馬哈帕特拉將機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘中的應(yīng)用,作了下述五種歸類。
2.1.1 歸納推理
依據(jù)各不相同的特征,應(yīng)用決策樹進(jìn)行數(shù)據(jù)分類。應(yīng)選擇一個(gè)可作為因變量的變量在數(shù)據(jù)源中,再應(yīng)用組間差別擴(kuò)大與組內(nèi)差異差別縮小的統(tǒng)計(jì)方法進(jìn)行變量的分組,找尋對(duì)因變量影響最大的預(yù)測變量,此時(shí)可將該變量作為決策樹中的一個(gè)節(jié)點(diǎn)來設(shè)置。決策樹的優(yōu)點(diǎn)是直觀,缺點(diǎn)是其分支隨著數(shù)據(jù)復(fù)雜向的提升會(huì)逐漸增多,這使管理變得困難。強(qiáng)大的大數(shù)據(jù)集處理能力,任務(wù)的適于預(yù)測和分類性,解釋簡易的結(jié)果,技術(shù)實(shí)施的簡易性于一體。
2.1.2 神經(jīng)網(wǎng)絡(luò)
由與人腦神經(jīng)元類似的節(jié)點(diǎn)來構(gòu)成,是一個(gè)多層的網(wǎng)絡(luò)結(jié)構(gòu),通過隱藏節(jié)點(diǎn)將輸入和輸出這兩個(gè)節(jié)點(diǎn)連接起來而構(gòu)成。將凡是通過和到達(dá)該節(jié)點(diǎn)進(jìn)行信號(hào)輸入的進(jìn)行加權(quán)所得出的加權(quán)和該節(jié)點(diǎn)的信號(hào)輸入總量。該網(wǎng)絡(luò)的學(xué)習(xí)方式是將樣本的歷史數(shù)據(jù)進(jìn)行大量和反復(fù)性的訓(xùn)練,在此期間,可通過數(shù)學(xué)方法——學(xué)習(xí)規(guī)則使節(jié)點(diǎn)進(jìn)行數(shù)據(jù)的匯總與轉(zhuǎn)化,并進(jìn)行鏈接節(jié)點(diǎn)權(quán)值的調(diào)節(jié)。其有互相間相連的輸入、中間以及輸出這三種層次構(gòu)成,網(wǎng)絡(luò)工作中的絕大部分由多節(jié)點(diǎn)構(gòu)成的中間層來完成。對(duì)分析數(shù)據(jù)的執(zhí)行結(jié)果進(jìn)行輸出是輸出層的主要工作??蛇M(jìn)行復(fù)雜性問題的精確性預(yù)測是該網(wǎng)絡(luò)的優(yōu)點(diǎn)。但是其存在著大數(shù)據(jù)集的處理效率過低的缺點(diǎn),使用該方法的用戶需具備大量的專業(yè)知識(shí)。
2.1.3 事例推理
關(guān)于問題的描述和解決辦法是每個(gè)事例都具備的內(nèi)容。問題提出之后,學(xué)習(xí)系統(tǒng)會(huì)進(jìn)行匹配性事例和解決辦法的尋找。較強(qiáng)的污染與缺失數(shù)據(jù)處理能力是其優(yōu)點(diǎn),常適用于存有大量數(shù)據(jù)的領(lǐng)域。
2.1.4 遺傳算法
是一種優(yōu)化組合方法,基于生物進(jìn)化的適者生存思想,有繁殖、雜交以及變異這三個(gè)基本的操作過程。個(gè)體適應(yīng)度的計(jì)算都源于繁殖操作過程。進(jìn)行信息某一部分的交換過程稱為變異操作過程。通過某一部分信息隨機(jī)改變得到的新個(gè)體屬于變異操作過程。最有個(gè)體的特色,往往得益于重復(fù)性的變異操作。易于集成較強(qiáng)的污染與缺失數(shù)據(jù)處理能力是其優(yōu)點(diǎn),但使用該方法的用戶需具備大量的專業(yè)知識(shí)。
2.1.5 歸納性邏輯程序
用一級(jí)邏輯屬性來進(jìn)行概念的描述與定義。先對(duì)正、負(fù)兩面的例子進(jìn)行定義,其后對(duì)新例子的等級(jí)進(jìn)行劃分。強(qiáng)大的大數(shù)據(jù)集處理能力和理解容易的模型是其優(yōu)點(diǎn),但使用該方法的用戶需具備大量的專業(yè)知識(shí)。這五種方法由上到下依次是商業(yè)應(yīng)用最廣泛的歸納推理方法。
2.2 機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘任務(wù)的應(yīng)用
博斯和馬哈帕特拉將機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應(yīng)用歸結(jié)為下述四種任務(wù)類型:
2.2.1 分類
比如,從商業(yè)數(shù)據(jù)庫中,應(yīng)用數(shù)據(jù)挖掘進(jìn)行有效信息的挖掘,依據(jù)統(tǒng)一偏好或是年貢獻(xiàn)估計(jì)額等標(biāo)準(zhǔn)來進(jìn)行全部客戶的分類。
2.2.2 預(yù)測
比如,當(dāng)顧客有貸款的需要時(shí),銀行系統(tǒng)應(yīng)在第一時(shí)間對(duì)其的信用狀況進(jìn)行審查,應(yīng)用機(jī)器學(xué)習(xí)技術(shù),就可在日常中對(duì)存在于數(shù)據(jù)庫中的源數(shù)據(jù)進(jìn)行不斷的學(xué)習(xí)和修正,得出的信息也就是最具參考性的。
2.2.3 關(guān)聯(lián)
潛存于實(shí)體間或?qū)傩蚤g的聯(lián)系規(guī)律進(jìn)行關(guān)聯(lián)性的分析。第四,偵察。進(jìn)行異?,F(xiàn)象、模式以及離群數(shù)據(jù)的尋找,并對(duì)決策給出起支持作用的解釋,是其主要目的。
3 結(jié)束語
總的來說,很多領(lǐng)域都應(yīng)用到了數(shù)據(jù)挖掘中機(jī)器學(xué)習(xí)技術(shù),這就要求企業(yè)應(yīng)該知曉不同方法和技術(shù)的優(yōu)劣,面對(duì)不同的環(huán)境,選擇應(yīng)用與任務(wù)相匹配的數(shù)據(jù)挖掘技術(shù)。本篇文章首先對(duì)機(jī)器學(xué)習(xí)技術(shù)的界說作了簡述,其后對(duì)機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘任務(wù)的商業(yè)應(yīng)用中機(jī)器學(xué)習(xí)技術(shù)的分類和機(jī)器學(xué)習(xí)技術(shù)在數(shù)據(jù)挖掘任務(wù)的應(yīng)用這兩點(diǎn)作了詳細(xì)的研究,以期促進(jìn)企業(yè)的可持續(xù)發(fā)展。
參考文獻(xiàn)
[1]朱天元.機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2017(03):166-166.
[2]張紹成,孫時(shí)光,曲洋等.大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)在數(shù)據(jù)挖掘中的應(yīng)用研究[J].遼寧大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,44(01):15-17.