謝德剛
(上?;ソ讨悄芸萍加邢薰?上海 201203)
人工智能算法建立于20世紀中期,目前人工智能算法已經(jīng)發(fā)展出許多不同的種類,但有些類型的算法在實際的使用過程中還需要調(diào)整與改進。通常情況下,人工智能算法的工作機制為:人工智能算法的控制者向計算機輸入一些信息,通過計算機模擬人類的一些想法,計算機依據(jù)算法開發(fā)者規(guī)定的特定程序?qū)π畔⒆龀鎏幚恚敵鱿鄳闹噶顏斫鉀Q問題。通過這種運算形式,人工智能算法可以幫助人類解決很多問題。
智能化是人工智能算法發(fā)展的前提與核心,尤其在大數(shù)據(jù)出現(xiàn)以后,人工智能算法的發(fā)展速度得到了進一步提升。在當前這一時期,全球大數(shù)據(jù)數(shù)量不斷增長,相關人員在處理數(shù)據(jù)的過程中勢必會使用到人工智能算法技術,這在一定程度上促進了人工智能算法的發(fā)展。人工智能算法可以高效地對大數(shù)據(jù)進行處理,大數(shù)據(jù)與人工智能算法的協(xié)同發(fā)展,能夠在一定程度上引導人類社會的進步。在當前這個全球依靠大數(shù)據(jù)與高新技術手段發(fā)展的時代,人們利用人工智能算法處理數(shù)據(jù)與其他信息,相關人員在使用人工智能算法的過程中,通過了解與掌握算法的運行機制原理與方法,能夠更加高效、快捷地處理工作中的各項問題,同時也能夠發(fā)現(xiàn)人工智能算法中的不足,合理地對人工智能算法的工作機制等方面做出相應調(diào)整[1]。
在使用人工智能算法的過程中,可以將算法視為人們重新了解并認識自己的一種方式,并利用算法來處理不同種類的計算問題,使社會系統(tǒng)更具有規(guī)范性。人工智能算法運行的基本機制就是由開發(fā)者定義出一個特定的計算程度,在使用算法的過程中,將需要處理的數(shù)值與信息進行輸入,算法通過計算機等設備按照規(guī)定的程序?qū)?shù)值與信息進行處理,輸出計算的結果,因此算法具有一定的穩(wěn)定性。
在實際生活中,也存在著許多種類的算法,例如計算機程序、硬件設備、軟件設備以及語言系統(tǒng)等,都屬于算法技術。同時,不同類型的算法也可以應用于不同的運算或程序當中,比如:在矩陣運算、多項式計算、近似算法、線性規(guī)劃、字符串匹配、計算幾何學等數(shù)學問題當中,這些方面都運用了算法。算法技術在建立之后經(jīng)歷了許多年的發(fā)展與創(chuàng)新,在當前這個法制社會時代,人工智能算法在法律的變革等各項活動中起到了十分重要的作用,因此人工智能算法可以在一定程度上影響國家政治策略的制定,影響人們的工作和生活[2]。算法已經(jīng)深入人們生活的各項活動當中,分治算法的設計過程如圖1所示。
圖1 分治算法的設計過程圖
K-means 算法又被稱為K 均值算法,該種算法屬于非監(jiān)督學習當中的一種井點聚類算法,該算法依據(jù)核心理念是將相同的事物分為一類,并將其進行標注。K均值算法的運行機制如下:第一步,利用隨機的方式選擇k個樣本作為原始聚類中心;第二步,測算出所選取樣本與聚類中心的距離,按照距離的遠近程度將樣本分配給與其距離最近的聚類中心;第三步,再次測算聚類中心,完成計算工作后重復第二步操作,當樣本中的每一個對象都符合最終的終止條件后,方可停止計算。
K-means 算法可以應用在許多的工作當中,在文本識別的工作與圖像分割的工作中,都可以使用該種算法進行工作,同時,若在其他可以運用聚類方式進行工作的場景中,也可以使用該種算法對數(shù)據(jù)以及信息進行相應的處理[3]。
k-NN算法即k近鄰算法,屬于監(jiān)督學習中的分類算法,其運行原理是將標注好的信息與數(shù)據(jù)及進行歸類。該算法的運行原理為規(guī)定集中對象D,通過計算得出與其差距最小的k 個對象,并將這些數(shù)據(jù)視為元素編寫成集合E=[e1,e2,…,ek],若集合E 中的元素大部分的為一個種類,則可得出結論D也為該種種類。
該算法具體的使用方法如下:第一,選取m個需要分類的初始數(shù)據(jù),并規(guī)定k 的初始值;第二,將每個數(shù)據(jù)最鄰近的數(shù)據(jù)編寫為集合E={E1E1…Em};第三,判斷集合E 中元素的種類;第四,計算誤差,規(guī)定新的k值,重新進行第二、三步與第四步的工作,當誤差率達到預期時,選用誤差率最小的k的數(shù)值。
k-NN算法通常情況下使用于文本分類工作、模式識別工作、聚類分析工作等,同時k-NN算法也被用于保險等行業(yè)的工作當中。
Apriori 人工算法屬于挖掘頻繁項集算法,GSP、FP-Tree、CBA等其他人工智能算法均由Apriori衍生而來。Apriori算法的運行機制原理如下:第一步,規(guī)定支持度閾值;第二步,對數(shù)據(jù)集中的所有數(shù)據(jù)進行統(tǒng)計,統(tǒng)計相同數(shù)據(jù)出現(xiàn)的頻率,計算出其支持度;第三步,刪去小于支持度閾值的數(shù)據(jù),將其余的數(shù)據(jù)編寫成二項集;第四步,重復上述幾步的工作,編寫出三項集;第五步,重復上述工作,至k項集為k+1項集。
目前,Apriori 算法大量使用于線下購物數(shù)據(jù)集與網(wǎng)絡電子購物數(shù)據(jù)集等[4]。
按照概率統(tǒng)計對人工智能算法進行分類,人工智能算法可分為隱馬爾可夫模型、邏輯回歸、最大期望值算法以及PageRank 算法等類型。HMM 隱馬爾可夫模型是以馬爾可夫鏈為基礎建立的一種統(tǒng)計模型。其運行機制原理為:現(xiàn)今某一時刻,某事物的發(fā)生概率,只與該事物在過去的狀態(tài)有關。在實際的工作與生活中隱馬爾可夫模型的運行機制原理存在許多不合理的地方。因此,隱馬爾可夫模型算法的開發(fā)者在該算法中添加了一些隱含因素,用以確保利用該形式的人工智能算法得出的計算結果更符合事實。例如:在股市的預測工作當中,若前一天情況較好的為A市,但證監(jiān)會在后一天公布了某些不利于股市的消息,那今天A 市的概率就會隨之降低。
當前這一時期,隱馬爾可夫模型已經(jīng)被應用于語音識別工作、天氣預測以及DNA測序工作當中。
邏輯回歸是利用線性回歸計算方式的基本原理,在收集信息與數(shù)據(jù)并對其進行分類的過程中,使用最小二乘法。在對離散型較高的信息與數(shù)據(jù)進行分類時,線性回歸算法具有一定的局限性,但邏輯回歸算法在線性回歸算法的運行機制原理中,將Sigmoid函數(shù)融合其中,此種方式能夠更好地對離散型較高的信息與數(shù)據(jù)做出處理。
在預測以及判斷某些數(shù)據(jù)與問題時,尤其在一些醫(yī)學行業(yè)工作當中,人們通常使用邏輯回歸算法來處理相應的問題。
最大期望值算法是在保留極大似然估計原理的基礎之上,對某些計算方式做出一些科學的調(diào)整。極大似然估計算法的原理為:若輸入該算法中的數(shù)據(jù)能夠最大化地體現(xiàn)樣本概率,則將該數(shù)據(jù)視為真實數(shù)據(jù);并且按照已知的條件建立似然函數(shù)關系,利用求導的方式計算出參數(shù)的數(shù)值。
最大期望值算法的運行原理機制與極大似然估計算法有所不同,第一步,使用隱藏變量的方式測算出初始期望值;第二步,建立最大似然估計方程;第三步,將初始期望值代入最大似然估計方程中,并不斷重復方程計算出最大期望值。
在參數(shù)的優(yōu)化與求解的工作當中,通常使用最大期望值算法進行計算。
PageRank 算法又稱網(wǎng)頁排名算法,其運行機制原理較為簡單。通常情況下,若某個網(wǎng)頁的被引用率較高,則其等級就相對較高;若等級較低的網(wǎng)頁被等級較高的網(wǎng)頁引用,則被引用的網(wǎng)頁的等級將會提高。
該人工智能算法通常被使用于網(wǎng)頁排名工作當中。
在當前這一階段,大數(shù)據(jù)平臺豐富了線上電子商務行業(yè)的經(jīng)營,同時人工智能算法也被應用于該行業(yè)與其他高新科技的工作當中。網(wǎng)絡平臺作為一個信息數(shù)量與用戶數(shù)量較大的平臺,需要使用人工智能算法技術對平臺用戶注冊信息與其他數(shù)據(jù)等進行處理與分類,以保證平臺的長期穩(wěn)定發(fā)展。因此,人工智能算法技術若想滿足使用者的需求,就需要算法編寫人員不斷對算法做出完善,利用大數(shù)據(jù)對各類信息進行分析與處理。雖然人工智能算法可以幫助使用者提高處理數(shù)據(jù)的效率,利用科學的方式對某些問題進行分析。
人工智能算法隨著時代的發(fā)展而不斷變化,當前,人工智能算法已經(jīng)被廣泛地應用于電子商務行業(yè)以及許多網(wǎng)絡社交平臺。算法的開發(fā)者或控制者利用人工智能算法的程序?qū)ζ脚_中的各類數(shù)據(jù)進行歸類與分析,保持各平臺的穩(wěn)定與正常運行,使用算法分析得出的結果,精準地向平臺用戶推送各類信息。因此,人工智能算法正在潛移默化地影響著人們的思想與行為。
人工智能算法利用計算機等媒介,通過對當今事物信息的學習,利用開發(fā)者編寫的特定程序,能夠精準地分析某些問題,尤其在學習以及推送等工作中,算法有著巨大的優(yōu)勢。比如:微信、抖音以及今日頭條等網(wǎng)絡媒體平臺,都在利用算法對平臺的內(nèi)容以及用戶的信息進行分析,以保證平臺能夠精準地為用戶推薦相應的網(wǎng)絡內(nèi)容,持續(xù)吸引平臺用戶。人工智能算法技術與傳統(tǒng)的新聞媒體時代所應用的推送方式不同,人工智能算法能夠高效地結合大數(shù)據(jù)對信息與數(shù)據(jù)進行有效的分析,該技術的學習能力與信息處理能力更為優(yōu)秀,促進了網(wǎng)絡各平臺的發(fā)展。
通常情況下,傳統(tǒng)的媒體行業(yè)都是通過人工篩選的方式來挑選新聞內(nèi)容,播出的內(nèi)容能夠體現(xiàn)新聞行業(yè)的價值取向。但在網(wǎng)絡社交方式出現(xiàn)后,人們需要自主對某些價值取向較差或不感興趣的信息進行過濾。同時,某些具有不良價值取向的信息也出現(xiàn)在社交平臺上,還影響了社會的安定與發(fā)展[5]。
對此,相關技術人員利用人工智能算法與大數(shù)據(jù)相結合,對網(wǎng)絡平臺內(nèi)容與用戶行為數(shù)據(jù)進行了科學的分析與處理,分析出每一位平臺用戶的喜好,為其推薦他們喜歡的視頻與新聞等內(nèi)容。此外,人工智能算法還能夠根據(jù)用戶喜好內(nèi)容的信息與數(shù)據(jù),合理地將平臺使用者歸類,向擁有不同喜好的用戶群體推送相應的信息,使平臺使用者可以更加快捷地接收到自己想獲得的信息。這種現(xiàn)象與澳大利媒體專家Axel-Bruns的觀念吻合,當新聞媒體平臺的使用者數(shù)量極大時,平臺引導用戶對新聞進行討論的能力就會變?nèi)?,平臺若要生存就必須了解用戶的喜好,并向其推送相關的信息。雖然人工智能算法可以實現(xiàn)滿足用戶需求這一目的,但此種方式在一定程度上控制了人們的思維。
在一定程度上來講,人工智能算法利用了控制與邏輯,可以被視為編程,其運行機制原理大多數(shù)為編寫一個能夠解決某一類問題的演繹推理邏輯程序,輸入問題、信息或數(shù)據(jù),人工智能算法利用計算機與大數(shù)據(jù)等,按照程序解決問題。此種形式使人工智能算法在本質(zhì)上,通過機器學習的方式對用戶信息及數(shù)據(jù)等進行收集、分析與歸納,再通過固定的模式計算得出一個較為精準的結果。并且,人工智能算法的開發(fā)者還會不斷依照時代與技術的發(fā)展,對算法程序進行更新,這保證了算法能夠持續(xù)進行學習,保證了算法的精確度。同時,大數(shù)據(jù)技術的推進,使人工智能算法在對不同種類的信息進行分析時,擁有更加完整且可靠的數(shù)據(jù)樣本,這也推動了人工智能算法的發(fā)展。因此,網(wǎng)絡媒體平臺利用人工智能算法進行數(shù)據(jù)的處理,能夠為用戶持續(xù)推送符合其興趣愛好的信息。
人工智能算法技術與傳統(tǒng)新聞媒體使用人工挑選信息的方式有本質(zhì)上的區(qū)別。人工挑選信息更注重信息的價值取向,而利用人工智能算法技術向網(wǎng)絡媒體平臺使用者推送信息,更加注重平臺使用者的興趣愛好,往往忽視了傳播內(nèi)容的質(zhì)量。并且,通過人工智能算法收集并分析到的用戶喜好,是人工智能通過程序計算而出的,并非用戶的真實喜好。人工智能算法會將擁有相同喜好的用戶分為一類,在推送平臺內(nèi)容的過程中,某些用戶可能會接收到該群體內(nèi)其他用戶喜好的內(nèi)容。
其實,人工智能算法也存在著一定的價值觀偏向,這種價值觀偏向一般源于人工智能算法開發(fā)者的底層邏輯。通常情況下,算法開發(fā)者在編寫算法的過程中,將自己的層邏輯中的一些思想帶入算法當中,而算法的運行機制原理就是通過特定的系統(tǒng)與程序以及對外界知識的機器學習,對數(shù)據(jù)與信息做出相應的計算與處理,從而解決問題,導致算法在運行的過程中受到開發(fā)者底層邏輯的影響,得出的信息與數(shù)據(jù)會存在一定的價值觀傾向。并且,用戶在平臺中的反饋的信息等也存在主觀的價值傾向,這加重了人工智能算法在處理問題時產(chǎn)生的價值觀傾向問題。這些問題導致互聯(lián)網(wǎng)平臺使用者在無形之中受到了人工智能算法的價值觀傾向的影響,用戶的思想與行為在一定程度上受到了人工智能算法的操控。
在對語音、圖像以及文本等信息進行處理時,需要將這些內(nèi)容轉(zhuǎn)化為計算機能夠辨識二進制的數(shù)據(jù),人工智能算法利用計算機系統(tǒng)對這些數(shù)據(jù)進行分析與處理,提取數(shù)據(jù)中具有一定特征的信息,并將這些信息進行分類,在提取數(shù)據(jù)信息的過程中,出現(xiàn)了許多高效快捷的方法。
特征提取方法通常情況下就是利用二維矩陣轉(zhuǎn)化的方式,將不同的圖片數(shù)據(jù)提取為二維矩陣。比如:灰色的圖片會被處理提取為具有一個通道的二維矩陣,彩色圖鑒會被處理提取為具有3個通道的二維矩陣。
對于文本信息而言,可以利用統(tǒng)計的方法中的詞集和詞袋模型、熵概念當中的信息增益法、神經(jīng)網(wǎng)絡當中的詞向量模型、獨熱編碼的獨熱模型等方式,對文本進行數(shù)據(jù)化信息處理。當前,對文本的數(shù)據(jù)分析處理,最好的方式為詞向量模型法。并且,在處理語言信息的過程中,通常都使用該種方式,對文本數(shù)據(jù)進行系統(tǒng)化的分析。
在使用特征提取法進行數(shù)據(jù)的轉(zhuǎn)化與處理的過程當中,通常都會遇到特征分散或范圍過大等問題,因此人工智能算法開發(fā)者與使用者應改進數(shù)據(jù)收集與處理的方式,使用SVD 與PCA 等降維方法,以及注意力機制法等關鍵特征提取方法[6]。
綜上所述,人工智能算法的運行機制原理與方法值得人們進行了解與研究。在現(xiàn)今的社會環(huán)境當中,人工智能算法甚至能夠改變?nèi)祟惿鐣c人類自身的一些思維與行為模式。現(xiàn)代社會越來越重視技術的發(fā)展與使用,在新型技術與人工智能算法的影響下,社會整體逐漸走向了智能化,社會智能化已經(jīng)成為一種常態(tài)。此外,人類自身的發(fā)展能夠直接影響人工智能算法的發(fā)展,人類對智能生活與智能工作的不斷追求,是促相關技術人員不斷改進人工智能化算法的原因之一。因此,相關人員應更加了解和掌握人工智能算法的運行機制原理及方法,將人工智能算法與其他高新技術相結合,使人工智能算法能夠更好地服務于社會。