王作鵬
【摘要】隨著信息技術(shù)和人工智能的發(fā)展,模式識(shí)別技術(shù)得到了廣泛的關(guān)注和深入的研究。本文就模式識(shí)別技術(shù)的內(nèi)容和研究方式進(jìn)行了分析,進(jìn)而討論了當(dāng)前時(shí)期模式識(shí)別技術(shù)的應(yīng)用范圍和今后時(shí)期模式識(shí)別技術(shù)的發(fā)展趨勢(shì)。
【關(guān)鍵詞】信息技術(shù) 人工智能模式識(shí)別
【中圖分類號(hào)】TP309 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1672-5158(2013)04-0483-01
模式識(shí)別是指利用計(jì)算機(jī)或者其他輔助工具對(duì)圖形圖像、語言文字、自然物體等進(jìn)行信息統(tǒng)計(jì)、特征識(shí)別和分類的一門學(xué)科。20世紀(jì)50年代人工智能技術(shù)的興起極大的帶動(dòng)了模式識(shí)別技術(shù)的發(fā)展。模式識(shí)別技術(shù)被廣泛應(yīng)用與人工智能、計(jì)算機(jī)工程、神經(jīng)生物學(xué)、智能機(jī)器人學(xué)、醫(yī)學(xué)、高能物理、地質(zhì)勘探等多個(gè)領(lǐng)域的語音識(shí)別、圖像識(shí)別、人臉識(shí)別、指紋識(shí)別、特征聚類等研究中。模式識(shí)別技術(shù)應(yīng)用統(tǒng)計(jì)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行分析和處理,進(jìn)而指導(dǎo)實(shí)際應(yīng)用,對(duì)國(guó)民經(jīng)濟(jì)的發(fā)展和科學(xué)技術(shù)的進(jìn)步產(chǎn)生了極大的推動(dòng)作用。
1、模式識(shí)別技術(shù)的研究?jī)?nèi)容和研究方法
模式識(shí)別的主要研究?jī)?nèi)容分為兩個(gè)方面。一方面是研究生物體感知對(duì)象時(shí)所使用的主要方法和特征,該研究?jī)?nèi)容屬于認(rèn)知科學(xué)范疇;一方面是按照限定條件,利用現(xiàn)有的模式識(shí)別理論和識(shí)別方法對(duì)給定的目標(biāo)進(jìn)行識(shí)別和分類,改研究?jī)?nèi)容屬于信息科學(xué)研究范疇。本文所述的模式識(shí)別研究?jī)?nèi)容主要指后一類內(nèi)容。
現(xiàn)有的模式識(shí)別研究類型有統(tǒng)計(jì)模式識(shí)別和結(jié)構(gòu)模式識(shí)別兩種。其中統(tǒng)計(jì)模式識(shí)別研究是當(dāng)前模式識(shí)別研究的熱點(diǎn),其使用基于概率論的貝葉斯決策系統(tǒng)對(duì)最優(yōu)分類器進(jìn)行設(shè)計(jì),進(jìn)而實(shí)現(xiàn)對(duì)目標(biāo)的識(shí)別;而結(jié)構(gòu)模式識(shí)別則是通過模式與子模式分層結(jié)構(gòu)的樹狀信息進(jìn)行識(shí)別。
統(tǒng)計(jì)模式識(shí)別研究方法的主要原理為:將相似度超過預(yù)定閾值的樣本聚類成簇。具體來說,對(duì)所要識(shí)別的對(duì)象的特征觀察量進(jìn)行特征提取,然后將所提取的特征構(gòu)成特征向量d,總結(jié)特征向量d,表明當(dāng)前研究的問題具有c個(gè)類別,每個(gè)類別都有自己的狀態(tài)w,計(jì)算不同模式之間的距離函數(shù),將給定的模式歸入到某一類別中實(shí)現(xiàn)特征分類和模式識(shí)別。
具體的統(tǒng)計(jì)模式識(shí)別的分類方法有判別函數(shù)法、k緊鄰分類法、非線性映射法、特征分解法、主因子分析法等。
2、模式識(shí)別技術(shù)的應(yīng)用
當(dāng)前的模式識(shí)別主要應(yīng)用在以下幾個(gè)方面。
首先是文字識(shí)別。其通過使用計(jì)算機(jī)對(duì)現(xiàn)有的字符進(jìn)行聚類分析,得到相應(yīng)的模板庫或者樣本簇,然后對(duì)所需識(shí)別的文字進(jìn)行信息采集和特征分析與處理,進(jìn)而按照得到的特征進(jìn)行判別和歸類,實(shí)現(xiàn)對(duì)文字的識(shí)別。常用的文字識(shí)別方法有模板匹配法和幾何特征抽取法等。文字的模式識(shí)別是模式識(shí)別最為成熟的應(yīng)用領(lǐng)域,如閱讀、翻譯、檢索、稿件校對(duì)和編輯、信息分類等。
其次是語音識(shí)別。語音識(shí)別的實(shí)現(xiàn)需要綜合多學(xué)科技術(shù),如信號(hào)處理、信息論和概率論、人工智能、發(fā)生機(jī)理和聽覺機(jī)理等才能夠?qū)崿F(xiàn)對(duì)語音的識(shí)別。語音識(shí)別首先要構(gòu)建樣本模板庫,按照不同語音的頻譜特性或其他特性等進(jìn)行特征描述,構(gòu)建模板庫,然后對(duì)需要識(shí)別的語音信息進(jìn)行數(shù)字化處理,轉(zhuǎn)變?yōu)檫m合計(jì)算機(jī)分析的數(shù)字信息,在模板庫的基礎(chǔ)上對(duì)采集到的語音信息按照特定的方式進(jìn)行人工智能處理,最終實(shí)現(xiàn)識(shí)別。近年來,生物識(shí)別技術(shù)得到了廣泛的應(yīng)用。其中聲紋識(shí)別技術(shù)因具有方便、經(jīng)濟(jì)、準(zhǔn)確等特點(diǎn)被用做身份驗(yàn)證的一種方式應(yīng)用人們?nèi)粘5纳詈凸ぷ髦?。其中基于基因算法?xùn)練的連續(xù)隱馬爾科夫模型語音識(shí)別方法具有識(shí)別速度快、識(shí)別精度高等優(yōu)點(diǎn),已經(jīng)成為語音識(shí)別中所使用的主流技術(shù)。
再次是生物特征識(shí)別。生物特征識(shí)別技術(shù)是結(jié)合傳感器、生物統(tǒng)計(jì)學(xué)、光學(xué)、聲學(xué)以及計(jì)算機(jī)技術(shù)等多種高科技技術(shù)而發(fā)展起來的,對(duì)人體固有生理特征和行為特征進(jìn)行分類和識(shí)別的一種技術(shù)。該技術(shù)具有生物學(xué)特性,不僅僅局限于人類本身,諸如細(xì)胞或者人體的指紋等均屬于生物特征識(shí)別技術(shù)范疇。這種識(shí)別技術(shù)被廣泛應(yīng)用與身份認(rèn)證中。
3、模式識(shí)別技術(shù)的發(fā)展趨勢(shì)
隨著智能化、信息化、網(wǎng)絡(luò)化的深入,人工智能會(huì)更加成熟和完善,而人工智能技術(shù)的支撐技術(shù)之一就是模式識(shí)別技術(shù),因此模式識(shí)別技術(shù)具有非常大的發(fā)展空間,各科研機(jī)構(gòu)均將其作為未來科技發(fā)展的重點(diǎn)來對(duì)待。具體來說,未來的模式識(shí)別技術(shù)的主要發(fā)展方向有以下幾個(gè)方面。
(1)語音識(shí)別技術(shù)。雖然語音識(shí)別技術(shù)在當(dāng)前社會(huì)中已經(jīng)有所應(yīng)用,但是其對(duì)語音識(shí)別的精度還不夠高,在語音應(yīng)用方面還存在諸多問題,如對(duì)中文的識(shí)別不夠好等。同時(shí),鑒于語音技術(shù)正在逐漸成為人機(jī)交互的一個(gè)關(guān)鍵接口,語音識(shí)別的發(fā)展還存在巨大的空間。我國(guó)的互聯(lián)網(wǎng)中心的預(yù)測(cè)資料表明,未來五年內(nèi),中文語音識(shí)別市場(chǎng)會(huì)有超過400億的市場(chǎng)容量,且之后會(huì)按照超過30%的速度進(jìn)行增長(zhǎng)。
(2)生物認(rèn)證技術(shù)。生物特征具有唯一性,因此應(yīng)用生物特性進(jìn)行安全認(rèn)證可以有效保證認(rèn)證的精度和準(zhǔn)確度,因此基于模式識(shí)別技術(shù)的生物認(rèn)證技術(shù)是社會(huì)發(fā)展的方向。完善的生物認(rèn)證技術(shù)可以讓人們脫離對(duì)密碼、磁卡或者其他憑證的依賴,只需要依靠自身的生物特征即可實(shí)現(xiàn)身份標(biāo)識(shí)。
(3)數(shù)字水印技術(shù)。數(shù)字水印技術(shù)在不影響原數(shù)字載體的使用價(jià)值的前提下對(duì)載體進(jìn)行標(biāo)識(shí),這種隱藏的標(biāo)識(shí)信息可以被用來進(jìn)行驗(yàn)證、識(shí)別或者對(duì)比等,進(jìn)而確認(rèn)數(shù)字載體是否合法或者可用。數(shù)字水印技術(shù)是信息隱藏技術(shù)的一個(gè)重要發(fā)展方向。
總結(jié)
模式識(shí)別技術(shù)是一類綜合性的技術(shù),需要多領(lǐng)域、多學(xué)科的科研技術(shù)相互配合才能夠完成,可以按照既定要求和限制完成信息的處理和應(yīng)用。在今后的社會(huì)發(fā)展中,模式識(shí)別技術(shù)具有廣闊的應(yīng)用前景和應(yīng)用領(lǐng)域。