劉江
人類正在進入后信息時代,計算機越來越廣泛地進入到幾乎所有的科技和生活領(lǐng)域?,F(xiàn)代計算機具有強大的功能和運行速度,但與人腦相比,其智能化程度仍有待提高。如何讓計算機具有類人腦的學習與分析能力,擁有“視覺”“聽覺”,并可通過“思考”與人類溝通交流,是當今世界計算機視覺研究領(lǐng)域各國科學家不斷追求和探索的目標。
計算機視覺是人工智能領(lǐng)域的核心之一,其研究的終極目標是讓機器具有人一樣的視覺功能。西安交通大學電子與信息工程學院楊國安教授在計算機視覺領(lǐng)域沉心研究多年,為計算機視覺的發(fā)展提供了豐富的理論基礎(chǔ)。
“西安交通大學鄭南寧院士是圖像處理、計算機視覺和模式識別領(lǐng)域的國際知名專家,是他2001年把我從日本引進回來的?!边@是楊國安選擇計算機視覺和圖像處理領(lǐng)域的契機。在該領(lǐng)域,楊國安主要研究新型的小波變換、多尺度幾何分析和壓縮感知理論,對這些最前沿的理論進一步地改進,以提高圖像分析與理解的能力、計算機視覺模型的精度、大數(shù)據(jù)的模式分類的效率以及互聯(lián)網(wǎng)圖像檢索的正確識別率。
留學回國后,楊國安在鄭南寧院士團隊參與完成了多項國家項目,包括國家自然科學基金創(chuàng)新研究群體項目“智能化視覺信息處理理論與實現(xiàn)技術(shù)”,國家自然科學基金重點項目“高效可伸縮視頻編解碼基礎(chǔ)理論與方法研究”,國家重點基礎(chǔ)研究發(fā)展計劃項目“視覺信息環(huán)境感知與識別關(guān)鍵技術(shù)”,國家科技支撐計劃項目“數(shù)字媒體內(nèi)容互通共用關(guān)鍵技術(shù)”,國家高技術(shù)研究發(fā)展計劃項目“基于離散小波變換的JPEG2000圖像處理及場景數(shù)據(jù)實時傳輸”等。其中,在國家科技支撐計劃項目中,楊國安取得國家發(fā)明專利“一種分布式多格式數(shù)字視頻轉(zhuǎn)碼結(jié)構(gòu)設(shè)計方法”的正式授權(quán)。該項專利開發(fā)出了一種分布式多格式數(shù)字視頻轉(zhuǎn)碼結(jié)構(gòu)設(shè)計新方法:對源視頻文件解復用后將視頻進行快速無縫分割,通過動態(tài)調(diào)度程序,將視頻片段以及音頻文件發(fā)送到各個轉(zhuǎn)碼計算機上進行快速多格式轉(zhuǎn)碼,在輸入某一種格式的視頻后只需解碼一次,便能輸出多種格式的碼流,并且能對輸出碼流進行很好的碼率控制,最后收集轉(zhuǎn)碼后的視頻片段進行無縫拼接并與轉(zhuǎn)碼后的音頻文件復用。該項專利不僅改善了像素域級聯(lián)轉(zhuǎn)碼器的轉(zhuǎn)碼效率,也增強了視頻轉(zhuǎn)碼后的質(zhì)量,并在我國相關(guān)電視廠家得到實際應(yīng)用,取得了良好的社會和經(jīng)濟效益。
目前,楊國安正在主持國家自然科學基金項目“基于生物視覺稀疏編碼特性和顯著性特征的多尺度幾何分析紋理模型研究”。他介紹說,今后的研究重點將是進一步研究基于多尺度幾何分析和脈沖耦合神經(jīng)網(wǎng)絡(luò)的生物視覺模型,并將其應(yīng)用到大數(shù)據(jù)的模式識別以及互聯(lián)網(wǎng)圖像檢索上。
學術(shù)方面,楊國安動心聚力,砥礪前行。他長期兼任IEEE Transactionson Signal ProcessingENeural Networks等世界頂級期刊的通信評審專家,并在IEEE,Elsevier和springer等知名期刊和國際會議上發(fā)表SCI和EI收錄論文30余篇,其中SCI收錄8篇,EI收錄21篇,取得國家專利2項,出版“十一五”至“十三五”規(guī)劃教材各1部,為碩士和博士研究生開設(shè)課程,培養(yǎng)碩士研究生和博士研究生30余名,2016年2月又培養(yǎng)出交通大學歷史上第一位日本博士留學生。
在科研的世界里,只有腳踏實地,持續(xù)奮斗與攀登,才可能收獲點點星光。在20余年的研究工作中,楊國安亦是如此勉勵自己,不斷創(chuàng)新,突破傳統(tǒng)。相信在未來,他一定能收獲一片屬于他的星空。
科學中國人2017年2期