“我其實(shí)還只是一名年輕的科研者,科研經(jīng)驗(yàn)還算不上豐富?!边@是內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院研究員呼德在采訪中多次提及的一句話。在他眼中,雖然在信號(hào)處理領(lǐng)域求學(xué)耕耘多年,但他手中握著的仍只是一支鈍筆,只能約略地捕捉住一點(diǎn)關(guān)于聲音信號(hào)的美,粗淺地描摹出信號(hào)與信息處理專業(yè)的形與色、風(fēng)格與氣息,努力地在行業(yè)痛難點(diǎn)上留下一些自己的痕跡,讓自己的學(xué)術(shù)文章落地實(shí)用,化作改變?nèi)粘I畹囊豢|馨香。
然而,事實(shí)真的如此嗎?主持、參與過(guò)多項(xiàng)國(guó)家級(jí)縱向課題及與華為、螞蟻金服等企業(yè)合作橫向課題的呼德,不僅以第一作者、通訊作者在《IEEE/ACM音頻、語(yǔ)音和語(yǔ)言處理匯刊》(IEEE/ACM Transactions on Audio,Speech and Language Processing,TASLP)、《IEEE 無(wú)線通信匯刊》(IEEE Transactions on Wireless Communications)等重要學(xué)術(shù)期刊上發(fā)表論文十余篇,擔(dān)任《數(shù)據(jù)采集與處理》期刊青年編委、中國(guó)計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專委會(huì)委員、人工智能學(xué)會(huì)青年工作委員會(huì)委員等職務(wù),更重要的是,他對(duì)于如今的聲音信號(hào)處理研究頗具見(jiàn)解:“麥克風(fēng)網(wǎng)絡(luò)就像是聲音信號(hào)處理的‘魔杖’,讓機(jī)器不僅能夠‘聽(tīng)到’,更能‘聽(tīng)懂’。我們要做的不僅僅是對(duì)聲音的捕捉與過(guò)濾,更是一種在繁音中尋覓清籟的過(guò)程,讓每種聲音都能得到清晰的傳播?!?/p>
“未來(lái)的回響”
雖然今日的呼德與信號(hào)處理領(lǐng)域的科研工作密不可分,但其實(shí)二者結(jié)緣伊始完全是一場(chǎng)陰差陽(yáng)錯(cuò)。自嘲為“小鎮(zhèn)做題家”的他直到高考報(bào)志愿時(shí)都還只是抱著“學(xué)了這門(mén)學(xué)科就有機(jī)會(huì)得到國(guó)內(nèi)三大通信公司工作機(jī)會(huì)”的就業(yè)愿景才在2010年的本科志愿填報(bào)時(shí)選擇了通信工程專業(yè),但光陰匆匆,母校遼寧大學(xué)在其本科4年中帶給他的不僅是日益增長(zhǎng)的專業(yè)知識(shí),更是“放眼看世界”的開(kāi)闊視野與“科技報(bào)國(guó)”的職業(yè)責(zé)任。而這些都在后期化作了“畢業(yè)即就業(yè)”與“接續(xù)深造”的天平上悄然加重的砝碼,致使他最終選擇到大連理工大學(xué)讀研。
當(dāng)邁入研究生階段,在導(dǎo)師殷福亮教授與陳喆教授的諄諄教導(dǎo)下,呼德開(kāi)始正式接觸聲音信號(hào)處理工作,“兩位老師的言傳身教使我受益匪淺,影響我到如今”。據(jù)呼德回憶,自己在剛步入科研領(lǐng)域時(shí)并不算一位細(xì)心嚴(yán)謹(jǐn)、思維活躍的“后來(lái)者”,因此為老師們帶去了不少的“麻煩”,“比如殷老師是一位極其認(rèn)真負(fù)責(zé)的導(dǎo)師,我的每篇論文他都要逐句閱讀、逐字修改,非常細(xì)致,且他的大局觀非常令人欽佩;而陳老師的思維很活躍,天馬行空間會(huì)生出很多新鮮想法,對(duì)于知識(shí)的執(zhí)著和渴求也足以令我終身學(xué)習(xí)”。于是,遇到難題便去找二位教授“談天說(shuō)地”的歲月成了呼德求學(xué)日子里最溫馨美好的記憶,而他也不負(fù)前輩所望,在科研的道路上極速成長(zhǎng),還未畢業(yè)時(shí)就已經(jīng)參與到與華為合作的相關(guān)項(xiàng)目之中。
或許多數(shù)人都經(jīng)歷過(guò)這樣的困擾:打電話的時(shí)候偶爾會(huì)在聽(tīng)筒聽(tīng)到自己的聲音。之所以會(huì)產(chǎn)生這類現(xiàn)象,根源在于“回聲消除”算法不夠完善,誤將回聲反傳回來(lái)。為解決這一難題,呼德在華為西安研究所一扎根就是大半年?!爱?dāng)時(shí)我一個(gè)人代表我們課題組去為企業(yè)降本增效,解決這一問(wèn)題。難度還是不小的,除了要把回聲消除干凈,還要將運(yùn)算量壓得極低,這中間的平衡點(diǎn)非常難找?!弊罾_時(shí),這些難點(diǎn)都變成了呼德的夢(mèng)魘,“真的是在睡夢(mèng)里還在琢磨怎么才能完成目標(biāo)”。但所幸,結(jié)果是可觀的。當(dāng)項(xiàng)目真正落地,在全世界范圍內(nèi)使用的效果還是讓呼德再一次體會(huì)到了科研者特有的成就感,那是“風(fēng)雨后的彩虹”“烏云中的陽(yáng)光”。
也正是這一次成功的項(xiàng)目經(jīng)歷,讓呼德進(jìn)一步樹(shù)立了科研的自信,也讓他聽(tīng)到了“未來(lái)的回響”,“我想,只要我堅(jiān)持下去,就能把青春夢(mèng)想扎根在祖國(guó)的大地上”。
2018年年初,站在人生的十字路口,呼德面臨著一次重大選擇——申博與否?“碩士期間參與的幾個(gè)項(xiàng)目落地,讓我獲得了前所未有的成就感”,但“象牙塔”外五光十色的世界又讓他心生迫切,想要利用所學(xué)去為社會(huì)做些什么,直到2018年4月,美國(guó)制裁中興的噩耗傳來(lái)?!拔磥?lái)7年內(nèi)禁止中興通訊向美國(guó)企業(yè)購(gòu)買敏感產(chǎn)品”的禁令在當(dāng)時(shí)嚴(yán)重危及著中興通訊的生存,也傷害了大量中興通訊合作伙伴的利益。輿論場(chǎng)上物議沸然,而國(guó)人的憤怒、不安與扼腕,呼德都懂。在感同身受之下,他燃起了在所在課題組讀博、繼續(xù)科研的斗志,“探索我們自己的算法,最大程度地替代進(jìn)口,力圖使發(fā)展不被他人所左右”是他為自己立下的第一條職業(yè)座右銘,且延續(xù)至今。
“智慧的聽(tīng)者”
畢業(yè)后的呼德幾乎沒(méi)有猶豫就選擇回到了家鄉(xiāng),“回報(bào)桑梓一直是我的愿望”,而正如他所言,科研者只有把心靈貼在熱愛(ài)的大地上,想他人之所想,才能聆聽(tīng)到人類文明最深處的需求,真正解決困擾大眾生活的關(guān)鍵性問(wèn)題。
而呼德所致力解決的首個(gè)問(wèn)題,便是如何突破常規(guī)麥克風(fēng)陣列信號(hào)處理的技術(shù)瓶頸。麥克風(fēng)陣列信號(hào)處理利用聲音的時(shí)間、空間信息完成許多語(yǔ)音處理任務(wù),如聲源定位與跟蹤、聲源分離、聲源數(shù)目估計(jì)及語(yǔ)音增強(qiáng)等,近20年來(lái),此技術(shù)發(fā)展很快,取得了重要進(jìn)展,但也逐漸暴露出了一些不足:例如陣列拓?fù)浣Y(jié)構(gòu)通常是固定且規(guī)則的,如均勻線陣、圓形陣列等,安裝后不能隨意移動(dòng);空間覆蓋率較低,當(dāng)聲源距麥克風(fēng)陣列較遠(yuǎn)時(shí),其采集到的聲音信號(hào)質(zhì)量較差,從而影響后續(xù)的語(yǔ)音處理性能;且容錯(cuò)性差,當(dāng)陣列中一個(gè)或數(shù)個(gè)麥克風(fēng)失效時(shí),整個(gè)陣列就會(huì)出現(xiàn)癱瘓等情況。針對(duì)這些不足,麥克風(fēng)網(wǎng)絡(luò)信號(hào)處理技術(shù)應(yīng)運(yùn)而生。
近年來(lái),出現(xiàn)了以智能手機(jī)、平板電腦、智能音箱為代表的一批智能設(shè)備,并在日常工作與生活中不斷普及,這些設(shè)備通常配有各自的數(shù)據(jù)處理單元、無(wú)線通信接口、音頻輸入輸出接口,因此十分易于構(gòu)成分布式麥克風(fēng)網(wǎng)絡(luò)。相比于傳統(tǒng)的單麥克風(fēng)或麥克風(fēng)陣列,分布式麥克風(fēng)網(wǎng)絡(luò)具有靈活的拓?fù)浣Y(jié)構(gòu)、大范圍的空間覆蓋率及分布式數(shù)據(jù)處理能力,在視頻會(huì)議系統(tǒng)、人機(jī)交互系統(tǒng)等領(lǐng)域具有廣泛應(yīng)用前景。但是通常,在此類網(wǎng)絡(luò)中,各節(jié)點(diǎn)大多是隨機(jī)放置,其位置通常未知;且由于制造工藝等因素,各節(jié)點(diǎn)的真實(shí)采樣率與標(biāo)稱值會(huì)有所差異,影響其語(yǔ)音處理算法性能。因此,需要用幾何校準(zhǔn)方法對(duì)節(jié)點(diǎn)位置進(jìn)行估計(jì),用時(shí)鐘校準(zhǔn)方法來(lái)抑制采樣率失配問(wèn)題。然而普遍的研究都聚焦于集中式計(jì)算方法,也就是說(shuō)需要額外的中心處理單元和較大的通信帶寬,這難以滿足應(yīng)用中的校準(zhǔn)需求。為此,呼德申報(bào)了國(guó)家自然科學(xué)基金青年項(xiàng)目,引進(jìn)分布式信號(hào)處理理論,探索新的分布式校準(zhǔn)方法,使麥克風(fēng)網(wǎng)絡(luò)的各節(jié)點(diǎn)并行地、協(xié)作地完成幾何與時(shí)鐘校準(zhǔn)任務(wù)。
立足于蒙古語(yǔ)智能信息處理國(guó)家地方聯(lián)合工程研究中心這一如日方升的平臺(tái)之上,多項(xiàng)國(guó)家級(jí)課題進(jìn)展順利,已經(jīng)產(chǎn)出了多篇學(xué)術(shù)文章?!澳壳?,我們正在進(jìn)一步探索讓技術(shù)落地應(yīng)用,走進(jìn)更多人生活的方式。我對(duì)于未來(lái)還是比較有信心的?!焙舻抡f(shuō)。
如果有一天,站在未來(lái)的門(mén)檻上回望,呼德只希望自己的成果可以為社會(huì)生活帶來(lái)一些便捷,正如他常說(shuō)的那樣:“讓每一個(gè)聲音、每一句話都能被準(zhǔn)確無(wú)誤地捕捉與理解,無(wú)論是在繁忙的都市角落,還是在遙遠(yuǎn)的自然風(fēng)光中。”而帶著這份理想,他將繼續(xù)前行,徜徉在由聲音信號(hào)編織的夢(mèng)想國(guó)度里,續(xù)寫(xiě)科技的動(dòng)人詩(shī)篇。