洪蕾
近日,阿里巴巴機器智能技術(shù)實驗室稱,團(tuán)隊正將語音識別的應(yīng)用領(lǐng)域拓寬到了工廠,以解決“耳聾工廠”問題。
在許多中小型工廠車間里,工人之間的交流通常靠喊、吼。噪聲,也成為了工廠工人擺脫不掉的困擾,“職業(yè)性噪聲聾”已成“塵肺病”后全國第二大職業(yè)病。
據(jù)北京中醫(yī)藥大學(xué)東直門醫(yī)院耳鼻喉科主任醫(yī)師劉建華介紹,目前,職業(yè)性噪聲聾呈增發(fā)趨勢。另外,高噪聲對人聽力損害是逐步顯現(xiàn),潛在危害比較高。很多工人習(xí)慣了在超85分貝的高噪音環(huán)境工作后,覺得沒事。但暴露在該噪聲環(huán)境中超過3個月,對聽力將造成不可逆的損害。這樣的損害持續(xù)積累,當(dāng)工人發(fā)現(xiàn)聽力出現(xiàn)問題時,已很難恢復(fù)。然而,大多數(shù)中小制造企業(yè)沒經(jīng)驗和能力考慮降噪。最現(xiàn)實的,還是給工人戴防護(hù)耳罩,但又不便于交流。
為了解決上述問題,阿里巴巴機器智能技術(shù)實驗室研發(fā)了高工業(yè)噪聲環(huán)境下的語音識別及傳輸技術(shù)。該技術(shù)可實現(xiàn)在85分貝工業(yè)噪聲下,將一米處正常音量語音轉(zhuǎn)換為文字,并可發(fā)送至手機等設(shè)備上。
“實現(xiàn)高噪聲下的語音識別,主要依靠的是陣列麥克風(fēng)技術(shù)以及AI語音識別模型。陣列麥克風(fēng)配合算法,可有效提取出純凈語音信號。AI語音模型則能識別語音信號含義并轉(zhuǎn)換成正確文字。”阿里巴巴語音工程師云鎧表示。
阿里巴巴稱,語音轉(zhuǎn)換的過程都在云端完成,只要有網(wǎng)絡(luò)并配上類似智能音箱的語音終端,便可構(gòu)建局域性的語音文字轉(zhuǎn)換和傳輸系統(tǒng)。目前,阿里巴巴的語音識別技術(shù)能在85分貝的噪音環(huán)境下,對一米外正常音量語音做到準(zhǔn)確識別,按照預(yù)期,他們希望能實現(xiàn)在95分貝噪音下的語音識別。