技術(shù)宅
現(xiàn)在Al技術(shù)在各個領(lǐng)域的應(yīng)用不斷擴展,當(dāng)然這其中也出現(xiàn)了一些惡意應(yīng)用,比如央視2019年3·15晚會上曝光的Al騷擾電話,就是典型的反例。在晚會的視頻展示中,其中一家提供外呼系統(tǒng)的科技公司經(jīng)理告訴記者,在過去的一年多時間里,他們撥打出去的電話多達(dá)40億個(圖1)。
這些騷擾電話的背后,竟然應(yīng)用了很多新的科技技術(shù),比如用戶號碼的獲取是通過“探針盒子”來完成。當(dāng)用戶手機的無線局域網(wǎng)處于打開狀態(tài),這個信號被探針盒子發(fā)現(xiàn)后,就能迅速識別并采集到戶手機的WLANMAC(無線局域網(wǎng))地址,接下來將MAC地址轉(zhuǎn)換為IMEI號,然后再將lM El號轉(zhuǎn)換成用戶的手機號碼。其中從用戶的WLANMAC到手機號碼識別,就使用了大數(shù)據(jù)識別技術(shù)(圖2)。
在獲取到用戶的號碼后,Al語音識別技術(shù)就派上用場了。通過人工對話學(xué)習(xí),這些Al騷擾電話溝通仿真能力相當(dāng)逼真,對話語言流暢自然,讓你根本想不到是在和冰冷的機器人對話。
如上所述,現(xiàn)在Al騷擾電話具有很高的智能性,幾乎讓我們無法識別。那么如何應(yīng)對這些智能騷擾呢?阿里Al實驗室近日開發(fā)的防騷擾電話技術(shù)給出了一個解決方案,通過Al來應(yīng)付騷擾電話。實際上這個技術(shù)是一種“智能聊天”概念,是Al語音技術(shù)在目前反騷擾領(lǐng)域中的一項應(yīng)用。智能聊天需要理解用戶的請求,用強大的知識圖譜生成知識點,在對話中將知識點“輸出”給用戶,同時用基于深度強化學(xué)習(xí)的對話策略引導(dǎo)對方的問題,從而將聊天進(jìn)行下去(圖3)。
要讓一套語音輸出系統(tǒng)能夠和人類(或者Al騷擾者)對話,科學(xué)家們首先需要解決的是讓系統(tǒng)能夠理解用戶的請求,就像我們?nèi)粘:团笥汛螂娫?,在發(fā)出語音請求給對方后,要讓對方明白你要表達(dá)什么意思。為了能夠讓機器人理解語音對話的含義,—方面阿里Al實驗室提出一個聊天機器人人機協(xié)作框架CoChat,通過這個框架,使得人機對話系統(tǒng)能夠從標(biāo)注過的對話日志、人類工作者的反饋以及用戶的反饋中學(xué)習(xí),由此使對話質(zhì)量獲得持續(xù)改進(jìn)(圖4)。
另一方面,由于人類的語言系統(tǒng)豐富多變,為了讓機器人迅速對人類提出的新問題(原來數(shù)據(jù)庫所沒有的)作出回應(yīng),阿里Al實驗室開發(fā)者引入了對話管理器模型MemHRNN。這套系統(tǒng)首先將對話歷史、語言理解結(jié)果和API調(diào)用結(jié)果等外部信息組合起來作為輸入,然后輸出所有動作的概率分布以用于動作選擇。這樣當(dāng)出現(xiàn)新動作時,該HRNN的架構(gòu)可以相應(yīng)地改變,而不會丟失在之前的學(xué)習(xí)過程中積累的知識,從而讓這套人機系統(tǒng)自主學(xué)習(xí)很多新知識,能夠?qū)崿F(xiàn)和人類正常的溝通對話。
比如在實際測試中,這套對話系統(tǒng)和人類推銷員通話時,它不但會主動向女銷售咨詢“北京能不能貸款?”“最多能貸多少錢?”等問題,甚至還在對話中“調(diào)戲”對方:“你之前給我打過電話吧,聽起來挺耳熟的?”這些對話就像是真的人在和推銷員對話,對方根本沒有察覺到她實際上是和機器人“二哈”在深入聊天(圖5)。
隨著Al技術(shù)的發(fā)展,我們遇到的騷擾也將越來越多、越來越智能,類似“二哈”的系統(tǒng)將給我們防止騷擾帶來更多的便利。
一方面,如果將這套系統(tǒng)和手機通話功能整合起來,那么以后只要有類似的騷擾電話,就可以直接交給“二哈”們?nèi)ゴ蚶?,省去我們每天被無數(shù)騷擾電話打擾。另—方面,“二哈”系統(tǒng)實質(zhì)上是智能聊天應(yīng)用,這套系統(tǒng)可以理解我們的對話,因此把它作為人機對話也是一個很好的應(yīng)用,比如可以用在心理疏導(dǎo)、景點服務(wù)介紹、Al導(dǎo)購等領(lǐng)域,讓Al更好地為我們的生活服務(wù)。
其實智能聊天并不是什么全新的概念,它的本質(zhì)是Al語音識別技術(shù)。我們在iPhone上使用的Siri語音助理、微軟推出的Al小冰,這些都是語音智能聊天的代表。隨著Al技術(shù)的發(fā)展,期望更多的語音智能產(chǎn)品為我們服務(wù)(圖6)。