国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

任務(wù)型人機(jī)對(duì)話(huà)系統(tǒng)中的認(rèn)知技術(shù)概述

2021-05-11 06:46:12孫偉博張斌
中國(guó)新通信 2021年4期
關(guān)鍵詞:人機(jī)交互

孫偉博 張斌

【摘要】 ? ?人與計(jì)算機(jī)的交互系統(tǒng)是將機(jī)器視為認(rèn)知對(duì)象的人與計(jì)算機(jī)的交互系統(tǒng)。電腦軟件、硬件技術(shù)和移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,人類(lèi)和機(jī)器之間的認(rèn)知對(duì)話(huà)系統(tǒng)能夠有效地處理不準(zhǔn)確的信息互動(dòng),并符合人類(lèi)互動(dòng)的自然習(xí)慣,得到了越來(lái)越多的關(guān)注。本文提出將人與機(jī)器之間的認(rèn)知對(duì)話(huà)分為三個(gè)層次:物理層、管理層和應(yīng)用層。相關(guān)技術(shù)包括通道技術(shù)、認(rèn)知技術(shù)和知識(shí)管理技術(shù)。在其中,認(rèn)知技術(shù)是一種新的交互式中間軟件技術(shù),是由于移動(dòng)實(shí)時(shí)交互的新需求而產(chǎn)生的。它的目標(biāo)是提供人類(lèi)認(rèn)知交互的特征,這些認(rèn)知互動(dòng)可以與另一方進(jìn)行深刻的理解、學(xué)習(xí)、誘導(dǎo)和適應(yīng),其中大部分包括信息不準(zhǔn)確的理解技術(shù)、基于不確定性的推理技術(shù)、適應(yīng)和進(jìn)化技術(shù),這篇文章詳細(xì)介紹了人類(lèi)機(jī)器對(duì)話(huà)系統(tǒng)中認(rèn)知技術(shù)的定置和具體概念,總結(jié)了相關(guān)技術(shù)領(lǐng)域的進(jìn)展,并考慮了未來(lái)的關(guān)鍵研究方向。

【關(guān)鍵詞】 ? ?人機(jī)交互 ? ?認(rèn)知技術(shù)范疇 ? ?對(duì)話(huà)系統(tǒng) ? ?認(rèn)知控制

引言

人與計(jì)算機(jī)相互交互(HCI,人機(jī)交互)是一種技術(shù),研究自計(jì)算機(jī)出現(xiàn)以來(lái)人類(lèi)和計(jì)算機(jī)設(shè)備之間的相互作用。它的目標(biāo)是讓機(jī)器幫助人們高效、舒適和安全地完成任務(wù)。人類(lèi)和計(jì)算機(jī)之間的互動(dòng)是一種基本技術(shù),它對(duì)信息時(shí)代的生產(chǎn)和生活產(chǎn)生了巨大的影響。美國(guó)在2000年實(shí)施的信息技術(shù)研究預(yù)算中,包括了“人機(jī)互動(dòng)”、“軟件”、“網(wǎng)絡(luò)”和“人工計(jì)算”在內(nèi)的四項(xiàng)核心研究[1]。Dialogue(對(duì)話(huà))系統(tǒng)是人機(jī)交互技術(shù)的主要領(lǐng)域之一。, 這是一種計(jì)算機(jī)軟件和硬件系統(tǒng),人類(lèi)和機(jī)器之間的相互信息交換可以滿(mǎn)足人類(lèi)的一些特殊和內(nèi)在需求。大致來(lái)說(shuō), 交互系統(tǒng)包括圖形用戶(hù)界面(GUI)、虛擬現(xiàn)實(shí)交互等,所有人機(jī)交互系統(tǒng)。從狹義上講,對(duì)話(huà)系統(tǒng)尤其適用于執(zhí)行類(lèi)似人類(lèi)的通信任務(wù)的計(jì)算機(jī)系統(tǒng)。它的目的是使人與機(jī)器之間的對(duì)話(huà)像人與人之間的對(duì)話(huà)一樣有效、快速和自然。這種交互式系統(tǒng)強(qiáng)調(diào)機(jī)器在執(zhí)行任務(wù)、信息共享和環(huán)境感知方面的擬人化特征,并將其視為雙邊信息互動(dòng)中的“認(rèn)知對(duì)象”, 因此,“認(rèn)知能力和相關(guān)技術(shù)”是這些系統(tǒng)的核心功能和特性。這篇文章討論了人類(lèi)機(jī)器狹小對(duì)話(huà)系統(tǒng)中的認(rèn)知技術(shù)。

一、基于任務(wù)型人機(jī)對(duì)話(huà)系統(tǒng)中的認(rèn)知技術(shù)

從本體結(jié)構(gòu)和業(yè)務(wù)邏輯的角度來(lái)看,對(duì)話(huà)系統(tǒng)可以分為領(lǐng)域任務(wù)類(lèi)型和開(kāi)放類(lèi)型的信息互動(dòng)。領(lǐng)域任務(wù)型系統(tǒng)針對(duì)特定領(lǐng)域的應(yīng)用程序,明確定義業(yè)務(wù)語(yǔ)義單位、本體結(jié)構(gòu)和目標(biāo)用戶(hù)范疇,如查詢(xún)航班、視頻搜索、設(shè)備管理等。此類(lèi)交互通常以特定的業(yè)務(wù)任務(wù)的執(zhí)行為基礎(chǔ)。公開(kāi)信息的交互不是針對(duì)某個(gè)領(lǐng)域或一個(gè)非常大的領(lǐng)域。交互目的不是商業(yè)目標(biāo),而是滿(mǎn)足用戶(hù)在其他方面的需求,例如,開(kāi)放的問(wèn)答解惑、聊天等,即便在某種程度上可以發(fā)揮人工智能的作用,但是因?yàn)樗恢铝τ趲椭藗兘鉀Q真正的現(xiàn)實(shí)問(wèn)題,它的實(shí)際范圍相對(duì)較小[2]。近年來(lái)移動(dòng)終端的飛速發(fā)展使得人們?cè)絹?lái)越關(guān)注人和機(jī)器之間自然對(duì)話(huà)系統(tǒng)以及由此在學(xué)術(shù)和商業(yè)領(lǐng)域所產(chǎn)生的認(rèn)知控制理論。這就是文章的重點(diǎn)。

1.1任務(wù)型對(duì)話(huà)系統(tǒng)認(rèn)知技術(shù)范疇

現(xiàn)代的人機(jī)交互系統(tǒng)需要“控制層”,它將信道編碼和服務(wù)器部分的知識(shí)連接起來(lái),起到管理和協(xié)調(diào)前端和后臺(tái)的作用?!翱刂茖印钡闹饕δ馨ǎ簭妮斎氪a理解用戶(hù)的初衷,管理并控制對(duì)話(huà)框(對(duì)話(huà)框管理),并將初衷轉(zhuǎn)換為輸出代碼(信息生成)。是在傳統(tǒng)的人體與電腦的機(jī)械系統(tǒng)中,可以忽略控制層,因?yàn)橛脩?hù)的意圖是由輸入工具精確定義的[4]。例如,當(dāng)與圖形用戶(hù)界面交互時(shí),點(diǎn)擊鼠標(biāo)打開(kāi)或關(guān)閉窗口,內(nèi)部的知識(shí)管理會(huì)直接導(dǎo)入。但是,在自然的人與機(jī)器的對(duì)話(huà)系統(tǒng)中,因?yàn)闄C(jī)器需要能夠與人有效對(duì)話(huà)的認(rèn)知主體,所以控制層是一個(gè)獨(dú)立的不可缺少的模塊,與此模塊相關(guān)的技術(shù):“認(rèn)知技術(shù)”[5]。認(rèn)知技術(shù)的類(lèi)別主要包括以下類(lèi)別:

(1)非精確條件下的理解

不確定性(或不精確)是人機(jī)對(duì)話(huà)渠道的重要特征之一。語(yǔ)音識(shí)別本身有不可避免的錯(cuò)誤,因?yàn)樵胍舾蓴_,對(duì)話(huà)人的口音說(shuō)話(huà)速度等等。當(dāng)出現(xiàn)多通道時(shí),每一條通道都會(huì)受到干擾和不確定。在IO層中的編碼錯(cuò)誤被傳送到語(yǔ)義分析級(jí)別,導(dǎo)致語(yǔ)義分析的不確定性[3]。另一方面,從認(rèn)知的角度來(lái)看,人們用模糊的信息進(jìn)行溝通很容易,因?yàn)檫@分發(fā)信息的速度大大增加了。信息傳輸和對(duì)話(huà)意圖不確定性,機(jī)器理解用戶(hù)的意圖已成為重要的認(rèn)知技術(shù)類(lèi)別之一[6]。與傳統(tǒng)的“語(yǔ)義理解”和“自然語(yǔ)言處理”不同的根本區(qū)別在于,不確定性屬于了研究領(lǐng)域。

(2)基于不確定性的推理及決策控制

人機(jī)對(duì)話(huà)系統(tǒng)的重要功能是有效的多回合互動(dòng)。根據(jù)系統(tǒng)的運(yùn)行狀態(tài)并執(zhí)行特定的任務(wù),如果理解用戶(hù)的意圖,特別是不確定的意圖理解、推理、決策反饋方法和反饋信息的情況下, 選擇反饋方法和反饋內(nèi)容最有助于完成任務(wù),這是認(rèn)知技術(shù)另一個(gè)重要方面。交互戰(zhàn)略的核心是人機(jī)對(duì)話(huà)的閉環(huán)控制技術(shù),由此賦予機(jī)器“推論和決策”的認(rèn)知主觀(guān)特性。

(3)交互自適應(yīng)及進(jìn)化

學(xué)習(xí)和適應(yīng)能力是認(rèn)知對(duì)象的另一個(gè)重要特征。機(jī)器適應(yīng)用戶(hù)輸入和輸出通道和控制層的適用技術(shù)是認(rèn)知技術(shù)的第三類(lèi)。在對(duì)話(huà)過(guò)程中,它不僅包括對(duì)用戶(hù)輸入和輸出特性的低級(jí)別適應(yīng),還包括對(duì)用戶(hù)行為的適應(yīng)和互動(dòng)的規(guī)律習(xí)慣的適應(yīng)[4]。另一方面,認(rèn)知控制技術(shù)除短期調(diào)整外還包括長(zhǎng)期“進(jìn)化”系統(tǒng)、用于研究新知識(shí)(語(yǔ)義元素等)和長(zhǎng)期人類(lèi)交互模式

1.2任務(wù)型對(duì)話(huà)系統(tǒng)的認(rèn)知自然度

“自然交互”是任務(wù)型對(duì)話(huà)系統(tǒng)的目標(biāo),也是認(rèn)知技術(shù)合理使用的結(jié)果。除了前述的自然語(yǔ)義交互方面的內(nèi)容之外,任務(wù)型對(duì)話(huà)系統(tǒng)對(duì)其它方面的自然度要求也成為新的挑戰(zhàn)。情緒的檢測(cè)和傳達(dá)是人類(lèi)自然交互中不可或缺的一環(huán)。情感計(jì)算已經(jīng)發(fā)展多年,在情感分類(lèi)和特征建模、情感識(shí)別、情感表達(dá)等方面都有了較大進(jìn)展,將情感分析應(yīng)用于任務(wù)型對(duì)話(huà)系統(tǒng)也得到了產(chǎn)業(yè)界的重視,呼叫中心中利用情感分析來(lái)獲取用戶(hù)滿(mǎn)意度也得到了應(yīng)用。未來(lái)研究中,如何將情緒等非語(yǔ)義的自然交互信息全面引入任務(wù)型對(duì)話(huà)系統(tǒng),是一個(gè)重要方向。這其中需要具體解決的重要問(wèn)題包括:面向交互任務(wù)的情感、情境的量化分析感知及信息融合;情感的表達(dá)模型和高表現(xiàn)力的情感合成(主要是語(yǔ)音和圖像);引人情感因素的對(duì)話(huà)狀態(tài)空間定義及強(qiáng)化學(xué)習(xí)算法等。情感計(jì)算中的情感維度空間模型等提供了將情感特征量化的良好手段,將利于將情感信息引入POMDP框架。而在多模態(tài)交互條件下,結(jié)合文本、視頻、音頻進(jìn)行聯(lián)合的情感分析將是未來(lái)實(shí)現(xiàn)情感計(jì)算與任務(wù)型對(duì)話(huà)系統(tǒng)結(jié)合的重要方法。目前在國(guó)內(nèi)外所有任務(wù)型對(duì)話(huà)系統(tǒng)研究中,都有一個(gè)最基本的假設(shè):人機(jī)交互的一個(gè)輪回必須是一個(gè)“句子”。但這種一問(wèn)一答的方式與實(shí)際人類(lèi)自由對(duì)話(huà)的方式相去甚遠(yuǎn)。很多心理學(xué)文獻(xiàn)都明確指出人類(lèi)的交互是漸進(jìn)性的。而且以整旬為處理單位會(huì)使整個(gè)人機(jī)對(duì)話(huà)的時(shí)間變長(zhǎng),變得不自然,也會(huì)影響用戶(hù),使他們對(duì)目標(biāo)的注意力下降。更重要的是,以前的研究全部把輪回檢測(cè)看成與對(duì)話(huà)管理無(wú)關(guān)的獨(dú)立任務(wù),并沒(méi)有嘗試去研究輪回檢測(cè)對(duì)整體任務(wù)型對(duì)話(huà)系統(tǒng)的性能影響。尤其在較大尺度和真實(shí)環(huán)境的任務(wù)型對(duì)話(huà)系統(tǒng)中,往往不是由于機(jī)器聽(tīng)不懂用戶(hù)或者不知道如何反饋導(dǎo)致了對(duì)話(huà)失敗,而失敗往往來(lái)源于機(jī)器不知道何時(shí)對(duì)用戶(hù)反饋或者用戶(hù)不知道什么時(shí)候該對(duì)機(jī)器說(shuō)話(huà)[5]。

這個(gè)現(xiàn)象意味著目前的任務(wù)型對(duì)話(huà)系統(tǒng)研究只關(guān)注“反饋什么”,卻缺失了另一個(gè)重要的交互研究課題:“何時(shí)反饋”,因此,基于自然輪回的任務(wù)型對(duì)話(huà)系統(tǒng)是認(rèn)知技術(shù)未來(lái)研究的另一個(gè)重要課題。對(duì)此,一種可行的思路應(yīng)是在對(duì)話(huà)管理器之外,引入新的“輪回管理器”,獨(dú)立地對(duì)輪回和時(shí)序問(wèn)題進(jìn)行研究。

1.3大規(guī)模真實(shí)世界任務(wù)型對(duì)話(huà)系統(tǒng)

雖然任務(wù)型對(duì)話(huà)系統(tǒng)已經(jīng)在若干真實(shí)世界系統(tǒng)中得到過(guò)實(shí)現(xiàn),但其系統(tǒng)都還是小規(guī)?;蚍钦鎸?shí)的系統(tǒng).例如卡內(nèi)基梅隆大學(xué)的Spoken Dialogue Challenge中的公交信息查詢(xún)系統(tǒng)雖然是在匹茲堡市運(yùn)行的真實(shí)系統(tǒng),但其處理的任務(wù)僅僅是公交車(chē)的站點(diǎn)和時(shí)間信息,任務(wù)規(guī)模很小;而歐盟CLASSIC項(xiàng)目中的餐館查詢(xún)系統(tǒng)雖然涉及的數(shù)據(jù)信息較多任務(wù)規(guī)模較大,但相關(guān)系統(tǒng)的運(yùn)行還是基于招募的測(cè)試者而非真實(shí)的用戶(hù),這也使得對(duì)話(huà)策略的訓(xùn)練和任務(wù)型對(duì)話(huà)系統(tǒng)的評(píng)估都受到了影響.認(rèn)知技術(shù)至今仍然還沒(méi)有在大數(shù)據(jù)真實(shí)條件下得到完整的實(shí)踐驗(yàn)證[6]。因此,在已有研究的基礎(chǔ)上,面向真實(shí)世界的大規(guī)模任務(wù)搭建并運(yùn)行完整的任務(wù)型對(duì)話(huà)系統(tǒng),并與傳統(tǒng)的機(jī)械式任務(wù)型對(duì)話(huà)系統(tǒng)對(duì)比是認(rèn)知技術(shù)的實(shí)驗(yàn)方向,也是應(yīng)對(duì)前述各種挑戰(zhàn)的必要的實(shí)測(cè)平臺(tái)。

二、總結(jié)

任務(wù)型人機(jī)任務(wù)型對(duì)話(huà)系統(tǒng)是人機(jī)對(duì)話(huà)領(lǐng)域的熱門(mén)研究課題之一,鑒于任務(wù)型人機(jī)任務(wù)型對(duì)話(huà)系統(tǒng)在不同領(lǐng)域都存在著廣泛的應(yīng)用價(jià)值,為了有效降低任務(wù)型人機(jī)任務(wù)型對(duì)話(huà)系統(tǒng)的開(kāi)發(fā)周期和研發(fā)成本,提升任務(wù)型人機(jī)任務(wù)型對(duì)話(huà)系統(tǒng)開(kāi)發(fā)的便利性,本文目標(biāo)是認(rèn)識(shí)了解任務(wù)型對(duì)話(huà)系統(tǒng)中的認(rèn)知技術(shù)。

參 ?考 ?文 ?獻(xiàn)

[1]黃寅.任務(wù)型人機(jī)對(duì)話(huà)系統(tǒng)開(kāi)發(fā)平臺(tái)研究[J].信息與電腦(理論版),2020,32(06):115-117.

[2]趙陽(yáng)洋,王振宇,王佩,楊添,張睿,尹凱.任務(wù)型對(duì)話(huà)系統(tǒng)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2020,43(10):1862-1896.

[3]齊玉碧. 任務(wù)型人機(jī)對(duì)話(huà)系統(tǒng)開(kāi)發(fā)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京郵電大學(xué),2019.

[4]陳健鵬,馬建輝,王怡君.基于多輪交互的人機(jī)對(duì)話(huà)系統(tǒng)綜述[J].南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,11(03):256-268.

[5]孟張圓. 任務(wù)型人機(jī)對(duì)話(huà)系統(tǒng)的研究與實(shí)現(xiàn)[D].上海交通大學(xué),2019.

[6]姜衡軍. 端到端人機(jī)口語(yǔ)對(duì)話(huà)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].北京郵電大學(xué),2018.

猜你喜歡
人機(jī)交互
某型柴油機(jī)虛擬維修系統(tǒng)研究
基于虛擬現(xiàn)實(shí)技術(shù)的九江城市交通事故模擬系統(tǒng)設(shè)計(jì)
人機(jī)交互課程創(chuàng)新實(shí)驗(yàn)
人形交互式服務(wù)機(jī)器人研究現(xiàn)狀及發(fā)展趨勢(shì)
基于任務(wù)規(guī)劃的家庭仿真服務(wù)機(jī)器人的研究
多點(diǎn)噪聲遠(yuǎn)程自動(dòng)采集系統(tǒng)設(shè)計(jì)
基于智能手機(jī)的盲人語(yǔ)言應(yīng)用軟件的設(shè)計(jì)與開(kāi)發(fā)
基于Intel Realsense技術(shù)的感知展示系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)
一種靜態(tài)手勢(shì)數(shù)字識(shí)別的實(shí)現(xiàn)及應(yīng)用
圖像處理耦合模板定位的答題卡識(shí)別研究與應(yīng)用
兴隆县| 抚宁县| 双峰县| 江陵县| 桦川县| 防城港市| 深圳市| 隆子县| 西华县| 两当县| 太仓市| 博白县| 独山县| 阜新| 清原| 积石山| 平泉县| 方山县| 宝应县| 汾西县| 古交市| 汶上县| 宜春市| 松江区| 湘西| 中牟县| 阿鲁科尔沁旗| 长丰县| 太湖县| 青海省| 遂川县| 班戈县| 漳浦县| 榆中县| 保山市| 慈溪市| 陇西县| 丰原市| 嵩明县| 岗巴县| 太保市|