王 曦,曾廣平,喬 柱
(北京科技大學(xué) 計算機與通信工程學(xué)院,北京 100083)
心理健康越來越成為一個重要的社會關(guān)注熱點和國家文明進步的重要內(nèi)容,而且采用新一代信息技術(shù)如何為心理健康提供科技支撐,是我們研究一個重要方向。正因為這種科學(xué)意義,本文選擇面向心理健康服務(wù),研究機器人的方法和技術(shù),力圖為心理健康服務(wù)提供智能化的數(shù)字化輔助工具和手段。
服務(wù)機器人領(lǐng)域現(xiàn)在依然存在許多尚未完全解決的科學(xué)問題,同樣也涉及非常多的關(guān)鍵技術(shù)。比如:
1)具有過渡過程的多執(zhí)行器的情感控制模式研究;
2)心理健康服務(wù)產(chǎn)生的圖靈測試方法,做一個服務(wù)機器人,試看哪位心理咨詢考試員誰能通過她的考試;
3)具有專業(yè)知識教育的情感服務(wù)機器人(教師,醫(yī)生,心理咨詢師)智能對話庫內(nèi)容研究(1、直接匹配對話庫;2、數(shù)據(jù)庫形式化之后,用機器學(xué)習(xí)、知識圖譜等建立對話模式);
4)體現(xiàn)人工智能與人工心理健康服務(wù)的方法和技術(shù)水平。
這些都是服務(wù)機器人的重要研究方向,需要不斷地對其進行研究。
本文面向心理健康服務(wù),研發(fā)一種具有表情、語音交互、內(nèi)容數(shù)據(jù)庫等功能的智能機器人。分析了服務(wù)機器人的頭部運動系統(tǒng)的基本結(jié)構(gòu),對如何通過控制基本參數(shù)來產(chǎn)生表情的原理進行了研究;提出了將人工心理與情感計算等領(lǐng)域的方法應(yīng)用到心理健康服務(wù)之中的想法;并提出了一種心理健康服務(wù)計算的心理咨詢輔助推理模型。建立一種面向心理健康服務(wù)的機器人輔助系統(tǒng),希望可以為心理咨詢師及其相關(guān)人員提供智能輔助。
機器人基本動作:
動作表情功能(12個舵機、14個自由度)。
低頭(前屈)、抬頭(后伸)。
前屈、后伸最大活動度如圖5所示。
左扭頭(左旋)、右扭頭(右旋)。
左旋、右旋最大活動度如圖6所示。
左右擺頭:擺動幅度為左右±25°。
張嘴動作:頜關(guān)節(jié)最大張開度25°。
眨眼動作:左右眼瞼獨立控制,可同時眨眼,也可單獨眨眼。
眼球左右轉(zhuǎn)動:雙眼球聯(lián)動,左右轉(zhuǎn)動幅度為±20°。
眼球上下轉(zhuǎn)動:雙眼球聯(lián)動,上下轉(zhuǎn)動幅度為±20°。
微笑:左右側(cè)笑單獨控制,嘴角后拉最大幅度大約5mm。
眉毛上下挑眉,左右眉單獨控制,上挑最大幅度大約5mm。
眉毛向心皺眉,左右眉單獨控制,向心最大幅度大約5mm。
我們將下述的多種技術(shù)集成到心理健康服務(wù)機器人系統(tǒng)中。外形是一個人型機器人,內(nèi)嵌心理篩查和心理干預(yù)數(shù)據(jù)庫和知識庫,面向?qū)嶋H應(yīng)用,研究驗證心理健康服務(wù)計算研究的有效性和實用性。
圍繞心理健康和物聯(lián)網(wǎng)教育,我們搜集開源數(shù)據(jù)庫并建立自己的數(shù)據(jù)庫把心理咨詢、老年生活照料作為對話服務(wù)主體內(nèi)容。建立一個面向健康生活服務(wù)的對話機器人助理。
目前,心理健康服務(wù)對話數(shù)據(jù)庫的建立主要分為:醫(yī)學(xué)、心理服務(wù)、日常對話?,F(xiàn)在已有10000多條對話條目,而且還可以增加。
醫(yī)藥類:主要包括該疾病的定義、病因、癥狀、治療、后遺癥、并發(fā)癥、護理與飲食,其中:腦梗死 19條數(shù)據(jù),高血壓 16條數(shù)據(jù),新冠肺炎 15條數(shù)據(jù),上呼吸道感染 23條數(shù)據(jù),糖尿病 18條數(shù)據(jù)等。
心理類:心理知識類308條數(shù)據(jù);心理咨詢的基本問題對話庫 257條數(shù)據(jù);
日常對話類:日常對話 9600條數(shù)據(jù)。
我們的數(shù)據(jù)庫里,還有10000多家全國養(yǎng)老院數(shù)據(jù),以便于查詢各地的養(yǎng)老服務(wù)信息。
基于電機運動的控制指令,組合生成復(fù)雜、復(fù)合的機器人表情動作,是表情機器人的基本研究問題。
在如何理解人類的面部表情的設(shè)計方面,本文根據(jù)人體解剖學(xué)的理論知識來理解人類面部的組織結(jié)構(gòu),并學(xué)習(xí)了組織結(jié)構(gòu)各個部分的具體功能,以及每個部分具體如何實現(xiàn)表情的原理。同時,通過學(xué)習(xí)人臉表情的面部運動編碼系統(tǒng)(FACS)的相關(guān)定義來進行機器人面部表情的設(shè)計和理解,獲得了每個運動單元和肌肉之間存在的對應(yīng)關(guān)系。使用上述理論所獲得的機器人表情設(shè)計方案,使用機器人表情控制編輯軟件來進行實現(xiàn)機器人表情的最終實現(xiàn),其編輯軟件界面如圖1所示。
圖1 機器人表情控制編輯界面
心理健康服務(wù)對話機器人以心理咨詢學(xué)習(xí)訓(xùn)練為應(yīng)用對象,需要建立對話的智能決策模型,以期望真正能夠做出心理咨詢機器人輔助系統(tǒng)。
1.5.1 心理健康服務(wù)計算的心理咨詢輔助推理模型
這里首先考慮心理咨詢理論在心理健康服務(wù)計算中的指導(dǎo)作用,建立一種心理健康服務(wù)計算的心理咨詢輔助推理模型。如圖2所示。
圖2 心理健康服務(wù)計算的心理咨詢輔助推理模型
模型推理過程如下:輸入來訪者的數(shù)據(jù)(語言、行為、參數(shù)、圖像、視頻等等),采用圖像處理技術(shù)和數(shù)據(jù)分析等技術(shù)提取特征,再根據(jù)相關(guān)心理咨詢理論使用機器學(xué)習(xí)算法得到分類結(jié)果;輸出為根據(jù)前述方法獲得的來訪者內(nèi)在心理狀態(tài)模型的評估和預(yù)測,并以各種展示技術(shù)呈現(xiàn)給心理咨詢師和來訪者,進而起到輔助心理咨詢過程的作用。
1.5.2 建立一種面向心理咨詢的輔助應(yīng)用系統(tǒng)
這里主要是應(yīng)用人工心理逆問題研究的理論方法,進行具體實現(xiàn)。
將來訪者的數(shù)據(jù)(語言、行為、參數(shù)、圖像、視頻等)通過使用自然語言理解、計算機視覺技術(shù)和情境感知計算等技術(shù)提取特征,再根據(jù)相關(guān)心理咨詢理論使用機器學(xué)習(xí)算法得到分類結(jié)果;進而得到心理咨詢來訪者的心理評估,推薦給心理咨詢師,輔助其分析來訪者的心理狀態(tài),提高心理咨詢的準(zhǔn)確度和效率。
技術(shù)路線:首先建立一個人的心理狀態(tài)結(jié)構(gòu)—分析數(shù)據(jù)-推理計算—得到精準(zhǔn)心理問題狀態(tài)—縮短心理咨詢過程。目的在于建立一種面向心理咨詢的人工心理輔助應(yīng)用系統(tǒng),為心理咨詢師及其相關(guān)人員提供專家輔助系統(tǒng),進而驗證本研究的有效性和正確性。
心理咨詢機器人不僅僅有動作交互,還需要智能化的語音交互,以及后臺計算和數(shù)據(jù)的支持,是一個整體的系統(tǒng)服務(wù)。將機器人講話內(nèi)容+對應(yīng)語音+相應(yīng)表情有機融合,研究機器人的表情控制模式,建立一種豐富的機器人控制指令庫,實現(xiàn)和諧人際交互模式,是我們的研究目標(biāo)。
2.1.1 主要功能描述
1)智能語音交互功能
智能語音交互功能,可以實現(xiàn)用戶和虛擬小人的聊天對話。包括閑聊,問答,百科,生活常識,數(shù)學(xué)計算,等多個數(shù)據(jù)庫,可以滿足大多數(shù)人的溝通上的需要。并且通過建立知識庫,能夠進行一問多答,多問一答,實現(xiàn)智能化交互。
2)智能語音服務(wù)功能
智能語音服務(wù)功能通過語音接口來為用戶提供以下相關(guān)服務(wù):可以為用戶查詢?nèi)我獬鞘凶罱?天的天氣和空氣質(zhì)量;也可以設(shè)置定時提醒,準(zhǔn)時自動提醒用戶要做什么事;它也能夠查詢一些常見疾病的相關(guān)知識,進而給老年人提出一些身體健康的知識普及和保健指導(dǎo);也能幫助用戶查詢?nèi)珖鞯氐酿B(yǎng)老院或養(yǎng)老相關(guān)服務(wù)機構(gòu)的信息。本工作擁有獨一無二的全國養(yǎng)老院以及各類老年人服務(wù)中心的數(shù)據(jù)庫。這是由本項目組的幾位研究生通過一年的工作搜集并建立起來的,包含了幾十萬條詳細的信息。
2.1.2 安卓開發(fā)
Eclipse安卓開發(fā)環(huán)境下,開發(fā)配套APP,集視頻播放,語音識別,語義理解,語音合成,語音喚醒,人臉檢測于一體,并能通過WiFi模塊與各種硬件功能模塊進行通信,實現(xiàn)語音交互和控制。還要與云端服務(wù)器進行數(shù)據(jù)交換,利用云計算和大數(shù)據(jù)實現(xiàn)智能化的語音交互。
視頻播放功能則使用安卓自帶控件。
語音識別等技術(shù),應(yīng)用科大訊飛平臺的離線SDK和在線API,將各個語音功能模塊整合在一起,在邏輯上符合用戶語音交互需求,性能上健壯穩(wěn)定。
人臉識別技術(shù)現(xiàn)已成熟,本文所做工作應(yīng)用了face++人臉識別平臺來進行視頻流的人臉檢測并將其集成在APP中。
機器人軟件控制流程圖如圖3所示。
圖3 機器人軟件控制流程圖
機器人硬件構(gòu)成如圖4所示。
圖4 機器人硬件構(gòu)成圖
心理咨詢機器人內(nèi)置安卓操作系統(tǒng),內(nèi)部集成有APP,可以進行語音交互,人臉識別。紅外傳感器則是,當(dāng)檢測到用戶的接近時,通過WiFi通信對安卓主機進行喚醒。智能家居遙控模塊其實就是通過WiFi和APP進行通信,實現(xiàn)智能控制的交互功能,即人們可以用語音與機器人交互,控制電燈開關(guān)、電視開關(guān)等功能。
這里的心理咨詢對話庫,主要是將機器人當(dāng)做是人類心理咨詢師的助手,通過對話,機器人對來訪者進行基本情況收集、初步的心理狀態(tài)進行評估,進而為心理咨詢的判斷提供客觀依據(jù),可以大大縮短心理評估的進程。
圖5所示為我們的心理健康服務(wù)機器人外形圖。
圖5 機器人外形圖
圖6所示為心理健康服務(wù)機器人對話的程序調(diào)試界面。
圖6 心理健康服務(wù)機器人對話界面
實驗表明,由于充分利用了實物機器人技術(shù)的真實感和親切感的優(yōu)點,應(yīng)用于心理咨詢和老年人的服務(wù)。并結(jié)合了語音技術(shù),智能家居服務(wù)技術(shù)等,使交互更加人性化,大大加強了機器人服務(wù)性,機器人功能更加豐富。
本文面向心理健康服務(wù),研發(fā)實現(xiàn)了一種具有表情、語音交互、內(nèi)容數(shù)據(jù)庫等功能的智能機器人。為該智能服務(wù)機器人能夠產(chǎn)生表情功能而研發(fā)了面部表情的控制系統(tǒng);分析了機器人的頭部運動系統(tǒng)結(jié)構(gòu)及其產(chǎn)生表情的結(jié)構(gòu)性原理;首次提出了將人工心理與情感計算等領(lǐng)域的方法應(yīng)用到心理健康服務(wù)之中的想法;并提出了一種心理健康服務(wù)計算的心理咨詢輔助推理模型。建立了一種面向心理健康服務(wù)應(yīng)用的智能輔助系統(tǒng),可以為心理咨詢師及其相關(guān)人員提供智能輔助。這在國內(nèi)目前的心理咨詢應(yīng)用領(lǐng)域還未見類似研究。開發(fā)的智能機器人為心理健康服務(wù)增加了新的數(shù)字化輔助工具和手段。