国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于智能語音助手的桌面懸浮App的設(shè)計及研究

2022-02-17 00:29:53鐘璐榕,許哲昊,胡芳雨,喬子怡,黃光莉
電腦知識與技術(shù) 2022年35期

鐘璐榕,許哲昊,胡芳雨,喬子怡,黃光莉

摘要:智能語音的發(fā)展被不斷推進(jìn),語音助手作為其主流成果備受關(guān)注,人機(jī)交互讓人們真切地體會到了科技的飛速發(fā)展。由于社會的快節(jié)奏生活,陪伴成了一個不可忽視的問題,不論是青年人還是老人都渴望獲得陪伴,那么運用人工智能來協(xié)調(diào)這個問題,在一定程度上能夠滿足人們的需要。對智能語音助手的發(fā)展現(xiàn)狀和問題進(jìn)行分析,基于智能語音助手 、RAP+AI等技術(shù)概念,提出此桌面懸浮App產(chǎn)品的設(shè)計和研究。

關(guān)鍵詞:智能語音助手;AI;桌面懸浮App設(shè)計

中圖分類號:TP18? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2022)35-0050-03

1 引言

隨著時代和科技的高速發(fā)展,人們對手機(jī)的依靠性越來越強(qiáng),同時人們越來越缺乏面對面的溝通和交流,而智能語音助手更好的服務(wù)和陪伴受到人們的期待。考慮到青年人和老年人是社會的重要群體,因而設(shè)計出一款實用性強(qiáng)、操作便捷且能夠滿足于學(xué)生、白領(lǐng)和老年人群體的軟件產(chǎn)品將能夠擁有廣闊的市場發(fā)展前景。該文通過查閱相關(guān)文獻(xiàn)資料和期刊及關(guān)注時事新聞等方法來了解AI技術(shù)和智能語音助手的發(fā)展、軟件設(shè)計及其開發(fā)的流程,從而更加充分地探討桌面懸浮App的設(shè)計與研究。

2 智能語音助手的發(fā)展和分析

2.1 國外發(fā)展研究

1966年,科學(xué)家約瑟夫·魏森鮑姆開發(fā)了最早的聊天機(jī)器人系統(tǒng)——ELISA,該系統(tǒng)首次應(yīng)用于醫(yī)學(xué)領(lǐng)域。之后相繼有許多科學(xué)家和學(xué)者紛紛投入聊天機(jī)器人系統(tǒng)的研究。目前各大廠商紛紛布局人工智能的市場,如微軟的Cortanna、亞馬遜(Alexa)、谷歌助手(Google)和蘋果語音助手(Siri)。

2.2 國內(nèi)發(fā)展研究

因缺乏理論知識和技術(shù)以及創(chuàng)新能力的不足,我國在人工智能領(lǐng)域的發(fā)展較晚,面臨挑戰(zhàn)是不可避免的。近年來,隨著快速的科技發(fā)展,在聊天機(jī)器人的研究方面我國取得了很大的進(jìn)展。繼微軟發(fā)布的聊天機(jī)器人小冰受到人們的關(guān)注,之后其他各具特色的機(jī)器人相繼而出,如阿里巴巴等大型企業(yè)。這些企業(yè)的發(fā)展為機(jī)器人領(lǐng)域積累了一定的技術(shù)和產(chǎn)品[[1]]。

2.3 分析

目前智能語音助手的研究仍有不足,正是這些不足為語音助手的發(fā)展指明了方向。

1)技術(shù)方面的限制

技術(shù)人才的缺乏已嚴(yán)重制約了我國智能語音助手的開展。一是人工智能技術(shù)還處在相對早期的階段,二是缺乏有效的交際模型。這兩方面的技術(shù)缺陷在用戶的實際使用過程中體現(xiàn)在語音識別錯誤較多,意圖識別準(zhǔn)確率較低,多輪對話準(zhǔn)確率較差。結(jié)果上,用戶對于智能語音助手類的產(chǎn)品抱有很高的期待,但最終的使用效果往往令他們感到失望。

2)可靠性有待提高

在外界嘈雜環(huán)境中,計算機(jī)很難準(zhǔn)確捕捉到有效信息,這極大程度上限制了語音識別技術(shù)的應(yīng)用范圍。另外人們在日常生活中,說話時的語言習(xí)慣也是顯而易見的,如明顯的地域口音、頻繁重復(fù)或者是倒裝、有時使用錯誤的語法,這些語言習(xí)慣對于標(biāo)準(zhǔn)式的語音助手會很難準(zhǔn)確識別。因此,語音智能識別技術(shù)的可靠性有待逐步提高。

3)詞匯量有待豐富

若使用者想利用語句數(shù)據(jù)庫之外的詞匯或者突然從一種語言轉(zhuǎn)換為另一種語言時,用戶可能會得到輸入錯誤的提示。因此,需要逐步創(chuàng)新的系統(tǒng)建模、逐步提高的各種技術(shù)方法以及逐步開發(fā)的相關(guān)資源,語音智能識別系統(tǒng)才能夠?qū)Χ喾N語言進(jìn)行準(zhǔn)確地識別。

3 理論和概念框架

3.1 理論

1)基于深度學(xué)習(xí)的語音識別技術(shù)

語音識別技術(shù)被應(yīng)用到各大行業(yè)領(lǐng)域,智能語音帶動了技術(shù)和產(chǎn)品的創(chuàng)新。目前智能語音識別助手主要以卷積神經(jīng)網(wǎng)絡(luò)(CNN)、門控循環(huán)單元(GRU)、雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-RNN)三種聲學(xué)模型為核心。

此桌面懸浮App基于深度學(xué)習(xí)的語音識別技術(shù)實現(xiàn)信號處理與特征提取。

2)智能語音助手的應(yīng)用

智能語音助手系統(tǒng)框架:用戶通過聲音方式所錄入的信息均轉(zhuǎn)化為文本形式,交由自然語言處理系統(tǒng)加以管理。語音輸入主要依賴于語音識別技術(shù),關(guān)系到特征提取方法、模型匹配規(guī)則以及模型訓(xùn)練方法。在自然語言處理功能中包含使用意向分析、使用情感分析、具識分析以及自然語言處理等技術(shù)。會話管理模塊進(jìn)行會話決策,是整個系統(tǒng)的核心技術(shù)所在,包括了說話行為識別、說話狀態(tài)追蹤、說話信息記錄以及決策優(yōu)化等技術(shù)。目前,語音助手的對話生成技術(shù)主要有檢索式、生成式和深度學(xué)習(xí)[[2]]。該系統(tǒng)框架如圖1所示。

在構(gòu)建智能語音助手系統(tǒng)時,采用多種技術(shù)融合構(gòu)建,目前主流技術(shù)構(gòu)建包括基于檢索、人工模板和深度學(xué)習(xí)的聊天機(jī)器人。

智能語音助手的評價標(biāo)準(zhǔn)與評測方法:對于人機(jī)對話功能的評價,主要包括了NIPS、ASTC、SMP2017-ECDT,評價標(biāo)準(zhǔn)為全球通用的平均排序倒數(shù)MRR(Mean Reciprocal Rank)、準(zhǔn)確率P(Precision)、信賴加權(quán)評分CWS(Confidence Weighted Score)、召回率R(Recall)和F-MEASURE(F)[[3]]。

3)基于AI個性化語音生成技術(shù)制作語音包

基于AI語音生成技術(shù)制定個性化的語音包。通過錄制目標(biāo)說話人的少量語句,構(gòu)建一個較完整的韻律和頻譜模型。利用頻譜信息的轉(zhuǎn)換,可保留錄入者的原聲色,通過語音樣本的訓(xùn)練,映射規(guī)則由條件和操作組成,獲得映射規(guī)則可以更進(jìn)一步對發(fā)音者的特征進(jìn)行轉(zhuǎn)變。而利用分類與回歸樹(CART)可實現(xiàn)韻律轉(zhuǎn)換。建立一個源語庫和一個目標(biāo)語料庫之間的映射關(guān)系,最后合成系統(tǒng)即可獲得具有個性化的聲音。

4)語料庫的優(yōu)化

將RPA+AI與Python相結(jié)合,進(jìn)行深度學(xué)習(xí),實現(xiàn)自然語言處理NLP,進(jìn)行文本分詞、實體抽取、情感傾向分析和文本相似度分析等應(yīng)用來優(yōu)化語料庫[[4]]。

5)懸浮球的設(shè)計

通過Electron接入API實現(xiàn)懸浮球功能,將App設(shè)計為可懸浮在手機(jī)桌面上。

3.2 概念框架

利用檢索與生成深度融合的對話技術(shù)來搭建語音助手,利用RPA+AI技術(shù)進(jìn)行富集數(shù)據(jù)資源,提取指定業(yè)務(wù)場景數(shù)據(jù),將抽象的相關(guān)數(shù)據(jù)整合到對話日志中,合理使用官方數(shù)據(jù)庫,通過第三方工具實現(xiàn)搭建系統(tǒng)的訓(xùn)練、評估和調(diào)優(yōu)。將搭建好的語言模型通過工程化操作完成系統(tǒng)接入到App中,語音助手通過對技能統(tǒng)一調(diào)度,實現(xiàn)多種對話服務(wù),同時接入的還有通用模塊,后臺管理采取人機(jī)協(xié)作的模式,來為用戶提供更好的服務(wù)。

在統(tǒng)計中查看人機(jī)互動的溝通情況,根據(jù)統(tǒng)計結(jié)果對客服工作策略進(jìn)行調(diào)整,甚至對市場宣傳的側(cè)重點進(jìn)行進(jìn)一步調(diào)整。全面了解本語音助手與用戶的溝通反應(yīng),并通過對用戶數(shù)據(jù)進(jìn)行沉淀,甚至建立對話漏斗,層層追蹤數(shù)據(jù)的質(zhì)量,由此來改善語音助手與用戶之間的溝通模式。并充分利用通話過程中的對話日志,將對話模型的對話結(jié)果和用戶在整個通話流程中的糾正和回應(yīng)加以完善,從而完成通話過程的循環(huán)生命周期。

4 產(chǎn)品的設(shè)計

4.1 界面設(shè)計

考慮到產(chǎn)品定位人群為青年人和老年人以及本產(chǎn)品提供的功能服務(wù),在主界面設(shè)計中遵行簡潔、實用又美觀的原則進(jìn)行設(shè)計。在字體上應(yīng)用大字體,讓用戶在視覺上眼球一新,同時更適合老年用戶使用,讓老年人用戶感受到關(guān)懷。在主界面中間顯示語音助手“寵物”,并在四周各懸浮一個組件,分為“陪伴”“生活”“我的”“辦公”四個模塊。

用戶進(jìn)入App后,點擊“陪伴”,軟件即在設(shè)備后臺運行,進(jìn)入“寵物”懸浮模式懸浮在手機(jī)桌面,在不占用手機(jī)桌面的情況下,能與用戶進(jìn)行語音聊天互動。在“生活”模塊,具有綁定智能設(shè)備的功能,能夠?qū)χ悄茉O(shè)備的運行狀態(tài)進(jìn)行操控。在“我的”模塊設(shè)有“寵物切換”,用戶可自定義“寵物”形象、“積分區(qū)”“登錄或退出”“語音包”。在“寵物切換”即有多種外形的“智能助手”可供用戶選擇,此外形設(shè)計將不斷更新。在“積分區(qū)”即可進(jìn)行積分兌換相應(yīng)商品,積分來源將在后文描述。在“辦公”模塊具有備忘錄,日程安排,任務(wù)計劃三個組件,此模塊的使用可根據(jù)用戶的語音設(shè)置進(jìn)行信息錄入。

4.2 外觀設(shè)計

“寵物”外觀上采取中國文化元素的提取并在此基礎(chǔ)上進(jìn)行創(chuàng)新設(shè)計,如“身著漢服的觀音”“下象棋的大熊貓”“學(xué)漢字的石獅”“穿繡花鞋的大熊貓”“丹鳳眼的鯉魚”“插在彩陶里的牡丹”等各種各樣的“懸浮寵物”。設(shè)計遵循中國傳統(tǒng)藝術(shù)的審美,融合具有中國特色的多個元素,展示令人眼前一新的視覺沖擊,給予用戶更好的使用體驗。

4.3 功能設(shè)計

1)“智能陪聊”功能

此產(chǎn)品可與用戶進(jìn)行語音聊天,在語音開發(fā)上,錄取多種大自然的聲音作為背景聲,聲線上可多種變化,具有不同語言溝通能力。在聊天過程中,“懸浮寵物”可呈動態(tài)模式,增加用戶的體驗感。與市場上的語音聊天相比,用戶能夠在后臺運行“陪聊”,即不局限于在App內(nèi)才可“聊天”。

2)語音包功能

利用AI合成技術(shù),可錄入語音轉(zhuǎn)換為語音包,隨時可聽到遠(yuǎn)在他方的親人的聲音。軟件配有語音包制作的語音操作提醒,讓不擅長使用智能設(shè)備的老年人也能夠迅速上手。

3)綁定智能設(shè)備

與智能設(shè)備相關(guān)聯(lián)即可對設(shè)備的工作狀態(tài)進(jìn)行設(shè)置。

4)提醒功能

產(chǎn)品有備忘錄和日程的語音提醒功能,更加體貼地為用戶提供優(yōu)質(zhì)的服務(wù)。

5)推薦功能

每日有專業(yè)的醫(yī)護(hù)人員進(jìn)行“健康醫(yī)學(xué)知識宣傳”推送,還可以根據(jù)用戶的個性需要,推送“每日名人勵志一句”“穿衣推薦”“生活小技巧推薦”“趣味小知識推薦”等內(nèi)容。

6)其他功能

在完成當(dāng)天自己制定的任務(wù)時可累積一定積分。且在一天中對語音助手說出“今天是美好的一天”可累計1積分。相應(yīng)經(jīng)驗值可在積分區(qū)兌換對應(yīng)獎品。另具有自定義語音喚醒功能。

4.4 產(chǎn)品運行設(shè)計

1)服務(wù)器端

編寫接口協(xié)議文檔和API接口,使用阿里云服務(wù)器架設(shè)服務(wù)器環(huán)境,設(shè)計數(shù)據(jù)庫。

2)App端

頁面開發(fā)根據(jù)UI設(shè)計圖完成,設(shè)計完成后對接服務(wù)器界面,通過服務(wù)入口獲取數(shù)據(jù),最后寫出服務(wù)邏輯編碼,通過軟件界面測試,完成系統(tǒng)聯(lián)動。

3)Web管理端

后端的功能必須和最前端的業(yè)務(wù)邏輯相符,寫出邏輯代碼并完成測試調(diào)試,在軟件功能開發(fā)完成后,還應(yīng)調(diào)動小組內(nèi)的各技術(shù)人員完成系統(tǒng)性測試。

4)嵌入式系統(tǒng)設(shè)計

程序開發(fā)基于Android平臺,采用Java語言開發(fā)軟件,利用互聯(lián)網(wǎng)和服務(wù)實現(xiàn)頁面跳轉(zhuǎn),使用SQLite和Shareference實現(xiàn)數(shù)據(jù)存儲,然后集成產(chǎn)品界面、界面控制和測試,接下來進(jìn)行測試[[5]]。后端管理模塊的操作采取人機(jī)協(xié)作的模式進(jìn)行運行。

5)應(yīng)用RPA+AI創(chuàng)建自動化機(jī)器人進(jìn)行自動化運行管理

應(yīng)用RPA+AI創(chuàng)建自動化機(jī)器人進(jìn)行發(fā)送信息、搜集客戶資料等工作,來實行自動化運行管理,在一定程度上節(jié)省了人力時間、降低了出錯風(fēng)險、擴(kuò)大了人員工作邊界。

5 討論

5.1 對語音助手發(fā)展的建議

1)由于缺乏大規(guī)模的訓(xùn)練數(shù)據(jù),嘗試應(yīng)用機(jī)器人與機(jī)器人交互來創(chuàng)建訓(xùn)練。不僅節(jié)省人力和時間,也能夠達(dá)到訓(xùn)練機(jī)器人的目的。順應(yīng)了將來機(jī)器人大規(guī)模進(jìn)入人類生活的景象。

2)目前沒有統(tǒng)一的機(jī)器人評價標(biāo)準(zhǔn),需要相關(guān)專業(yè)人員提出規(guī)范。不僅能夠確保機(jī)器人的安全發(fā)展,也能夠為機(jī)器人相關(guān)專業(yè)研究者提供更多規(guī)范的操作,在一定程度上減輕了人們對人工智能發(fā)展的擔(dān)憂。

3)進(jìn)一步完善語音助手,提高技術(shù)水平,優(yōu)化語音助手識別準(zhǔn)確率,必要時可以開發(fā)用戶調(diào)教的平臺,完善基礎(chǔ)功能,增強(qiáng)對于復(fù)雜指令的識別和執(zhí)行能力。此過程將會是智能語音助手的一個跨越式進(jìn)步。這個基于人工智能技術(shù)的先進(jìn)發(fā)展,將更加促進(jìn)國家對人工智能的相關(guān)專業(yè)人員的大力發(fā)展。

4)借助人機(jī)協(xié)同創(chuàng)新的理念實現(xiàn)智能語音的跨越式發(fā)展。

5.2 局限和不足

由于缺乏資金支持,目前項目設(shè)計與研究還處于基礎(chǔ)理論階段。因?qū)τ嬎銠C(jī)的研究不夠深入,缺乏有深度的見解,本文仍存在許多不足之處,還需要不斷深入學(xué)習(xí)和認(rèn)真研究該項目領(lǐng)域。

由于經(jīng)費緊張,目前研究仍處于初步階段,經(jīng)過一定的學(xué)習(xí)和探討對此項目進(jìn)行研究,但在許多地方的研究仍有許多不足,且軟件開發(fā)設(shè)計多個領(lǐng)域的同步進(jìn)行和發(fā)展,想要開發(fā)出一款能夠真正滿足人們生活需要的軟件需要巨大的投資和精力,僅僅依靠團(tuán)隊微弱的人力無法實施開發(fā)。

6 結(jié)束語

近年來,人工智能獲得前所未有的發(fā)展,其相應(yīng)的技術(shù)也獲得了不同程度的創(chuàng)新,以語音作為切入口的新時代將推進(jìn)商業(yè)模式的新發(fā)展?;谥悄苷Z音助手的桌面懸浮App也將在一定程度上豐富不同人群的生活。而在語音識別自然語言、語料庫、AI合成技術(shù)和深度學(xué)習(xí)等方面仍需專業(yè)的科研工作者進(jìn)行不斷探索。將來定能夠擁有新的人機(jī)交互模式,實現(xiàn)人機(jī)協(xié)同創(chuàng)新。

參考文獻(xiàn):

[1] 甘玉玨,蘇軍根,林健,等.智能語音產(chǎn)品現(xiàn)狀及展望[J].廣東通信技術(shù),2017,37(12):66-68.

[2] 張琬,劉春蕾,郭欣然,等.會話代理在精神障礙病人中的應(yīng)用進(jìn)展[J].護(hù)理研究,2021,35(24):4437-4441.

[3] 王浩暢,李斌.聊天機(jī)器人系統(tǒng)研究進(jìn)展[J].計算機(jī)應(yīng)用與軟件,2018,35(12):1-6,89.

[4] 劉旭東,蘇馬婧,朱廣宇.基于自然語言處理的多源情報分析系統(tǒng)的研究與設(shè)計[J].信息技術(shù)與網(wǎng)絡(luò)安全,2019,38(5):17-21.

[5] 劉星晨,陳樂生,胡果,等.基于深度學(xué)習(xí)的挑選禮物App設(shè)計與實現(xiàn)[J].物聯(lián)網(wǎng)技術(shù),2020,10(7):48-50.

【通聯(lián)編輯:謝媛媛】

临沭县| 舞钢市| 民乐县| 临沂市| 建德市| 财经| 华阴市| 陇川县| 凌源市| 四川省| 安阳县| 黄平县| 正定县| 宁乡县| 察隅县| 阜新| 阳泉市| 晴隆县| 普兰县| 望谟县| 确山县| 古丈县| 龙游县| 高雄市| 普安县| 苏州市| 阿拉尔市| 房产| 伊川县| 凉城县| 株洲县| 图片| 如东县| 益阳市| 若羌县| 恩施市| 红河县| 合作市| 迁安市| 北辰区| 孝义市|