? 無(wú)障礙設(shè)計(jì)研究小組 夏冰瑩
隨著人工智能的不斷突破,切實(shí)地給殘障人士帶來(lái)了極大的便利,比如,電動(dòng)輪椅讓肢體障礙的人可以獨(dú)立出行,字幕讓聽力障礙人群可以看視頻,讀屏軟件讓盲人可以自由地使用電腦和手機(jī)。那么,從無(wú)障礙視角來(lái)看,以后的科技會(huì)如何發(fā)展?答案是——比科幻片更精彩。
談到“智能科技輔助”,我們必須先了解兩個(gè)人機(jī)交互界的術(shù)語(yǔ)——多模態(tài)交互和環(huán)境計(jì)算。
多模態(tài)交互,講的就是用戶可以通過(guò)多種方式完成某件事。一些小范圍的交互已經(jīng)達(dá)到了多模態(tài),比如打字輸入這件事,你可以在實(shí)體鍵盤上打字、在觸屏鍵盤上打、用觸控筆或手寫輸入,也可以用語(yǔ)音輸入。但是,這離真正的、全面并且無(wú)縫銜接的多模態(tài)交互還有距離。
用戶與設(shè)備之間的交互,是由輸入和輸出兩部分組成的。目前主流設(shè)備中,普遍的輸入和輸出模態(tài)有以下幾種:
設(shè)備輸出包括視覺、音頻、觸感;用戶輸入:觸碰、語(yǔ)音,除此之外還有一些少見的實(shí)驗(yàn)性模態(tài),比如嗅覺/味覺/眼神操控/腦電波等。
任何障礙,無(wú)論是永久性的障礙(如視力障礙、聽力障礙),還是情境性或臨時(shí)性的障礙(如開車、做飯),都會(huì)影響到用戶的某些輸入和輸出能力。
真正的多模態(tài)交互,是任意一種輸出/輸入方式、都可以被任意另一種所取代,并且可以在不同模態(tài)之間切換自如。視覺/聽覺/觸覺互相替代,觸碰/語(yǔ)音互相替代。
語(yǔ)音交互當(dāng)下的另一個(gè)局限是很難在不同模態(tài)之間無(wú)縫切換。如果要用Alexa語(yǔ)音助理在Amazon上買購(gòu)物,就必須從語(yǔ)音開始查詢、用語(yǔ)音完成交易,很難用語(yǔ)音助理查到一半、再切換到App里完成購(gòu)買。但是,從情境性障礙的角度來(lái)看,用戶的障礙狀態(tài)是可能不斷變化的——如前一秒在大太陽(yáng)下走路(屏幕反光-視覺障礙)、下一秒就坐上了顛簸的公交(抖動(dòng)-肢體障礙)。那么,系統(tǒng)的交互模態(tài)也應(yīng)該跟著變化才對(duì)。這就帶到了下一個(gè)概念——環(huán)境計(jì)算。
環(huán)境計(jì)算,指的是有一個(gè)存在于環(huán)境中的、無(wú)處不在的系統(tǒng),隨時(shí)感知用戶當(dāng)前的需求,無(wú)形中提供個(gè)性化的服務(wù)。
HP的環(huán)境計(jì)算系統(tǒng)構(gòu)想:用戶看著房間玻璃的時(shí)候,玻璃上會(huì)顯示現(xiàn)在的時(shí)間、今天接下來(lái)的日程、以及家人回家了的通知。
在未來(lái)科技設(shè)想里,這是一個(gè)經(jīng)久不衰的主題:一個(gè)萬(wàn)能又貼心的私人智能助理,完全理解主人的喜好和需求,隨時(shí)隨地展現(xiàn)出當(dāng)前最需要知道的信息,在你主動(dòng)提出要求之前就幫你完成你想做的事。
2014年推出的Google Now就是一個(gè)早期嘗試環(huán)境計(jì)算概念的產(chǎn)品,它會(huì)自動(dòng)分析用戶的機(jī)票訂單E-mail、在合適的時(shí)間彈出航班信息、提醒你按時(shí)值機(jī)和出門,也會(huì)根據(jù)用戶的行為習(xí)慣、在快該下班的時(shí)候彈出回家的路況信息。但它還不夠“環(huán)境化”,仍然需要用戶主動(dòng)在手機(jī)上進(jìn)行大量操作。
近期逐漸進(jìn)入主流的物聯(lián)網(wǎng)則是環(huán)境計(jì)算的經(jīng)典案例。比如Nest智能溫控器,低調(diào)的設(shè)計(jì)讓它與家具環(huán)境融為一體、不再有冷冰冰的“科技感“,并且會(huì)在使用過(guò)程中學(xué)習(xí)主人的生活習(xí)慣,學(xué)習(xí)后不需要進(jìn)行任何操作,Nest就會(huì)自動(dòng)幫你在合適的時(shí)間把家里室溫調(diào)至你想要的溫度,讓科技完全隱形。
環(huán)境計(jì)算有兩大核心,一是科技退至背景。在使用傳統(tǒng)設(shè)備時(shí),設(shè)備本身是交互的核心,用戶要主動(dòng)握著手機(jī)、看著屏幕進(jìn)行操作。環(huán)境計(jì)算讓科技變成環(huán)境中的一部分:隱形、但無(wú)處不在。這樣用戶不需要刻意把注意力放在設(shè)備上進(jìn)行操作,而是讓背景中的系統(tǒng)自動(dòng)或半自動(dòng)地完成你想做的事情。二是高度科技化。智能科技就像一個(gè)體貼的管家,比誰(shuí)都更了解你的喜好和當(dāng)前的需求,會(huì)在合適的時(shí)間提出合適的信息和建議,讓你不用開口就能預(yù)測(cè)到你想要什么,自動(dòng)幫你打理好生活中瑣碎的事情。
從無(wú)障礙角度來(lái)看,環(huán)境計(jì)算帶來(lái)的潛力是:簡(jiǎn)化操作,不需要手動(dòng)操作,或只需要簡(jiǎn)單的指令就能幫你搞定一切的智能系統(tǒng),意味著障礙用戶的操作會(huì)變得更簡(jiǎn)單高效。
自然交互就是讓科技適應(yīng)人、而不是讓人適應(yīng)科技。語(yǔ)音、手勢(shì)、眼神等自然操作的出現(xiàn),不止會(huì)讓科技變得更自然化、隱形化,也會(huì)開啟更多的交互模態(tài)、給障礙用戶提供更多的操作選擇。情景感知系統(tǒng)隨時(shí)感知用戶當(dāng)前的身體限制,自動(dòng)適應(yīng)用戶的需求,切換到合適的交互模態(tài),從而避免繁瑣的手動(dòng)設(shè)置。
當(dāng)我們結(jié)合多模態(tài)交互和環(huán)境計(jì)算的時(shí)候,會(huì)產(chǎn)生什么樣的應(yīng)用?以一個(gè)人早晨起床后的活動(dòng)為例:
8:00,一個(gè)人被床頭的鬧鐘叫醒,迷迷糊糊地睜不開眼睛(視覺障礙),就跟鬧鐘說(shuō)“關(guān)掉鬧鐘”來(lái)停止它。系統(tǒng)檢測(cè)到“主人”起床了但睡眼惺忪,開始用語(yǔ)音播報(bào)現(xiàn)在的時(shí)間、今天的天氣、新聞、日程??紤]到“主人”剛起床有點(diǎn)迷糊(認(rèn)知障礙),它特意采用簡(jiǎn)短、語(yǔ)言簡(jiǎn)單的版本來(lái)報(bào)新聞。
8:05,這個(gè)人走進(jìn)洗手間,系統(tǒng)也跟著從床頭切換到洗手間里,他用電動(dòng)牙刷刷牙的時(shí)候,聽不清聲音(聽覺障礙),系統(tǒng)就從語(yǔ)音朗讀切換到隱藏在鏡子里的顯示,讓他用眼睛接著讀新聞。人在刷牙沒(méi)法用語(yǔ)音操控(言語(yǔ)障礙),所以系統(tǒng)把鏡子上的UI調(diào)整為適合人的模式,顯示出超大顆的“上一篇”“下一篇”按鈕,方便人點(diǎn)擊。
8:20,這個(gè)人洗完澡,開始吹頭發(fā),系統(tǒng)也跟著他從洗手間切換到了梳妝臺(tái)的鏡子上。吹頭發(fā)的時(shí)候他打算刷刷抖音,但是吹風(fēng)機(jī)太吵(聽覺+言語(yǔ)障礙),系統(tǒng)就自動(dòng)給他加上字幕。同時(shí),這個(gè)人的習(xí)慣是用手握著吹風(fēng)機(jī),只能單手操作(肢體障礙),所以系統(tǒng)繼續(xù)采用超大顆按鈕的UI模式。
8:30,這個(gè)人準(zhǔn)備出門,拎著包走進(jìn)車庫(kù)(肢體障礙),汽車看到“主人”走來(lái),自動(dòng)辨別出他的身份、給他開門。這時(shí)系統(tǒng)已經(jīng)切換到車內(nèi)音響。他一邊手握方向盤專心開車(肢體障礙+視覺障礙),一邊聽著車內(nèi)音響播報(bào)當(dāng)前的路況和今天的會(huì)議日程,并且系統(tǒng)還推薦了沿途最便宜的加油站,提醒他該去加油了。
這樣科幻片一樣的生活方式,并沒(méi)有想象中的那么遙遠(yuǎn),而是科技從業(yè)者們正在努力的方向。
上面這個(gè)例子,雖然是以非殘障用戶的視角寫的,但相信大家也能想象到,同樣的技術(shù)會(huì)給殘障用戶帶來(lái)更大的便利。
當(dāng)然,這樣無(wú)處不在、全知全能的人工智能也會(huì)有自己的問(wèn)題,比如“人工智障”現(xiàn)象,如隱私權(quán)、商業(yè)公司權(quán)利過(guò)大、機(jī)器學(xué)習(xí)中的偏見等。暫時(shí)放下這些陰暗的話題,單獨(dú)從人工智能的正能量潛力來(lái)考慮,多模態(tài)交互+環(huán)境計(jì)算帶來(lái)的未來(lái),可以是非常美好的。
不對(duì)用戶的身體能力做出任何假設(shè)、而是讓系統(tǒng)去適應(yīng)用戶想要的操作方式、并且根據(jù)情況隨時(shí)在不同操作模式之間切換自如,這才是真正友善包容、以人為本的科技交互。