李志波
Apple作為智能手機行業(yè)的代表,最早在2009年的iPhone 3GS上推出視覺無障礙功能,同時iPhone 3GS也是第一款以國行身份登陸到中國大陸的iPhone產(chǎn)品。如今11年過去了,iPhone產(chǎn)品也迭代到了iPhone 12。而iOS的無障礙功能得益于AI技術和傳感器技術的進步,也隨著上了一個新的臺階。其具體表現(xiàn)在iOS 14.2上是蘋果對「放大器」和「人物檢測」兩項功能的提升,也是iPhone 12 pro系列和iPad pro系列的LIDAR傳感器的實現(xiàn)的第一個現(xiàn)實應用場景。
這段時間,小編也在iPhone上體驗了全新的視覺無障礙功能,現(xiàn)在就跟大家聊一聊,這些功能體驗跨越了哪些障礙,又還存在哪方面的問題。
我們使用智能手機,屏幕是我們與手機進行交互的核心,但在我們普通人看來無論多么絢麗高清,高色彩還原的顯示效果,在視障人士面前都是一團漆黑或者只有微弱的顯示。所以視障人士與手機交互的核心就變成了語音交互。
我們打開iPhone的設置選項,在里面有個輔助功能選項,根據(jù)我們大多數(shù)人使用電子產(chǎn)品的經(jīng)驗,很少去點擊進入這個功能,但里面藏的是蘋果最大的人文關懷。
點開輔助功能里面的「旁白」后,「單擊」不再是「打開」,而是變成了「選取」,隨后系統(tǒng)會自動朗讀選中的內容,并引導用戶進行下一步操作。
這時我們只有通過「雙擊」才會確認,從而實現(xiàn)打開App、進入頁面等操作;「滑動操作」也不再只是通過「單指滑動」實現(xiàn),而是變成「三指滑動」。
當你需要一句句聽屏幕上每段文本的朗讀,就是像是我們必須聽完每段長達59秒的語音,為了更加高效地獲取信息,可以根據(jù)自身情況調整朗讀語速,最快可以達到兩倍。
另外在全新iPhone開機引導設置中,也可以使用語音引導,進行開機激活設置。
不過對于第三方應用的支持可能就不會太美好了。
當小編想要去微博或者豆瓣上發(fā)一條動態(tài)時,出現(xiàn)了第一個困難,就是找不到「發(fā)送界面」,唯一的解決方式就是把虛擬按鍵全部摸索一遍,在反復的過程中記住位置。
而在此時我們就會發(fā)現(xiàn)一些App設計本身所導致的問題。
一是部分交互按鍵過于「小巧」,在摸索過程中很容易略過,另一方面就是iPhone沒法識別,好幾個按鍵被框選在一起,被視作單一按鈕,因而喪失了操作的可能性。
除此之外,部分App冗雜的功能設計,讓視障人士體驗其基礎功能的時候十分麻煩,比如作為一個社交或者音樂App,在操作中可能聽到大量關于金融貸款、直播交友等冗余信息。
回頭看來,微信或者TIM這類App在承擔著重要社交職能的同時,由于簡約克制的功能設計,使其成為了對視障人士最友好的一批應用。
為此,小編認為系統(tǒng)本身的「旁白」功能還需要與App開發(fā)者進一步合作,刪減掉不必要的功能,或者只對關鍵區(qū)域進行識別標記等等,才能讓視障人士操作更加準確,信息接收更加高效。
這里的「放大器」并非是「放大鏡」,把它描述成一個AI相機也許更合適。借助它,失明或弱視人士可以更好地感知環(huán)境,借助機器學習,而不是僅僅是閱讀屏幕。
當我們啟用該功能后,iPhone能夠掃描識別環(huán)境,描述取景器中的人物、物體和其他環(huán)境元素,然后為我們朗讀。整個過程都是動態(tài)變化的,當iPhone檢測到不同圖像,或其他元素移動到視野中,語音描述也會隨之發(fā)生變化,十分準確,讓人驚艷。
但頗為遺憾的是,目前的中文提示只有簡單的詞組,比如「成人,樹林」。而當我們打開「旁白識別」中的「圖像描述」功能后,iPhone會通過英文具體描述道,同樣的場景描述為:「一個戴著眼鏡、穿白色襯衫的男人坐在樹下」。
其實,描述結果哪怕是直接翻譯成中文,效果也會不錯,而且這并不算難。有理由相信,在「放大器」的場景識別下,中文版本的「眼睛」也已在日程上了。
類似的編譯問題還體現(xiàn)在其他方面,比如在錄入面部識別信息過程中,iPhone說的不是「百分之二十」,而會播報「二十百分號」,所以iPhone的無障礙功能在語音本土化上還有待提升。
另外,值得一提的是「圖像描述J也支持識別微信、瀏覽器里的圖片,并且進行播報,可以看做內置的基礎OCR圖片識別功能。
我們可以把「微信」加入「屏幕識別J的應用App里——這項功能本來是針對那些沒有輔助功能的App,可以看成更完整的OCR識別——這時系統(tǒng)框選區(qū)域會跟隨內容形式變化,能夠識別到更小的按鈕和圖片文字內容,但也因此變得不規(guī)則,偶爾會導致基礎識別出錯,比如「圖像」和「按鈕」分辨不出來。
可以看出,在這個圖像和視頻主導的時代,手機廠商內置OCR圖片識別功能可以滿足視障人士的基本讀圖需求,但對于較為新穎的內容形式,識別兼容性還有待提升。
人物檢測功能是Apple在iPhone 12 Pro和iPhone 12 Pro Max中新加入的功能。借助Lidar傳感器,iPhone首次具備了掃描周圍環(huán)境的能力,也為視力障礙人士感知周圍環(huán)境提供了全新的方式。
人物檢測可以提示人與人之間的距離,并伴隨著距離變化發(fā)出不同頻率的提示聲音,就像我們在城市繁忙的十字路口一樣,不光有視覺信號燈,還有語音提示聲。也許在Apple的設想里,這就像是導盲手杖或導盲犬一樣,對于視力障礙人士判斷距離有非常好的輔助作用。
但是,這項功能并不能檢測出人與物之間的距離,這就陷入了一個尷尬的局面——正常行人都會主動避讓盲人,但障礙物卻不會自行移動,而放大器卻無法識別,所以說要取代導盲手杖還為時尚早,只能在特定的場景下起到規(guī)避來人的作用。也希望在不久的幾年蘋果將“障礙物檢測“這個功能加入進來。
蘋果的Siri第一次亮相在2011年的iPhone 4S上,這也是小編第一次接觸到智能語音助手這樣的產(chǎn)品,你可以直接以日常對話的形式,要求語音助手執(zhí)行一些需要在手機上執(zhí)行的簡單操作,它也能很好的識別并且執(zhí)行。然而9年過去了,Siri在智能化上,除了設置鬧鐘、倒計時、播放音樂這樣簡單的指令能完成的很好,其實對于大多數(shù)用戶來說,Siri并不常用。
但是對于主要使用語音進行交互的視障患者,Siri卻能做的更多,而且Siri也可以以對話的形式對語音指令進行反饋。
比如撥打電話,你只需喊出想要給誰撥打,電話就會直接撥通過去,而不需要執(zhí)行打開通訊錄,尋找號碼,撥打電話這樣的操作。甚至發(fā)送微信給某位聯(lián)系人,直接通過Siri也可以輕松做到。
顯然,Apple在無障礙方面所做的嘗試遠不止于此,順暢的通話體驗、友好的生物識別技術都在默默地支撐著特殊群體的用戶需求,也創(chuàng)造了智能手機中幾乎最好的無障礙體驗。
在2019年騰訊OO發(fā)布的《視障人士在線社交報告》中顯示,對于在線學習、旅行和求職類軟件,視障人士的使用需求雖然高達70%,使用率卻低于24%,我們的無障礙實現(xiàn)程度并不理想,這一次小編在iPhone的無障礙體驗中也深有體會,這條道路依舊漫長。
無障礙社會不僅僅是靠一塊屏幕,一家科技巨頭就能實現(xiàn)的。但我們很樂意看到的是其他公司在在這么做著。微軟有著幫助殘障人士設計的無障礙控制器Xbox Adaptive Controller,讓殘障人士也能享受游戲的樂趣;在出行上,滴滴出行推出了「無障礙專車」的服務,采用可升降的座椅設計,幫助行動不便人士順利上下車;像淘寶游戲、微信紅包也都支持了無障礙操作……
現(xiàn)在,巨頭們不斷更新迭代著自家產(chǎn)品的無障礙功能,他們向專業(yè)人士尋求建議,與視障人士共同打造解決方案,讓信息無障礙建設并不止步于技術層面,而是成為我們社會觀念與精神文明的內在,幫助更多的人享受科技的樂趣。
在2017年的錘子科技秋季新品發(fā)布會上,錘子科技給我們帶來了堅果Pro的升級版,堅果Pro 2。當時整場發(fā)布會看下來,其實最打動人心的還是堅果手機專門針對視障患者的無障礙功能。同時也請來了當年參加綜藝辯論節(jié)目《奇葩說》的選手蔡聰來到了現(xiàn)場談及視障患者是如何使用手機。
在當時大多數(shù)安卓廠商對于無障礙功能還是簡單的拿來主義,直接采用了安卓原生系統(tǒng)中的Talkback屏幕閱讀,很少有廠商對于無障礙功能進行特別的優(yōu)化和開發(fā)。堅果手機的無障礙功能主要是結合了圖片中文字識別技術,讓視障人士可以「聽見」網(wǎng)站里的復雜圖片和按鈕,讓視障患者有機會和普通人一樣充分享受智能科技的便利。
錘子的「無障礙模式」包括了兩部分,其中一部分被稱為「信息無障礙模式」,實際上是一個內置屏幕閱讀器,讓用戶不看手機,也能通過聆聽知道屏幕內容。
在蘋果系統(tǒng)上,這個功能就是旁白。但錘子比蘋果多走了「小半步」。
這「小半步」,包括了兩個對視障人士非常實用的功能:文字識別和語音指令批處理。
Smartisan OS
Smartisan OS的文字識別功能,借助掃描全能王的OCR技術,能識別出按鈕上的文字,甚至圖片里的復雜信息,這個功能我們在之前Smartisan OS上看到過,那時候主要應用場景只是把圖片中的文字“炸”出來,然后以文本的形式呈現(xiàn),實現(xiàn)可復制,編輯等操作,現(xiàn)在直接把文本朗讀功能加進去。
而語音指令功能則可以在識別到指令類文字的情況下,對手機常用功能進行快捷操作,比如快速啟動支付寶、微信的付款碼、查詢地圖、讀取網(wǎng)頁信息等。
一般打開微信的二維碼需要經(jīng)過8步,通過自動化批量處理操作流程,就能一鍵實現(xiàn)復雜操作。
調查發(fā)現(xiàn),因為視障人士出門購物十分不便,他們最大的渴望就是像普通人一樣在電商世界里順暢的瀏覽、愉快的閑逛以及尋找最優(yōu)價格。
雖然理論上,他們可以通過像蘋果「旁白」這樣的讀屏軟件實現(xiàn)。但實際上,目前應用市場上大部分應用與讀屏軟件的兼容適配性不好,使用起來體驗也很蹩腳。而支持VoiceOver的應用需要開發(fā)者去做額外的適配,這方面對于國內快速迭代的應用來說優(yōu)先級肯定不是太靠前。
對于應用中的按鈕(UlButton)上有title(文字標符)時,旁白能夠輕易讀取,但對于純圖片構造的按鈕,則需要對指定區(qū)域進行accessibilityLabel設置,這樣旁白才可以在朗讀屏幕內容的時候識別到圖片按鈕的信息。
一些沒有被開發(fā)者標記的按鈕,即使用讀屏軟件也無法識別朗讀,更別說遍布電商平臺的圖片促銷信息了,視障人士根本無法享受。
所以,借助掃描全能王的OCR文字識別技術,Smartisan OS系統(tǒng)手機可以很方便地讀取按鈕上的文字,甚至是促銷圖片上的信息。
總體來說,市面上應用對讀屏軟件支持有限,堅果手機作為一個這么小體量的手機公司,在2017年這個節(jié)點能去做針對視障群體的功能,而且做的還不錯,這也算是錘子科技這家公司的文化了。
如上文提到,得益于「讀圖翻譯」和「批處理」,錘子的無障礙模式功能比蘋果的旁白更進一步。
「無障礙」相當于給樓梯安裝扶手,也相當于給馬路劃分出清晰的功能區(qū)。
錘子得益于開放的Android系統(tǒng),的確為視障用戶提供了一條更有安全感扶手,和更清晰的操作路徑。
而蘋果的旁白面世已經(jīng)超過11年,經(jīng)過不斷打磨,在手勢的交互設計上也做得貼心,而且還加入最新的人物距離感應,和場景智能識別播報。這些功能目前在安卓手機上還沒有實現(xiàn)。
但是蘋果可以憑借其軟硬件結合的能力,以及對于生態(tài)的把握能力,把這一切做到更加極致。
錘子科技作為一個小廠商,在經(jīng)歷了幾次倒閉風波之后,最終被字節(jié)跳動收購,創(chuàng)始人也離開了手機制造領域,開啟了他的直播賣貨還債之路。但正是這家小廠,我們的父母在使用手機過程中碰到問題可以使用手機遠程協(xié)助功能尋求幫助,也正是這家小廠,在手機上加入了專門針對視障患者的更好的無障礙功能。
無論小廠商還是行業(yè)巨頭,更多是要讓社會意識到我們身邊有那么一群群體,他們其實跟我們一樣。不要讓這種數(shù)字鴻溝產(chǎn)生,廠商和開發(fā)者以及普通的我們一起讓這一切變得平等一些。
各系統(tǒng)無障礙功能使用手冊
Android系統(tǒng)的無障礙主要是針對視覺障礙人士,在設備的輔助功能中開啟無障礙服務(如TalkBack)后,它能夠讀取屏幕上的文本信息,轉化為語音提示,達到信息無障礙。原生Android系統(tǒng)本身已經(jīng)內置了無障礙套件(如果你的手機設置中沒有找到相關選項,可以嘗試在應用商店中安裝Android無障礙套件。
要實現(xiàn)Android手機無障礙使用主要是通過Android無障礙套件,包含了無障礙功能菜單、隨選朗讀、開關控制、TalkBack屏幕閱讀器。
以開啟TalkBack服務為例,具體操作:前往「設置>無障礙>TalkBack」,當出現(xiàn)綠色區(qū)域并伴有語音提示的時候表示進入了無障礙模式。某一區(qū)域能被正常選中,并有語音提示其文本信息,說明該區(qū)域具有無障礙功能。
打開輔助功能。首次設置iPhone時,您可以立即打開許多輔助功能。將iPhone開機,然后執(zhí)行以下任一項操作:
·打開旁白:連按三次側邊按鈕(iPhone X及后續(xù)機型)或連按三次Home按鈕(其他機型)。
·打開縮放:用三指輕點兩下屏幕。
·打開切換控制、更大字體和智能反轉等:選取語言和國家或地區(qū),輕點輔助功能選項的按鈕,然后選取想要的功能。
打開VoiceOver旁白功能。對于視障人士,iOS內置的旁白功能,可以幫助他們在看不到屏幕的情況下,也能夠了解屏幕顯示的每一項內容。用戶還可以調節(jié)語速,將「旁白」說話的速度調整到合適的范圍。打開旁白功能的方法:
·前往「設置>輔助功能>旁白」,然后打開或關閉設置。
·召喚Siri并說「打開旁白」或「關閉旁白」。
·連按三次側邊按鈕(iPhone X及后續(xù)機型)。
·連按三次主屏幕按鈕(其他機型)。
·使用控制中心打開。
打開閃爍LED以示提醒。打開這個功能后,iPhone用戶在收到任何信息時,手機背面的LED燈光會開始閃爍,引起用戶的注意,相當于將信息傳達的方式從聲音信號轉為視覺信號。具體操作為:前往「設置>輔助功能>音頻/視覺」,然后打開LED閃爍以示提醒。
增強手機震動效果。手機震動同樣是一個提醒我們有消息通知的好方法,改變震動模式可以獲得更強烈的體驗。具體操作:前往「設置>聲音與觸感」,輕點振動,然后選取一種振動模式,或輕點「創(chuàng)建新振動模式」以創(chuàng)建自己的模式。
用語音控制手機??梢栽诼爩憰r編輯文本,用語音命令和手勢導航,以及查看屏幕元素旁邊的編號或名稱。具體操作:前往「設置>輔助功能>語音控制」。打開語音控制后,用戶可以說出打開控制中心、回家、輕點項目名稱、打開App名稱、截屏、調高音量的命令。
減弱或停止屏幕元素的動態(tài)效果。如果你對iPhone上的動態(tài)效果或屏幕移動很敏感,可以停止或減弱某些屏幕元素的移動。具體操作:前往「設置>輔助功能>動態(tài)效果」,打開或者關閉任一元素:減弱動態(tài)效果、首選交叉淡出過渡效果、自動播放信息效果、自動播放視頻預覽。
macOS系統(tǒng)無障礙設計主要通過視力、聽力、肢體活動能力三大部分來實現(xiàn),啟用輔助功能只需要在Apple菜單中,選擇系統(tǒng)偏好設置,選擇輔助的按鈕后開啟要使用的功能。視力輔助技術上,VoiceOver旁白屏幕朗讀器可以準確描述屏幕上正在顯示內容。懸停文本功能則讓用戶能即時放大選中的文字內容。
Windows系統(tǒng)在系統(tǒng)中同樣提供了多個無障礙的選項,包括了放大鏡、顏色濾鏡、高對比度、講述人。其中講述人類似macOS系統(tǒng)的旁白功能,它是一款屏幕閱讀器,用于描述屏幕上的內容,以便用戶使用該信息來瀏覽設備。
可以通過以下三種方法打開或關閉講述人:
·在Windows 10中,按鍵盤上的Windows徽標鍵+Ctrl+Enter。在以前版本的Windows中,可能需要按Windows徽標鍵+Enter。
·在登錄屏幕上,選擇右下角的輕松使用按鈕,然后打開「講述人」下的切換開關。
·轉到「設置>輕松使用>講述人」,然后打開“使用講述人”下的切換開關。