孫劍鋒 夏蕓 李慧穎 / 工業(yè)和信息化部電子知識產(chǎn)權(quán)中心
從本期開始,“EIPC 咨詢”欄目正式與大家見面,EIPC 咨詢是由工業(yè)和信息化部電子知識產(chǎn)權(quán)中心研究部供稿的專利情報咨詢研究專欄。 專欄包括各行業(yè)宏觀態(tài)勢分析、知識產(chǎn)權(quán)評議以及熱點(diǎn)問題和法律政策探討等,從知識產(chǎn) 權(quán)視角出發(fā)為讀者研判產(chǎn)業(yè)趨勢,揭示發(fā)展風(fēng)險,挖掘潛在機(jī)會。
更多詳細(xì)研究內(nèi)容,請聯(lián)系工業(yè)和信息化部電子知識產(chǎn)權(quán)中心研究部。
人機(jī)交互是指人與計算機(jī)之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算機(jī)之間的信息交換過程。伴隨計算機(jī)的更新?lián)Q代和計算速度的加快,人機(jī)交互也經(jīng)歷了快速的發(fā)展,人機(jī)交互進(jìn)入了智能化交互階段:像人與人交流一樣簡單、自然。
圖1 全球人機(jī)交互領(lǐng)域?qū)@暾堏厔?/p>
圖2 全球人機(jī)交互領(lǐng)域主要技術(shù)產(chǎn)出國年度申請趨勢
最近幾年,美國、日本等廠商推出的游戲主機(jī)風(fēng)扉全球,極大刺激了人機(jī)交互技術(shù)的發(fā)展。用戶需求的多元化和對健身、娛樂的大量需求,讓廣大企業(yè)看到了新的商機(jī),這極大的激發(fā)了眾多新創(chuàng)企業(yè)專注于這一領(lǐng)域。從全球發(fā)展?fàn)顟B(tài)來看,無論是發(fā)展速度還是產(chǎn)業(yè)規(guī)模,人機(jī)交互領(lǐng)域都值得引起高度重視。
目前,全球范圍內(nèi)人機(jī)交互的通用技術(shù)和研究熱點(diǎn)主要有以下幾個方向:手勢及體感、語音和面部。手勢及體感主要指通過對肢體的動作和位置以及手指細(xì)節(jié)狀態(tài)的偵測而實(shí)現(xiàn)的人與機(jī)器的信息交互及控制;語音指通過自然語言將信息在人與機(jī)器之間傳遞而實(shí)現(xiàn)交互;面部則主要包括對人臉、面部表情等特征的檢測識別來實(shí)現(xiàn)人機(jī)交互的方式。本文將從專利分析出發(fā),依據(jù)專利優(yōu)先權(quán)國或首次申請國為主要統(tǒng)計依據(jù),試為讀者呈現(xiàn)全球范圍內(nèi),人機(jī)交互技術(shù)發(fā)展的現(xiàn)狀和趨勢。
全球人機(jī)交互技術(shù)專利申請的總體分布顯示,語音控制占整體專利申請的近一半,手勢及體感和面部的專利申請占比分別為36%和17%。以鍵盤、鼠標(biāo)等為代表的人機(jī)交互方式逐漸在娛樂等領(lǐng)域被語音、體感等方式為代表的新的人機(jī)交互方式所替代,人機(jī)交互技術(shù)已經(jīng)進(jìn)入到一個全新的階段。(見圖1)
上世紀(jì)90 年代開始,移動通信從萌芽、迅速發(fā)展到逐步穩(wěn)定的階段,期間產(chǎn)生的大量新技術(shù)改變了人們的生活方式和消費(fèi)習(xí)慣,也極大促進(jìn)了相關(guān)技術(shù)的發(fā)展。2000 年后,智能終端如智能手機(jī)、平板電腦、掌上電腦的出現(xiàn)促進(jìn)了新的交互方式的發(fā)展,再次掀起了人機(jī)交互技術(shù)發(fā)展的熱潮。
主流技術(shù)中,語音起步相對較早,2000 年左右達(dá)專利申請到高峰,近年來呈下降趨勢。面部、手勢及體感作為新的交互方式,2007 年之后迅猛發(fā)展。語音作為目前最受關(guān)注的人機(jī)交互技術(shù)之一,專利數(shù)據(jù)充分說明了目前語音交互技術(shù)發(fā)展較為成熟,技術(shù)指標(biāo)能滿足一般應(yīng)用的需求:僅從識別或合成等方面開展工作難以在產(chǎn)品的綜合體驗上產(chǎn)生大的突破,未來這一領(lǐng)域的研究重點(diǎn)集中在自然語言理解方面。另一方面,體感和手勢受到業(yè)界的青睞,隨著居民需求的多元化及對健身、娛樂的關(guān)注,這類技術(shù)的發(fā)展有望進(jìn)一步提速。
從全球人機(jī)交互主要技術(shù)產(chǎn)出國專利年度趨勢變化來看,美國和日本布局較早,中國、歐洲和韓國相對滯后。分析顯示,2000 和2010 年是美國專利申請的兩個轉(zhuǎn)折點(diǎn),技術(shù)和產(chǎn)業(yè)發(fā)展在這兩個時間點(diǎn)附近都產(chǎn)生巨大的變化;中國作為后起之秀,近兩年來增長迅速;日本自上世紀(jì)90 年代中期開始,基本處于平穩(wěn)狀態(tài),發(fā)展速度有限;韓國近年來也有一定幅度的增長。(見圖2)
圖3 人機(jī)交互領(lǐng)域各技術(shù)美國專利申請年度趨勢
圖4 人機(jī)交互領(lǐng)域各技術(shù)中國專利年度申請趨勢
美國作為全球發(fā)展最快的代表性國家,其內(nèi)在原因是擁有微軟、IBM、蘋果等眾多全球知名的高新技術(shù)企業(yè),同時新創(chuàng)的技術(shù)性小企業(yè)眾多,技術(shù)積累深厚。特別是進(jìn)入21 世紀(jì)后,新的人機(jī)交互方式大規(guī)模的應(yīng)用于消費(fèi)電子產(chǎn)品中,美國企業(yè)借助多年的技術(shù)積累,迅速在市場上崛起,微軟的Xbox,蘋果的iPhone 等產(chǎn)品風(fēng)靡全球就是最好的例子。日本企業(yè)21 世紀(jì)初以任天堂Wii 游戲主機(jī)等為代表的產(chǎn)品迅速引領(lǐng)以體感為核心的游戲方式,而此時微軟用于Xbox 的體感外設(shè)Kincect 尚未出現(xiàn),日本廠商一時風(fēng)光無限。
專利數(shù)據(jù)則顯示日本廠商在產(chǎn)品上市之前進(jìn)行了十余年的研發(fā)積累。另一方面,20 世紀(jì)末美國在這一領(lǐng)域的研發(fā)積累已經(jīng)逐漸超越日本。經(jīng)過十余年的發(fā)展,2010 年微軟公司將Kinect 產(chǎn)品推出市場,在銷售前60 天內(nèi),賣出800 萬部,成為全世界銷售最快的消費(fèi)性電子產(chǎn)品,迅速顛覆了日本廠商之前的優(yōu)勢地位,也進(jìn)一步拓寬了人機(jī)交互技術(shù)的應(yīng)用方式??梢姡魏纬晒Ξa(chǎn)品的推出,都進(jìn)行了長時間的研發(fā)積累,在人機(jī)交互領(lǐng)域,這一積累過程可能長達(dá)十余年。
進(jìn)一步的,對美國人機(jī)交互發(fā)展情況開展分析,梳理各個具體技術(shù)的發(fā)展歷程和現(xiàn)狀。(見圖3)
美國的語音交互技術(shù)專利申請從1990 年左右起步,在2000 年左右達(dá)到高峰,之后申請量進(jìn)入下行通道。美國在此領(lǐng)域起步較早,技術(shù)發(fā)展較為成熟,貝爾實(shí)驗室、IBM 等代表性申請人早在上世紀(jì)50 年代開始就投入大量資源進(jìn)行研究,并取得了相當(dāng)豐碩的成果,然而限制于當(dāng)時的硬件條件,其性能始終不能滿足一般用戶的日常生活需求,因此其應(yīng)用范圍也僅限定于特定的場景之下。
近幾年來,以Nuance 公司等為代表的技術(shù)提供商在IBM 等公司的研究基礎(chǔ)之上,依托云計算、網(wǎng)絡(luò)技術(shù)、硬件性能的快速發(fā)展,應(yīng)用深度神經(jīng)網(wǎng)絡(luò)等理論成果大幅提高了語音識別和合成等技術(shù)的可用性,以蘋果推出Siri 語音助手為代表,使這一技術(shù)成功的進(jìn)行了產(chǎn)品化和推廣應(yīng)用。從另一方面來看,經(jīng)過近半個世紀(jì)的發(fā)展,語音交互方式中“聽清楚,說明白”的階段已經(jīng)基本實(shí)現(xiàn),下一步更為重要的是“理解”。因而對于企業(yè)來說,仍在語音信號的分析識別階段投入過多的資源,可能回報有限。
手勢及體感領(lǐng)域,數(shù)據(jù)顯示美國企業(yè)在這一方面幾乎與語音同時起步,但與語音不同的是,為了實(shí)現(xiàn)手勢及體感的偵測和識別,可能涉及的技術(shù)更多,環(huán)境干擾也更為復(fù)雜,因而在產(chǎn)品化方面遲于語音技術(shù)。從市場上來看,美國市場上除了微軟成功推出Kinect 設(shè)備以外,各種手勢和體感操作裝備在近幾年也層出不窮,例如:2013 年,Leap Motion 體感控制器正式上市,實(shí)現(xiàn)了三維空間手勢識別設(shè)備的小型化和實(shí)用化??梢灶A(yù)測,未來體感和手勢將是繼語音之后有一個新的人機(jī)交互熱點(diǎn),其應(yīng)用范圍也會持續(xù)上升,在游戲主機(jī)之外的明星產(chǎn)品將很快出現(xiàn)。
總體來看,美國企業(yè),特別是微軟、蘋果、谷歌、Nuance 等領(lǐng)軍企業(yè)在人機(jī)交互領(lǐng)域?qū)嵙?qiáng)勁。其不僅在技術(shù)上擁有深厚的積累和強(qiáng)大的開發(fā)能力,更在產(chǎn)品應(yīng)用和市場推廣方面具有不可忽視的能量。另一方面,美國的眾多科技新創(chuàng)企業(yè)在人機(jī)交互這一領(lǐng)域的快速發(fā)展中起到至關(guān)重要的作用,諸多先進(jìn)技術(shù)和應(yīng)用的創(chuàng)意和技術(shù)原型都來自于這些小規(guī)模企業(yè),行業(yè)巨頭的收購則為這些技術(shù)的進(jìn)一步發(fā)展提供了更大的保障。
中國作為這一領(lǐng)域的后起之秀,與美國相比,既有明顯的差距,但也能從美國的發(fā)展經(jīng)驗中獲得明顯的后發(fā)優(yōu)勢。(見圖4)
總體來說,中國人機(jī)交互領(lǐng)域的發(fā)展與美國存在一定差距,但2007 年之后硬件水平的快速提高為中國語音技術(shù)提供商也提供的絕好的機(jī)會:國內(nèi)企業(yè)如科大訊飛在語音方面頗有建樹,目前國內(nèi)50%以上智能終端、教學(xué)設(shè)備語音控制技術(shù)都由科大訊飛提供。
2007 年以后,體感和手勢識別也進(jìn)入快速發(fā)展的階段。但與美國相比,無論是時間起點(diǎn)或發(fā)展速度都處于劣勢地位。一方面說明中國作為新興的發(fā)展中國家在這一領(lǐng)域的實(shí)力仍亟待增強(qiáng),另一方面,從對美國的分析可以看出,游戲主機(jī)產(chǎn)品對于這一領(lǐng)域的發(fā)展具有巨大的推動作用,而我國自2000 年起禁止游戲主機(jī)及相關(guān)產(chǎn)品在國內(nèi)的生產(chǎn)銷售。數(shù)據(jù)顯示2000 年左右正是美國在這一領(lǐng)域開始出現(xiàn)大量技術(shù)積累的起點(diǎn),經(jīng)過十年的發(fā)展而實(shí)現(xiàn)了技術(shù)的產(chǎn)品化、市場化。因此我國的這一政策可能影響到相關(guān)人機(jī)交互技術(shù)的發(fā)展。未來一段時間,游戲主機(jī)之外的人機(jī)交互產(chǎn)品將大量面世,對于我國相關(guān)企業(yè)而言,是不可錯過的機(jī)會。
首先,近十年特別是近五年,人機(jī)交互的方式已發(fā)生質(zhì)的變化。人機(jī)交互逐漸發(fā)展到現(xiàn)階段的智能化交互階段,人機(jī)交互像人與人交流一樣簡單、自然。手勢及體感、語音和面部等方式成為新的、主流的交互方式。
其次,美國是全球趨勢的領(lǐng)導(dǎo)者和技術(shù)的領(lǐng)跑者,而中國的巨大市場受到廣泛重視。美國是這一領(lǐng)域全球最大的技術(shù)產(chǎn)出國,美國的企業(yè)實(shí)力最強(qiáng),專利數(shù)量最多,年度增幅最大,美國的發(fā)展引領(lǐng)這全球的趨勢。而我國人機(jī)交互方面起步與全球總體相比晚了近10 年。但2000 年以后發(fā)展速度較快,年專利申請數(shù)量近5 年僅次于美國,反映出全球主要企業(yè)對在我國進(jìn)行研發(fā)團(tuán)隊組建、專利申請、市場推廣等方面的重視程度迅速上升。
最后,作者認(rèn)為語音業(yè)已成熟,手勢及體感的交互方式即將爆發(fā)。目前,在全球大部分市場語音技術(shù)發(fā)展已經(jīng)較為成熟,技術(shù)性能達(dá)到實(shí)用化的要求;而下一步的研究重點(diǎn)則是將語言信息轉(zhuǎn)化為操作指令即自然語言理解,目前由于人類語言的復(fù)雜性和不同語言之間巨大的差異,仍存在許多困難。而手勢及體感近年來受到廣泛關(guān)注,特別是由于體感游戲的推動而快速發(fā)展,近幾年甚至成為人機(jī)交互技術(shù)專利申請的主流。在智能電視等產(chǎn)品中,手勢及體感也被廣大廠商一致認(rèn)為是繼語音控制之后下一個重量級的功能。分析顯示,語音技術(shù)從技術(shù)發(fā)展高峰期到市場廣泛應(yīng)用大約需要5-10 年時間,而手勢和體感一方面專利和產(chǎn)業(yè)數(shù)據(jù)顯示其迅速升溫,同時在國外市場上游戲主機(jī)領(lǐng)域已經(jīng)出現(xiàn)成熟的應(yīng)用技術(shù)和模式,而近幾年消費(fèi)電子產(chǎn)品計算能力和網(wǎng)絡(luò)技術(shù)、云計算技術(shù)的快速發(fā)展更使得人機(jī)交互從技術(shù)成熟到廣泛應(yīng)用的過程大大縮短。綜合以上幾個因素可以推測,未來5 年之內(nèi),手勢及體感將有可能成為智能電子設(shè)備的必備功能之一,大規(guī)模的應(yīng)用即將展開。
聯(lián)系方式:
李慧穎:8868-6338 lihuiying@infoip.org
孫劍鋒:8868-6371 sunjianfeng@infoip.org
彭德坤:8868-6370 pengdekun@infoip.org
黃蘊(yùn)華:8868-6369 huangyunhua@infoip.org