南方周末記者 徐庭芳
人們對個人隱私被侵犯的問題,已從懵然不覺轉(zhuǎn)變?yōu)楦叨让舾??!⌒氯A社記者 ? 邵瑞 ?圖
人工智能的核心在于數(shù)據(jù),算法的形成最終也取決于數(shù)據(jù)量的大小,可供參考的數(shù)據(jù)越多,算法也就越精確,人工智能的學(xué)習(xí)結(jié)果就更為準(zhǔn)確、高效。
對方僅僅擁有了你的面部信息并無用處,關(guān)鍵是要與你個人形成關(guān)聯(lián),知道你是誰,把你的銀行賬戶和頭像進(jìn)行匹配,進(jìn)而造成傷害。
近日,創(chuàng)新工場董事長兼CEO李開復(fù)在名為“HICOOL全球創(chuàng)業(yè)者峰會”的演講中提到,曾在早期幫助曠視科技公司找了包括美圖和螞蟻金服等合作伙伴,讓他們拿到了大量的人臉數(shù)據(jù)。
曠視科技(簡稱“曠視”)是國內(nèi)知名的人工智能AI創(chuàng)業(yè)公司,與商湯科技、依圖科技、云從科技共同被稱為國內(nèi)的“AI四小龍”。李開復(fù)的發(fā)言似乎驗(yàn)證了公眾長期以來的擔(dān)憂:科技公司正在盜用大家的數(shù)據(jù)。
螞蟻集團(tuán)、美圖秀秀和曠視都否認(rèn)了數(shù)據(jù)共享一說,李開復(fù)也在微博上致歉稱發(fā)言系“個人口誤”,并稱合作中曠視提供AI技術(shù)給合作方,數(shù)據(jù)一直存在于客戶服務(wù)器中,不涉及任何數(shù)據(jù)共享與傳輸。
但公眾似乎對“口誤”一說并不買賬。上善若水資產(chǎn)管理公司董事長侯安揚(yáng)在微博上發(fā)起了投票,“關(guān)于曠視的數(shù)據(jù)問題,你覺得李開復(fù)是說漏嘴了,還是搞錯了?”近6000人的投票中,有93%的人選擇了“說漏嘴了”。
早在2019年9月,曠視運(yùn)用人工智能監(jiān)控學(xué)生課堂一舉一動的實(shí)驗(yàn)就曾引發(fā)網(wǎng)友聲討,稱其將人臉識別扭曲為“人身監(jiān)視”。
人們對個人隱私被侵犯的問題,已從懵然不覺轉(zhuǎn)變?yōu)楦叨让舾?。如今,與大數(shù)據(jù)有關(guān)的互聯(lián)網(wǎng)公司都不免要面對這樣的質(zhì)疑:平臺是否擅自收集并使用了用戶的隱私數(shù)據(jù)。
南方周末記者分別向曠視科技和螞蟻金服發(fā)了約訪請求,但兩家公司均以不方便回答為由拒絕了采訪。
人工智能的核心在于數(shù)據(jù)
曠視科技成立于2011年,是人工智能產(chǎn)品和解決方案公司,2015年推出全球首款基于云端的人臉識別身份認(rèn)證解決方案,其“刷臉支付”技術(shù)入選《麻省理工科技評論》2017年全球十大突破性技術(shù)。
人臉識別和刷臉支付,最常用的場景就是手機(jī)解鎖以及網(wǎng)絡(luò)支付。
據(jù)此前媒體報道,螞蟻金服曾與曠視科技合作研發(fā)“刷臉”系統(tǒng),用于支付寶內(nèi)。2015年馬云還曾在德國電子展開幕式上刷臉買郵票,那是“刷臉支付”首次在國內(nèi)成型。創(chuàng)建這套系統(tǒng)是為了讓人們在購物后的支付認(rèn)證階段通過掃臉取代傳統(tǒng)密碼。
曠視和美圖的合作則是在移動設(shè)備上。美圖公司回應(yīng)南方周末記者稱,雙方僅在人臉解鎖方案上有過合作,“曠視科技這個方案是面向整個手機(jī)行業(yè)的。雙方的合作僅限于美圖手機(jī)”。
據(jù)曠視此前發(fā)布的招股說明書顯示,2016年Face ID解決方案的客戶僅為128名,到2018年這一數(shù)據(jù)已經(jīng)增加至1044名。根據(jù)灼識咨詢提供的報告,2018年曠視占據(jù)云端人臉識別60%的市場份額,其中超過70%安卓手機(jī)搭載曠視的人臉識別解決方案。
除了OPPO、vivo、小米、諾基亞、榮耀、錘子等眾多國內(nèi)手機(jī)廠商外,曠視與阿里巴巴、螞蟻金服、聯(lián)想、富士康等多個行業(yè)巨頭也有合作。
就職于北京一家人工智能算法企業(yè)的王峰告訴南方周末記者,從邏輯推斷,平臺(如螞蟻、美圖)將自身數(shù)據(jù)共享給算法公司(曠視)的可能性很小,“螞蟻這類大平臺,數(shù)據(jù)是它的核心競爭力,不論是從收益還是合規(guī)角度,曠視都不太可能拿到用戶數(shù)據(jù)”。
人工智能的核心在于數(shù)據(jù),算法的形成最終也取決于數(shù)據(jù)量的大小,可供參考的數(shù)據(jù)越多,算法也就越精確,人工智能的學(xué)習(xí)結(jié)果就更為準(zhǔn)確、高效,這使得曠視這類算法公司有了獲取數(shù)據(jù)的“動機(jī)”。
據(jù)王峰判斷,李開復(fù)所言的“掌握數(shù)據(jù)”,大概率可能是系統(tǒng)檢驗(yàn)和測試用到的一小部分?jǐn)?shù)據(jù),這些數(shù)據(jù)一般都做了脫敏,無法和個人真實(shí)信息相關(guān)聯(lián),目的只是為了讓AI模型更加準(zhǔn)確。“相當(dāng)于一種數(shù)據(jù)訓(xùn)練,算法公司即使證明了檢測人和賬戶使用者是同一個人,也無法確切知道這個人的身份?!?/p>
對公業(yè)務(wù)為主流
但這并非曠視第一次站在輿論的風(fēng)口浪尖。
2019年9月,一段人工智能監(jiān)控學(xué)生課堂一舉一動的短視頻就曾引發(fā)熱議。在監(jiān)視畫面上,兩位穿著校服正在上課的女學(xué)生被貼了多個標(biāo)簽,標(biāo)簽內(nèi)容是其聽課情況,系統(tǒng)檢測數(shù)據(jù)包括趴桌子、玩手機(jī)、睡覺、聽講、閱讀、舉手等行為的次數(shù)。圖片的左上角標(biāo)有“MEGII曠視”的字樣。
據(jù)媒體報道,這是曠視與南京中醫(yī)藥大學(xué)的一項合作,大學(xué)除了在校門口、學(xué)生宿舍大門口、圖書館和實(shí)驗(yàn)樓等場所安裝了人臉識別門禁外,還在部分教室安裝了人臉識別系統(tǒng),以檢測學(xué)生和老師的出勤情況,以及學(xué)生的上課聽講質(zhì)量。
被質(zhì)疑是否侵犯學(xué)生隱私后,曠視回應(yīng)稱,這只是曠世的技術(shù)場景化概念演示,未落地應(yīng)用。
曠視曾在公開場合介紹有關(guān)視覺AI在教育場景中的應(yīng)用。這一過程中,曠視科技將自主研發(fā)的人臉識別、行為識別、表情識別等技術(shù),集成在考勤及行為分析攝像機(jī)MegEye-C3和行為分析服務(wù)器中。同時通過對課堂視頻數(shù)據(jù)進(jìn)行實(shí)時的結(jié)構(gòu)化分析,反饋學(xué)生行為、表情、專注度、前排上座率等多維度課堂數(shù)據(jù),從而輔助教學(xué)評估評價。
與上述螞蟻和美圖的案例略有不同,曠視在學(xué)校不僅收集了學(xué)生的面部數(shù)據(jù),而且將這類數(shù)據(jù)用于學(xué)習(xí)形成算法模型,并與學(xué)生實(shí)名匹配。
該學(xué)校管理人員對媒體回應(yīng)稱,學(xué)校已經(jīng)詢問過公安部門和法務(wù)部門,在教室安裝人臉識別系統(tǒng)算不上侵犯隱私。換言之,學(xué)校成了主動收集信息的主體,曠視不僅為其量身定制了算法服務(wù),還能夠獲得學(xué)生的真實(shí)身份信息,這相當(dāng)于曠視間接獲得了學(xué)生面部的生物信息。
類似對公業(yè)務(wù)已經(jīng)成為國內(nèi)AI企業(yè)的核心業(yè)務(wù)。
根據(jù)曠視的招股書披露,曠視的人工智能解決方案主要有:個人物聯(lián)網(wǎng),城市物聯(lián)網(wǎng),供應(yīng)鏈物聯(lián)網(wǎng)三個方面。
招股書顯示,近3年來,城市物聯(lián)網(wǎng)解決方案在三項收入中占比最大。2017年、2018年以及2019年上半年,該項收入分別為1.68億元、10.57億元、6.95億元,分別占同期總收入的53.6%、74.1%、73.2%。
“目前的城市物聯(lián)網(wǎng),最大的應(yīng)用領(lǐng)域就是安防?!币晃籘MT行業(yè)資深分析師向南方周末記者解釋,人工智能企業(yè)最初的賽道集中在個人物聯(lián)網(wǎng)領(lǐng)域,但由于數(shù)據(jù)的可采集程度太低,無法形成良好的算法,業(yè)務(wù)收入也很少,所以在2017后,重心就換到了城市安防上。
具體來看,2016年、2017年及2018年與截至2019年6月30日止六個月,其五大客戶合計分別占總收入的41.7%、24.9%、22.0%及34.1%。
曠視介紹,這些客戶是中國智慧城市管理解決方案的系統(tǒng)集成商、中國智慧物流解決方案的系統(tǒng)集成商、中國電信服務(wù)供應(yīng)商。在這一領(lǐng)域,曠視已經(jīng)建立攝像頭、邊緣服務(wù)器、云端服務(wù)器三大硬件體系,相繼推出三十余款攝像頭,用于不同場景。
就在今年,曠視還曾在北京市海淀區(qū)以及中關(guān)村科學(xué)城管委會的統(tǒng)一調(diào)度下,試用了“人體識別+外/可見光雙傳感”技術(shù)方案。
這套方案可以通過前端紅外相機(jī)鑒別人流中的高溫人員,再根據(jù)疑似發(fā)燒者的人體、人臉信息,通過AI技術(shù),幫助各類公共場所(火車站、汽車站、地鐵站、機(jī)場)等高密度人員流動場景下快速篩查體溫異常者。一旦有疑似發(fā)熱人員出現(xiàn)就會自動報警,結(jié)合曠視自研的人體ReID檢測檢索技術(shù),幫助工作人員快速篩查發(fā)熱人員位置線索,以進(jìn)一步確認(rèn)檢測和醫(yī)學(xué)觀察。
之后,這套測溫系統(tǒng)率先在北京市海淀政務(wù)大廳和部分地鐵站展開試點(diǎn)應(yīng)用,南方周末記者在上海觀察到,該系統(tǒng)目前也被應(yīng)用在上海部分影院中。
人臉識別的風(fēng)險
2019年8月份,曠視宣布即將赴港上市。在這次IPO之前,曠視8年時間融資9輪,融資總額達(dá)74.6億元,估值已經(jīng)達(dá)到40億美元左右(約合人民幣287億元)。
在城市物聯(lián)網(wǎng)領(lǐng)域,已經(jīng)有??低?、大華股份等行業(yè)龍頭。曠視2019年上半年的營收為6.9億元,??低?018年營收則為498億元,二者完全處于不同量級。這導(dǎo)致曠視的財務(wù)狀況緊張,現(xiàn)金流始終為負(fù)。
與此同時,個人隱私信息的保護(hù)也越來越被公眾所關(guān)注。
早在2018年,百度安全實(shí)驗(yàn)室就曾公開通過實(shí)驗(yàn),以良性入侵的方式破解了指紋、虹膜等密碼,發(fā)現(xiàn)了包括人臉識別在內(nèi)的多項生物識別技術(shù)其實(shí)都具備“易于偽造”的特質(zhì),安全性甚至不如密碼。
“關(guān)鍵在于關(guān)聯(lián)性?!蓖醴褰忉?,對方僅僅擁有了你的面部信息并無用處,關(guān)鍵是要與你個人形成關(guān)聯(lián),知道你是誰,把你的銀行賬戶和頭像進(jìn)行匹配,進(jìn)而造成傷害。
數(shù)據(jù)泄露的消息近年來不絕于耳。先是2018年底,亞馬遜音箱被爆出發(fā)生重大監(jiān)聽事件,全球智能硬件竊聽風(fēng)云的故事頻繁登場。一位德國用戶向當(dāng)?shù)仉s志爆料,在向亞馬遜討要自己的個人活動語音數(shù)據(jù)時,對方發(fā)給他1700份陌生人對話的語音。
2019年2月,名叫Vic-tor Gevers的荷蘭安全研究員在社交網(wǎng)站上公開表示,中國的 一 家 面 部 識別 公 司SenseNets(深網(wǎng)視界)未對內(nèi)部數(shù)據(jù)庫做密碼保護(hù),導(dǎo)致數(shù)百萬公民的個人信息數(shù)據(jù)能夠不受限制被訪問。
據(jù)其介紹,此次數(shù)據(jù)庫內(nèi)含超過250萬人的信息,包括身份證數(shù)據(jù)、照片、工作信息等。該數(shù)據(jù)庫還可動態(tài)記錄個人位置信息,僅2月12日至2月13日的24小時,就有超過680萬個地點(diǎn)被記錄在案。250萬人幾乎“裸奔”在了互聯(lián)網(wǎng)上。
法律介入已經(jīng)刻不容緩了。2019年11月,“中國人臉識別第一案”正式宣判,案件起因是杭州一家動物園強(qiáng)行要求購買年卡的客戶進(jìn)行人臉識別,客戶將其告上法庭,最終宣判客戶獲勝。
如果人臉信息被泄露,加上動物園留存的客戶其他身份信息也被盜取,偷盜者完全可以建立起一套關(guān)于消費(fèi)者的身份信息,包括指紋、家庭住址、電話、臉部信息等等,不法分子完全有可能通過這類信息實(shí)施偽造、偷盜等活動。
(應(yīng)受訪者要求,王峰為化名)