国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

為什么說GDPR是人工智能的“緊箍咒”?

2018-06-27 05:03周源何芊樾謝麗容
財經(jīng) 2018年15期
關(guān)鍵詞:緊箍咒語音算法

周源 何芊樾 謝麗容

“因為GDPR(歐盟通用數(shù)據(jù)保護條例),我們在歐洲的新品發(fā)布已經(jīng)推遲了?!背鲩T問問創(chuàng)始人兼CEO李志飛告訴《財經(jīng)》記者。出門問問是中國一家人工智能(AI)創(chuàng)業(yè)公司,該公司基于AI技術(shù)生產(chǎn)諸如智能手表、智能音箱在內(nèi)的智能語音設(shè)備,2016年起產(chǎn)品已經(jīng)銷往歐美市場。

不僅僅是出門問問,《財經(jīng)》記者獲悉,許多AI公司都正忙于聯(lián)合法律專家,基于GDPR條款,全面審查和調(diào)整自己的產(chǎn)品、服務(wù)乃至商業(yè)模式。

GDPR全稱General Data Protection Regulation,號稱有史以來最為嚴格的數(shù)據(jù)保護法規(guī),歐盟于2018年5月25日正式實施。作為一項強制性法律,它保護的是自然人的“個人數(shù)據(jù)”,包括姓名、地址、生日、信用卡、銀行、醫(yī)療信息、位置信息、IP地址等等。

這意味著,任何在歐盟設(shè)立機構(gòu)的企業(yè)或向歐盟境內(nèi)提供產(chǎn)品和服務(wù)的企業(yè),在處理歐盟境內(nèi)個人的數(shù)據(jù)時都受到GDPR的約束,除非放棄歐盟5億發(fā)達人口市場。

如果違反GDPR,企業(yè)最高將面臨高達全球年營收4%或者2000萬歐元(約1.5億元人民幣)的巨額罰款(兩者取其高)。

AI是一個極度依賴數(shù)據(jù)的行業(yè)??v觀AI落地全過程,從最初進行AI算法模型的訓練,到形成最終的AI產(chǎn)品或服務(wù),數(shù)據(jù)都是不可或缺的生產(chǎn)資料,這意味著GDPR對AI的約束貫穿AI整個生命周期。而且,不僅僅是AI公司,但凡使用AI算法去改造自身業(yè)務(wù)的公司都需要評估是否違反GDPR。

《財經(jīng)》記者發(fā)現(xiàn),目前,“GDPR導致深度學習即將違法”等一些有失嚴謹?shù)挠^點廣為流傳,AI從業(yè)者在合規(guī)建設(shè)中普遍存在困惑。如何正確理解GDPR法律條款、評估可能的風險,以及預測GDPR究竟會對歐盟內(nèi)外AI產(chǎn)業(yè)帶來什么樣的影響,成了當務(wù)之急。

“兩步走”界定個人數(shù)據(jù)

GDPR由11章共99項條款組成,立法目的是在保護個人數(shù)據(jù)的前提下實現(xiàn)數(shù)據(jù)的價值。因此,企業(yè)首先要搞明白的問題就是:什么是個人數(shù)據(jù)?這并非看上去那么簡單明了,理解不當有可能令企業(yè)未來陷入法律風險。

按照GDPR的規(guī)定,姓名、地址、生日、信用卡、IP地址等信息均屬于個人敏感信息,此外,揭示人種族、政治傾向、宗教和哲學信仰、基因數(shù)據(jù)和生物數(shù)據(jù)、甚至個人健康或者性生活的數(shù)據(jù)也都被明確說明屬于個人數(shù)據(jù),但現(xiàn)實中仍然存在一些令人困惑的數(shù)據(jù)類型,例如,語音數(shù)據(jù)、車牌號碼是否屬于個人數(shù)據(jù)?

騰訊研究院專門研究數(shù)據(jù)保護法律法規(guī)的專家王融表示具體情況具體分析。GDPR規(guī)定對個人數(shù)據(jù)的定義很寬廣,能間接識別到特定自然人的數(shù)據(jù)也屬于個人數(shù)據(jù),在被保護的范疇內(nèi)。

“如果一段語音結(jié)合其他信息能定位到特定的個人,那這段語音數(shù)據(jù)可視為個人數(shù)據(jù)。車牌號也是一樣,由于具有唯一性,在很多場景下都可以被識別,這也是為什么谷歌街景要把車牌號均抹去的原因,但公家車的車牌又不屬于個人信息,所以要結(jié)合具體場景進行分析。”王融向《財經(jīng)》記者解釋。

AI公司使用的數(shù)據(jù)類型五花八門,如何判斷某類數(shù)據(jù)是否屬于個人數(shù)據(jù)?王融介紹了個“兩步走”的方法:第一步,判斷這一數(shù)據(jù)是否是由特定的個人產(chǎn)生;第二步看可識別性,能直接識別到個人自然無爭議,但要小心甄別“間接識別到個人”的情況。

2017年漢諾威科技展上,一位電視臺記者采訪一個機器人。

一旦界定手中擁有的數(shù)據(jù)為個人數(shù)據(jù),企業(yè)和機構(gòu)只能一一征求個人用戶的同意,并賦予個人用戶未來可以隨時撤回同意的權(quán)利,以及隨時要求相關(guān)機構(gòu)刪除其個人數(shù)據(jù)的權(quán)利。

不過,為了與其他正當利益達到平衡,GDPR列出了一些無需經(jīng)由個人用戶同意的場景。例如,為了公共利益或因官方權(quán)威要求而履行某項任務(wù),為了履行法律職責的需要,為了保護數(shù)據(jù)主體或另一個自然人的核心利益等。

這意味著,公共機構(gòu)仍然可以在公共場合設(shè)置攝像頭,并利用人臉識別技術(shù)對潛在的恐怖分子進行排查;醫(yī)療機構(gòu)發(fā)現(xiàn)大的疫情之后,也可以不經(jīng)當事人同意處理個人數(shù)據(jù)。

對于這一問題,我國行業(yè)標準《個人信息安全規(guī)范》(2018年5月1日生效)也做出了修正,詳細羅列了11項例外的情形,以保證數(shù)據(jù)的合理化使用。

深度學習不合法?誤讀

如果說對個人數(shù)據(jù)的理解不當可能給AI公司帶來法律風險,那對另一項條款的解讀正在讓一些AI從業(yè)者陷入過度的擔憂。

該條款名為“自動決策的可解釋權(quán)”(The Right to Explanation of Automated Decision),多個接受《財經(jīng)》記者采訪的行業(yè)人士認為,這是GDPR專門針對AI設(shè)立的條款。

針對該條款,《終極算法》作者華盛頓大學教授Pedro Domingos在今年初發(fā)表驚人言論:自5月25日起,歐盟將會要求所有算法解釋其輸出原理,這意味著深度學習即將非法。

人工智能早在上世紀50年代就作為獨立的學科存在,一直因為難以落地而長時間遇冷。最近幾年人工智能之所以再度時興,主要原因之一是出現(xiàn)了深度學習理論與技術(shù)。

但深度學習目前在一定程度上仍是“黑盒子”,難以解釋具體的內(nèi)部邏輯。

中國信息通信研究院云計算與大數(shù)據(jù)研究所副所長何寶宏曾分析稱,人們雖然利用深度學習構(gòu)建了神經(jīng)網(wǎng)絡(luò),但對神經(jīng)網(wǎng)絡(luò)表現(xiàn)出的一些“智能”還不能做出合理解釋,也事先無法預知學習的效果。

“為了提高神經(jīng)網(wǎng)絡(luò)訓練的效果,除了不斷增加網(wǎng)絡(luò)深度和節(jié)點數(shù)量、喂更多數(shù)據(jù)和增加算力,然后反復調(diào)整參數(shù),基本就沒別的招數(shù)了,而且,調(diào)參還像玄學,并沒有總結(jié)出一套系統(tǒng)經(jīng)驗做指導,完全依賴個人經(jīng)驗,甚至靠碰運氣?!焙螌毢暾f。

這也是為什么Domingos教授認為GDPR提出的“可解釋權(quán)”會令深度學習陷入“非法”狀態(tài)。

但王融告訴《財經(jīng)》記者:這種解讀并不嚴謹。

這是因為,GDPR的正式條款中并沒有出現(xiàn)過所謂的“自動決策可解釋權(quán)”,只是在GDPR背景引言(Recital71)中闡述了:數(shù)據(jù)主體對于自動化決定不滿意時,可以要求人工干預,并可以表達意見,獲取對相關(guān)自動化決定有關(guān)解釋。

“按照歐洲立法慣例,立法的背景引言只是起到幫助如何理解條款的目的,自身并不具有法律效力?!蓖跞谡f。

歐盟29條工作組實際于2017年10月專門明確澄清此問題:關(guān)于自動決策,數(shù)據(jù)控制者并不必然要解釋復雜的算法,對于用戶來說,只需要用盡可能簡單的方法告知其背后的基本邏輯或者標準即可。

王融表示,歐盟立法者其實是在警惕“純自動算法”形成的“算法歧視”。目前確有些企業(yè)出于商業(yè)需要對人們進行“數(shù)據(jù)畫像”,但畫像結(jié)果很可能對一些用戶形成了偏見,而企業(yè)此時往往以“我這是純算法,沒人干預”為由進行自我辯駁,GDPR則賦予用戶權(quán)利去要求公司給出解釋。

從這一角度來看,GDPR雖然沒有強制AI公司解釋算法,但AI公司未來仍然需要致力于解決AI的黑箱問題,因為并不排除在特定場景下,AI公司需要向監(jiān)管機構(gòu)對算法邏輯作出解釋。

“這個解釋的尺度如何,目前沒有過去的案例可以參考,只有在執(zhí)行過程具體的判例中才可知曉。”挪威大學計算機系教授楊志榮對《財經(jīng)》記者說。

對AI的可能影響

因為GDPR,AI公司當務(wù)之急是主動剔除不合規(guī)數(shù)據(jù),同時重新評估已有的算法模型。

從合規(guī)角度而言,如果之前的AI模型是基于不合規(guī)數(shù)據(jù)訓練而來,就應該重新訓練。不過,國內(nèi)一家知名AI公司技術(shù)負責人告訴《財經(jīng)》記者,一個AI模型一旦訓練好,幾乎無法證明這個模型是從非法數(shù)據(jù)訓練來的,所以很難要求模型提供商刪掉原有模型,去重新訓練一個。

盡管如此,AI公司仍然需要重新評估現(xiàn)有的算法模型。這是因為,無論是主動剔除不合規(guī)數(shù)據(jù),還是應用戶要求刪除數(shù)據(jù),都將導致AI公司手里的數(shù)據(jù)量減少,而數(shù)據(jù)變少會影響算法準確度,所以需要重新訓練。

就細分行業(yè)而言,語音交互AI公司受GDPR的影響較小,尤其比從事人臉識別的AI公司要小很多。

語音交互解決方案公司思必馳市場總監(jiān)龍夢竹向《財經(jīng)》記者道出其中原委:語音研究都是基于特定場景,從網(wǎng)上下載的通用場景的語音數(shù)據(jù)沒有用,因此語音AI公司都是自己找人在專門的場景下錄制,或從專業(yè)數(shù)據(jù)公司購買,這都意味著拿到的數(shù)據(jù)已經(jīng)獲得了當事人同意,數(shù)據(jù)源頭獲取就是合法的。

長期看,GDPR對個人數(shù)據(jù)的嚴格保護將增加AI公司的數(shù)據(jù)獲取與處理成本。之前AI公司獲取數(shù)據(jù)的成本接近零,GDPR終結(jié)了這樣的“好時光”。

對于公司來講,GDPR合規(guī)是一項系統(tǒng)、動態(tài)和長期的工作,需要增加一定的人力與財力的投入,并不是所有公司都能承擔這塊成本,多位行業(yè)人士向《財經(jīng)》記者表示,GDPR有可能延緩歐洲本土AI產(chǎn)業(yè)的發(fā)展速度,而一些中國AI公司因為無法承擔合規(guī)的成本,也可能放慢進軍歐洲市場的腳步。

但也有觀點認為,隨著時間的消逝,這一塊的支出會逐步下降。Zoom.Ai的CEO Roy Pereira曾預測,兩年后AI公司將不會認為數(shù)據(jù)支出是負擔,也并不會阻礙創(chuàng)新。

由于AI是一種技術(shù)可應用于各個行業(yè),因此,不僅僅是專門的AI公司受影響,但凡利用AI使得自身業(yè)務(wù)更智能的公司也要做出調(diào)整。

一位歐洲科技公司研發(fā)人員告訴《財經(jīng)》記者,目前AI在互聯(lián)網(wǎng)產(chǎn)品中的應用比較廣泛,例如該公司計算產(chǎn)品用戶流失率,就是通過用戶的個人數(shù)據(jù)以及產(chǎn)品的使用數(shù)據(jù)日志,比如說每次點擊、互動,還有瀏覽,運用機器學習模型,判斷如果用戶可能流失的話,再通過基于算法的精準營銷投放 (例如通過廣告渠道再次對用戶投放廣告),來挽留用戶。

“GDPR之前收集的數(shù)據(jù)都是比較多的,GDPR之后,客戶的隱私相關(guān)的敏感數(shù)據(jù)如性別、年齡、住址等都要下架,算法也要做修正。有一些來不及下架的,就需要暫停那個算法,調(diào)整合規(guī)之后再繼續(xù)使用?!鄙鲜鲅芯咳藛T說。

GDPR的影響涉及到所有AI應用公司。具體程度來說要看行業(yè),例如對產(chǎn)品中的客戶留存率只是一個準確率下降,因為AI算法的應用對這一類產(chǎn)品來說本來只是一個錦上添花的存在,所以整體看影響有限。

但對AI算法依賴度更高的業(yè)務(wù)來說,影響就比較大。例如廣告公司通過AI算法來進行廣告投放,投放精確度下降將對其影響很大,會造成客戶流失。此外,電商公司多通過AI算法推薦來增加銷售,也會受到比較大的影響。

盡管GDPR為AI套上了一個“緊箍咒”,但是從業(yè)者普遍贊同,發(fā)展和應用人工智能需要一個良好的環(huán)境,需要信任和責任,法律的監(jiān)管必不可少,GDPR作為史上最嚴數(shù)據(jù)保護法規(guī),正為這個 “緊箍咒”的監(jiān)管尺度做出有益探索。

猜你喜歡
緊箍咒語音算法
緊箍咒和慧眼
本期主題 可怕的緊箍咒
本期主題 可怕的緊箍咒
基于MapReduce的改進Eclat算法
魔力語音
Travellng thg World Full—time for Rree
基于MATLAB的語音信號處理
基于MQ3與MP3的價廉物美的酒駕語音提醒器
進位加法的兩種算法
對方正在輸入……