国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

AI技術(shù)向善瓦解拐賣兒童案

2019-09-10 07:22:44姚胤米
科學(xué)大觀園 2019年15期
關(guān)鍵詞:李博士專案組人臉識別

姚胤米

由于人工智能的介入,四川、廣東等地,先后有8名被拐多年的兒童被重新找到。

這意味著,我們可能站在一個時間的分水嶺上:一種犯罪類型正在被技術(shù)逐步瓦解。

人工智能破案的事不是在未來發(fā)生的,這件事就發(fā)生在6月18日。2019年1月25日,一個星期五,四川省公安廳8層的DNA實驗室里,近300份DNA樣本被錄進檢驗系統(tǒng)中。下午兩點多,所有信息都收錄完畢,接下來是等待結(jié)果。打拐處處長蔣曉玲在辦公室里坐不住,她叫上搭檔胡麗,兩人一塊上樓,直接坐在DNA檢驗系統(tǒng)旁。

機器運轉(zhuǎn)得很慢。那個DNA庫“比較老”,蔣曉玲的手一直放在儀器旁邊的電腦鼠標上,“一會兒刷新一下,一會兒刷新一下”。她很急,想要馬上知道結(jié)果。

人工智能出現(xiàn)了

過去幾年,四川打拐的警察們都在跟一個案子纏斗。最初,只是2014年4月一個四川遂寧的兒童被拐,經(jīng)過了兩個多月的偵查,同年發(fā)生在巴中、南充的兩個拐賣案被串并到一起。四川省公安廳調(diào)度幾個市轄的警察成立專案組,稱為“4·26案”。這些案子手法一致、嫌疑人體貌特征接近。

線索都指向了王×文。

他走路有點拖,“但也不是瘸”。2014年7月31日,在四川省達州市渠縣老家,王×文被抓了,這次行動有3名男孩被解救。經(jīng)過進一步審訊,一個驚人的進展出現(xiàn)了:從2008年起,發(fā)生在四川多市縣總共13起兒童拐賣案,都跟王×文有關(guān)。很快,這個系列拐賣案被公安部列為部督案件,但這只是個開始。

干了多年警察,蔣曉玲偶爾會遇到這樣的案子。這些案子的線索就像一根斷線的風(fēng)箏,會在某個環(huán)節(jié)突然斷掉。警察們用盡一切辦法,不放過任何機會,但所有的努力都卡在一個關(guān)節(jié)處,成為積案。

王×文就是這樣一個關(guān)節(jié)——他不斷翻供,拒絕提供中間人的信息。越來越清楚,指望從他這里打開局面并不現(xiàn)實。

青少年是兒童成長最迅速的時期,孩子的臉一年一個樣子。時間每多一天,找到的概率就少了一些。最長的一起拐賣案,有的警察跟了10年,沮喪感一度籠罩著他們。DNA比對已經(jīng)進行過一次,無功而返。那一次,警察們完全依賴人的經(jīng)驗,從一個人口數(shù)據(jù)庫中,篩出一批兒童,但沒有一個中的?!词故亲钣H密的父母,對于失蹤了多年的孩子,肉眼和記憶也并不可靠。

直到人工智能出現(xiàn)了。

2018年11月,上海漕河涇開發(fā)區(qū)軟件園的優(yōu)圖實驗室里,一臺擁有4塊GPU的組裝電腦開始高速運轉(zhuǎn)。顯示屏的編程軟件終端界面上,一串串超級長的字符自動生成,動態(tài)移動,像一道向上流動的瀑布。

這些字符,代表著一個龐大數(shù)據(jù)庫中,與10位在10年前被拐兒童的相似程度。兩個小時后,研究員曉程的電腦上生成了10個文件夾壓縮包。核實無誤后,文件夾壓縮包最終被轉(zhuǎn)交到蔣曉玲的手上。

每個文件夾里有101張照片。第一張照片是被拐兒童,看著有年頭了。像素很低,很模糊,是個只有兩三歲的小男孩。

剩下的100張照片,是100個13歲左右的兒童,他們以滿分100分制降序排列。一張照片下寫著分數(shù):98.3。這意味著照片里的人與被拐兒童有98.3%的概率是同一個人。

提交給四川警方的說明文檔中,優(yōu)圖團隊的湯海鵬做了解釋:75分是萬分之一閾值,80分是十萬分之一閾值,85分是百萬分之一閾值。以75分為例,如果兩個人臉比對分數(shù)超過75,則這兩個人臉是“萬里挑一的像”。

這是跨年齡人臉識別技術(shù)的第一次應(yīng)用。人工智能是否可以幫警方解決一個多年的難題,沒有人知道答案。在四川省公安廳,參與打拐的警察們都充滿期待。有人很樂觀,猜測可能會比對上幾個,一個干了多年警察的老刑偵比較保守,猜兩個。

多年以來,這個案子成了他們最大的心結(jié)。蔣曉玲說,要是這條路走不通,“我們可能現(xiàn)在又換另外一條路走,反正一直得往前走,走下去,不能停止,一直得走?!?/p>

那天,他們一直在DNA實驗室里等了8個小時,晚上10點多,仍然沒有結(jié)果出來,他們只好先回家。下個周一,一到公安廳,蔣曉玲就直奔八樓。她還是不停地刷,沒有,然后再刷,上午9點多,“一刷新,刷,出來了四個人?!?/p>

盯了一會兒這個數(shù)字,她趕緊回過神來?!耙幌伦訌陌藰桥艿搅鶚恰?,她找到胡麗,語氣特別興奮和激動地說:“比上了4個!”

案子拖了快10年了。兩個女警察在公安廳六樓的走廊里情不自禁地“跳圈圈”,一直在轉(zhuǎn)。“搞得整層樓別的科室的人都跑出來看,說打拐處的怎么回事?!被貞浧疬@個細節(jié)時,蔣曉玲抑制不住情緒,眼淚要掉下來。

“4·26案”是一個系統(tǒng)工程

王×文是一個記憶力極其出色的人。在描述拐賣現(xiàn)場時,他能記住幾乎所有的細節(jié)。但一旦談起孩子的下落,王×文要么翻供,要么就“不記得了”。

即使掌握著越來越多的刑事偵查手段,但面對這樣的拐賣案,也沒有立刻奏效的辦法?!e過找回失蹤兒童的黃金時間,就只能從市縣一級適齡人口中進行搜索,這意味著至少數(shù)十萬級別的檢索規(guī)模。如果進一步擴大搜索范圍至省一級,檢索規(guī)模將急劇擴大到千萬以上,堪稱“大海撈針”。

負責(zé)打拐的警察們付出了大量努力,他們的名字很難被一一記下。比如,四川省很多老刑偵都記掛著這個案子。其中一個老警察,2018年被公安部評為百佳刑警,已經(jīng)50多歲了。一直參與案件,工作做得很細。

公安廳刑偵局局長王宏偉回憶,他到省廳工作,接起這個案件,“當(dāng)時還沒有打拐處的時候,這一塊工作就抓得很緊?!?/p>

“4·26案”是一個系統(tǒng)工程。“就像我們猜謎語,你首先要揭曉謎底,這個我們有一個艱苦復(fù)雜的偵破過程?!蓖鹾陚フf。

但越到后面,案子變得越棘手。因為王×文拒不供述這些被拐兒童的下落,全國打拐DNA信息庫比對也沒有結(jié)果,案件的偵破工作陷入僵局。

對于那些丟失孩子的父母來說,10年里,他們只是在嘗試各種徒勞的辦法。桂宏正聽說深圳有個父親“通過不斷地在電腦上發(fā)發(fā)發(fā)”,找回了孩子。他就也買了一臺電腦,在天涯論壇、百度貼吧里發(fā)帖。他加了三十幾個尋子微信群,每天收到成千上萬條消息。

孩子被拐前唯一清晰的單人照,被印在各種形式的尋人啟事上。包括:張貼在電線桿、建筑物外墻上的普通A4紙;可以用一根繩子連接起來,掛在脖子上雙手托舉的泡沫板;可以被掛在汽車上幾個月不掉色的彩色噴繪布;還有尋人公益組織為了某次活動而印制分發(fā)的撲克牌。以及,鄭州一家私人手機店的墻面上——手機店的老板也是被拐孩子的父親,他的店鋪墻面上全是丟失孩子的照片。他讓來店里買手機的人都看一眼,這樣找到的希望就多一些。

但這只是其中的一個故事。現(xiàn)實比期待殘忍多了。

每天泡在數(shù)學(xué)題里

線索匱乏,專案組的警察們各種辦法都試過了。

其中的一些辦法,蔣曉玲現(xiàn)在看來,會覺得“很幼稚”。一次,專案組到廣東,借了一間辦公室。警察曹軍和十余名同事每人對著一臺電腦,一條條看別人的“家譜”?!粋€家庭里有幾個小孩?最后一個是不是男孩?和姐姐相差多大?和父母的年齡相差多大?

他們每天泡在數(shù)學(xué)題里,“看瞎了,幾乎家家戶戶都好多人啊,比我們那里人多多了?!笔畮兹f條數(shù)據(jù),專案組的警察用肉眼一個個篩查,最終顆粒無收。

2014年底,他們曾經(jīng)冒著極大的風(fēng)險把王×文從看守所提出來,押到廣東去指認現(xiàn)場。 專案組十余名警察集體行動,曹軍也去了。他是武勝縣的警察,那起農(nóng)貿(mào)市場的案子串并后,他被領(lǐng)導(dǎo)指派加入了專案組。為此,他到廣東出了數(shù)不清多少次的差。走訪得多了,他對當(dāng)?shù)氐拿耧L(fēng)也有了解,“他們那里,家里沒有男孩是沒有地位的?!?/p>

曹軍非常符合人們想象中的基層警察,長得高大,身材很壯,能吃苦,看起來沒有架子,說話很生動。押解期間,專案組的民警們和王×文吃在一起,住在一起,24小時輪流看守,又要防止他生病,還要提防他自殘或自殺。

出發(fā)前,王×文說:“應(yīng)該能找到。”可一到目的地,他就改口說:“路都變了,認不出?!?/p>

車在市內(nèi)剛開了沒多遠,王×文說:“車開得太快了,我看不清?!辈苘娝麄冎缓醚褐聛碜呗贰W吡艘粫?,實在太慢,他們便找了幾輛“火三輪”,那是11月,三輪車沒有棚頂,露天,風(fēng)大,“慢慢開,又冷,吹得頭發(fā)全是立起來的?!?/p>

他們終于在當(dāng)?shù)匾粋€縣找到了王×文供述的“一所小學(xué)”。一下車,所有人都傻眼了——“修的房子都是一模一樣的。”曹軍說,不僅如此,村子里大部分人家連姓氏都是一樣的。

一群四川人到廣東找小孩,語言都是不通的。他們試過挨家挨戶走訪,沒有效果。他們問了一圈兒,什么都問不出,最后只能押著王×文回去。

2015年,專案組聯(lián)系了沈陽著名刑事相貌專家、中國刑警學(xué)院的趙成文教授畫像,根據(jù)孩子們的童年照片,畫出他們十幾歲的樣子。

模擬畫像是刑事偵查中的一項重要技術(shù),它曾幫助中國警方破獲了相當(dāng)多的案件。這一次,專案組帶著這些畫像再到廣東,提取適齡兒童照片,“用肉眼找出覺得和這個像的”。

看了10天,找到176張照片帶回四川,組織家長辨認。南充市公安局刑偵支隊的賈副支隊長回憶,在辨認現(xiàn)場,一開始,孩子的父母覺得“都不像”,看著看著,一個覺得這個像,一個覺得不像,夫妻之間有時會陷入爭吵。

“你才帶了幾天,你知道像不像?”

“要不是你,孩子能丟嗎?”

一份資料里顯示:這樣的家庭,“70%夫妻關(guān)系破裂,分居或離婚”。最后,他們篩出來100多個“疑似對象”,做DNA比對,一個都沒中。

局面困在了這里。

跨年齡人臉識別

挫折接連不斷。在警方嘗試各種新辦法時,2015年,具有更大運算力和儲存空間的GPU的應(yīng)用,把人工智能的熱度推向巔峰。——GPU是圖形處理器的簡稱,比傳統(tǒng)中央處理器計算速度快10至100倍。

深度學(xué)習(xí)算法使得訓(xùn)練出一個“更聰明”的AI成為可能。人類“不可靠”的部分——人工智能總有辦法規(guī)避掉。

2017年12月,公安部刑偵局副局長陳士渠到專家組調(diào)研。專家李博士和他交流時,提到人工智能和跨年齡人臉識別技術(shù)。陳士渠很感興趣,他想起了“4·26系列”拐賣案——近10年來,公安部打拐辦和四川公安從未放棄過努力和偵查,他曾多次前往四川督辦此案。他希望找到突破口,便要求四川專案組和騰訊團隊對接,“希望利用新技術(shù)查找被拐兒童下落?!?/p>

需求被轉(zhuǎn)達給人臉識別團隊——優(yōu)圖實驗室時,沒有人感到樂觀。這是一個“全博士”團隊,都畢業(yè)于名校,技術(shù)水平很高。但得到這個消息時,優(yōu)圖實驗室總經(jīng)理Kyle的第一反應(yīng)是:“難度還是挺大的?!?跨年齡比對是人臉識別領(lǐng)域一個公認的難點,特別是青少年階段,人臉特征變化最大。優(yōu)圖當(dāng)時的算法模型,并沒有進行過大規(guī)模的跨年齡比對,準確率在80%左右,這遠不是一個能夠應(yīng)用到安防打拐領(lǐng)域的算法。

之后的十幾天,守護者計劃團隊和優(yōu)圖實驗室的同事開了很多次會。2018年1月的一個深夜,12點左右,已經(jīng)入睡的優(yōu)圖實驗室總監(jiān)Allen電話突然響起,是守護者計劃安全團隊的同事,Allen當(dāng)時“并不明確公安部要做什么事情”,他的第一反應(yīng)是“這件事情肯定很重要,不然不會這么晚緊急找過來”。

第二天上午10點,Allen就接到通知,要用優(yōu)圖的技術(shù)幫助尋找這起拐賣大案中的失蹤兒童。

Allen心里沒底。跨度10年的案件難度,超過他們的想象,世界上也沒有成功的案例。但他決心要全力以赴。

執(zhí)行工作由優(yōu)圖人臉識別團隊的李博士牽頭。最重要的是“學(xué)習(xí)材料”。他們通過各種數(shù)學(xué)約束條件,教導(dǎo)AI——“這是同一個人”“這是這個人1歲的樣子,5歲的樣子,10歲的樣子,30歲的樣子”“這個大人的照片,跟其他小孩子都是不像的” 。

“它會學(xué)到一個人的面部隨年齡演變時,不變的那些量是什么?!毖芯繂T曉程說,這些面部特征,“可能對應(yīng)著一些語義描述”。

曉程總是會冒出這種又準確又干脆的詞——“比如,一個人的耳垂長得很特別,或者他的眉峰、眉骨走向不一樣。”他說,AI是無法用這樣的語言去定義的,研究員們把它“轉(zhuǎn)化成一些數(shù)學(xué)語言”。

最終的結(jié)果是,機器學(xué)習(xí)總結(jié)出了“不隨時間變化的人臉特征”——在研究員的電腦上,是由長度為512維的特征向量呈現(xiàn)出來的。很多個夜晚,研究員們消耗在這些事情上。他們加了數(shù)不清的班,提交了5個版本算法模型,其中大大小小的修改多達上千次。

中間,有一次測試的機會。2018年年初,公司年會。他們收集了一些同事小時候的照片,在年會上讓機器和人一起競猜,“人機大戰(zhàn)”?!耙驗槎际潜容^熟的人,”李博士覺得,“這肯定能認出來吧。”游戲進行了幾輪,最終的結(jié)果是,人最多猜對了4個,而算法比對了7個。 這終于讓他放心了——“這個事情雖然難度大,但算法肯定是比人強的?!?/p>

比中4個孩子

2019年1月28日,比中4個孩子的結(jié)果,陸續(xù)向整個項目的參與者傳遞。李博士是在飛機上得到消息的,四川省公安廳打拐處前副處長唐中琦給他打來電話,叫他猜,比中了幾個。

李博士沒敢多猜,他說:“一個?!碧铺幷f:“不對,再猜?!崩钚虏拢骸皟蓚€?!碧铺幗視源鸢福骸?個?!?/p>

李博士聽完,幾乎尖叫出來。湯海鵬也很激動,他已經(jīng)記不清當(dāng)時在哪兒,但非常清楚地記得,聽到結(jié)果時,他真的哭了。 當(dāng)結(jié)果傳到上海優(yōu)圖辦公室時,幾名研究員正在如常地對著電腦寫代碼,看到比對上4個,李博士、曉程、Allen幾個人“小聲地yeah了一下”。

那天是周一,Allen說,“覺得不可思議,就是一下子從凳子上坐起來,很驚奇,很驚喜?!彼念A(yù)期是能找到一個就不錯了。

打拐的警察們付出了幾個月的努力:人工智能可以幫助警方把海量的數(shù)據(jù)縮小到100個,但拿到數(shù)據(jù),并不意味著工作就結(jié)束了。蔣曉玲組織警員,先用4個多月的時間,進行了基礎(chǔ)的刑偵工作。2019年2月11日,四川省公安廳刑偵局副局長宋月齊率12名專案組人員趕到廣東,對比中的4個孩子的情況進行落地偵查。剩下的就是最后一步——驗證結(jié)果。

春節(jié)假期剛過,警方提出進行第二次比對。研究員們又對算法進行了優(yōu)化。這一次,他們擴大了比對范圍。——原有的辦法受“學(xué)習(xí)材料”的影響很大,因為缺乏足夠的跨年齡圖像數(shù)據(jù),這個AI并不能做到像是針對成年人的人臉識別AI那樣好。

李博士用“祖母細胞”打比方?!八僭O(shè)人,比如說腦子里面有一個祖母細胞,只有在看到祖母的時候它才會響應(yīng)?!?/p>

人類的智力不可能這樣思考。但在優(yōu)圖內(nèi)部,他們把所有的人臉識別模型都按照“祖母1、2、3、4”這樣推下來,它對熟悉的東西“學(xué)得特別好”,對不熟的東西“學(xué)得就不好”。

關(guān)鍵時刻,曉程開發(fā)了一套損失函數(shù),把識別成年人時表現(xiàn)得“很聰明”的AI作為老師,將跨年齡識別“不夠聰明”的AI作為學(xué)生,讓學(xué)生給出的判斷結(jié)果盡可能靠近老師?,F(xiàn)實條件中,照片的質(zhì)量、人臉的角度、遮擋、光線都有可能對AI的判斷帶來影響?!拔覀?nèi)ソ踢@個老師,盡量克服其他因素的影響,去獲得人臉特征?!?/p>

對于教導(dǎo)和開發(fā)AI的研究員來說,與AI的關(guān)系是很特別的。他們雖然是AI的設(shè)計師,但AI經(jīng)過自我學(xué)習(xí)后,又變成一個強于人類智力組織的存在。

曉程說,“我們教導(dǎo)AI,通過精簡后的一些學(xué)習(xí)準則,行為設(shè)計的標準,把它生產(chǎn)出來,最終,它就會達到人類都無法達到的高度?!?/p>

AI的識別精度最終提升到接近96%。它還在不斷進化。2019年2月,第二次比對,又找到1人。2019年3月,第三次比對,又找到2人。至此,這起部督拐賣專案的13名被拐兒童,只有3人尚未被確認身份。

解釋不了一切

2019年4月,釀酒商人桂宏正和妻子終于等到了人生里最渴望的那個消息——被拐10年的兒子找到了。他們的心情和他們的狀態(tài)一樣慌亂。從警察手里接過兩張照片:那是他們的孩子,變樣了,有點陌生。他們仔細看,才看得出孩子兩三歲時的樣子。10年過去了,即使是親生父母,也不能在人群中一下認出他。

桂宏正夫婦曾經(jīng)歷過一場空歡喜,那種心情“比悲傷更要悲傷”。2012年,有志愿者聯(lián)系桂宏正,說疑似在西寧看到了孩子。志愿者發(fā)過來一張照片,男孩的眼角也是垂下來的,兩頰紅紅的。桂宏正幾乎確認那就是他兒子。幾天之后,志愿者確認那個孩子不是他的。

“那次我真的就太傷心了?!惫鸷暾统鍪謾C,打開相冊刷了幾秒鐘,點開那個小孩的照片,拿給我看:“你看像不像?”

不等我回答,他說:“整個都像?!?出現(xiàn)這樣的“錯誤”并不奇怪。生物學(xué)統(tǒng)計,女性懷雙胞胎的自然概率是八十分之一。人群中,兩個相似度極高的人出現(xiàn)的概率更高,人類肉眼分辨人臉相似度沒有那么可靠。

他們唯一能掌握的不太會被時間改變的細節(jié),是孩子右腳小腿上的一處疤痕。那是男孩小時候在酒坊玩耍,不當(dāng)心被滾燙的水燙的。4月12日,在廣東一處民宅與兒子相認時,這對父母做的第一件事情是:一把掀開孩子的褲腳,看看小腿上是不是有一條疤。

技術(shù)帶來的結(jié)果令人欣喜,6月19日,最新的一個消息:今年四五月,優(yōu)圖的人臉識別技術(shù)又幫助深圳警方找回一個失聯(lián)多年的兒童。那是2000年,深圳羅湖發(fā)生一起綁架兒童案,綁匪索要贖金20萬元。奇怪的是,小孩和綁匪隨后卻消失了。多年來,警察沒有放棄尋找,也曾找畫像專家進行跨年齡模擬畫像,都沒有獲得有價值的線索。孩子失聯(lián)時只有3歲,19年過去了,他被找到時在深圳一家餐廳當(dāng)廚師。

陳士渠說,這些兒童被找回,“充分證明人工智能對于查找被拐多年兒童能夠發(fā)揮重要作用?!倍壳?,采取盜竊、搶奪、拐騙等方式拐賣兒童的案件,“全國年發(fā)案只有幾十起”,基本可以快偵快破。

這意味著,我們可能站在一個時間的分水嶺上:一種犯罪類型正在被技術(shù)逐步瓦解。

蔣曉玲對未來充滿期待,“我們今年準備看能不能把剩下幾個解決掉,要是這幾個也找到的話,我們的案子就比較完美了。”

四川的案子中,還有3個孩子沒有確認。這3人中,有個男孩的比對結(jié)果很特殊。3次比對,排在相似度第一位的始終是同一個人。即便以肉眼看,這個男孩與被拐兒童的面部特征都很相似——甚至耳朵上一處非常特殊的標志。但奇怪的是,幾次DNA比對都不成功。

頭兩次,機器判斷:97、98分,第三次——100分。

警察們對這個結(jié)果感到困惑。他們調(diào)查過孩子親生父母生產(chǎn)時的狀況,那對夫妻是在鎮(zhèn)上一家診所生下的男孩,診所并不正規(guī),“都沒有留下出生記錄”。

研究員們的看法各不相同?!皺C器也有bad case?!崩畈┦空f,“所有的人工智能都不是百分之百正確,比如說它的識別能力就是95%,在一個千萬的集合里,有一兩個找不到,我覺得是在算法誤差內(nèi),很正常?!?/p>

曉程則相信機器比人坦誠,也比人可靠。從2009年開始從事人臉識別,過去10年的工作給他帶來的一個啟發(fā)是——“它的錯肯定是有理由的?!?/p>

這個世界上有太多巧合和錯亂的事情了,再強大的AI也解釋不了一切。

猜你喜歡
李博士專案組人臉識別
人臉識別 等
揭開人臉識別的神秘面紗
萬能的李博士
萬能的李博士
“神秘失蹤”專案組
趣味(語文)(2018年3期)2018-06-15 09:58:24
基于類獨立核稀疏表示的魯棒人臉識別
計算機工程(2015年8期)2015-07-03 12:19:07
中紀委打虎80年
基于K-L變換和平均近鄰法的人臉識別
你好,北極熊!
論美國專案偵查組織模式
茂名市| 新宾| 潜江市| 安西县| 张北县| 大渡口区| 融水| 亚东县| 夏津县| 巴彦淖尔市| 望奎县| 济源市| 祥云县| 交口县| 青州市| 华容县| 潞西市| 桃园市| 平谷区| 建平县| 卫辉市| 芜湖县| 台安县| 崇文区| 龙门县| 绥宁县| 北辰区| 墨脱县| 阿拉善右旗| 蓝田县| 庆元县| 巴彦淖尔市| 雷波县| 屏边| 石楼县| 韶关市| 尖扎县| 兖州市| 渝中区| 甘泉县| 原阳县|