趙艷秋
當韓國棋王李世石向AlphaGo投子認輸之后,AlphaGo背后Deepmind團隊稱,攻克圍棋只是其第一步,他們將“用人工智能解決一切問題”,將進一步探索人工智能在醫(yī)療、機器人以及手機等多個領域的應用。
那么,人工智能目前在各行業(yè)中處于怎樣的一種成長狀態(tài)?人們在實踐中對其落地有怎樣的思考?人工智能會是解決一切問題的萬能鑰匙嗎?當我們談論人工智能時,我們在談些什么?
機器人都是跨界而來
在今年4月深圳英特爾技術峰會的展廳中,我恰好遇到一個“能識別和跟蹤人的機器人”演示。英特爾工作人員指給我看,他們這個圖像識別技術已用到他們與經綸世紀醫(yī)療網絡技術(北京)有限公司(簡稱“經綸世紀”)合作的“家庭健康管理和養(yǎng)老護理機器人”身上。
這個居家養(yǎng)老的“健康大白”能根據老人慢病史和日常測量的血壓、血糖等生命體征數據,提供每天的健康指導。
讓我感興趣的是,這些指導不是泛泛的信息,而是根據每個人的健康數據,通過人工智能計算出的一對一、量化的建議。機器人也能通過自身無線探測裝置,不用觸碰老人,就能監(jiān)控老人的心率、心跳和體溫,建立老人的長期動態(tài)健康檔案。一旦發(fā)現這些生命體征數據有異常,它會主動詢問:“你怎么樣了?需要幫助嗎?”在需要的情況下,它會自動連接遠端的醫(yī)護人員開展遠程視頻咨詢服務。如果察覺有緊急情況發(fā)生,如老人跌倒等,它能立刻報警。未來,它還要實現給老人喂藥等功能。
我把這個護理機器人的樣子放到了朋友圈中,朋友們反映熱烈。據說很快,這個機器人將在北大護理學院支持的一家養(yǎng)老護理中心開展試點,在有護理人員的場景中實踐和完善,之后進入家庭試點。根據計劃,它會在今年10月小批量上市,先發(fā)售500臺,明年規(guī)?;鲜?。
深圳之行后,在北京航醫(yī)大廈,我再次探訪了經綸世紀,與公司創(chuàng)始人、CEO余中博士進行了深入溝通。
這是一家由美國硅谷歸國博士團隊建立的高新技術企業(yè)。在過去六年中,專注于大數據技術及人工智能技術。它投入開發(fā)了基于大數據分析的智能健康技術平臺,如與中華醫(yī)學會全國健康管理示范基地200多家三甲醫(yī)院體檢中心合作開發(fā)常見慢病(非腫瘤類及腫瘤類疾?。╊A測和干預模型與服務系統(tǒng),與中國臨床腫瘤學會合作開發(fā)甲狀腺癌術后管理模型與服務系統(tǒng)。這些智能技術是把大數據分析與各種疾病治療管理臨床路徑、指南緊密結合的互聯(lián)網云平臺人工智能服務管理系統(tǒng)。
“沒有這些基于互聯(lián)網和云平臺的智能技術做支撐的健康服務機器人是走不遠的?!庇嘀胁┦空f,“實際上,機器人可看作一種提供智能醫(yī)療健康服務的更友好的交互終端。通過機器人,將建立智能健康管理與關懷服務從云到端的一體化系統(tǒng)與解決方案?!?/p>
目前,業(yè)界有很多企業(yè)投入醫(yī)療大數據與健康云的開發(fā)與項目拓展,但這些產品基本處于對數據的簡單收集和存儲階段,能深入思考如何把數據用起來的非常少。
余中博士認為,這是IT/大數據和醫(yī)學跨界結合非常難所致。在硅谷長期從事通信與計算機技術研究與應用的他,也在最初經歷了跨界學習的痛苦期。
大數據產業(yè)鏈條包括數據采集、清洗、分析及展現應用,其中難點環(huán)節(jié)是數據“清洗”。所謂數據“清洗”,是結合專業(yè)把所采集的數據進行標準化和結構化處理,為大數據分析提供數據準備。
而醫(yī)療數據清洗難的原因,部分是因為缺乏行業(yè)統(tǒng)一標準,不同數據格式的IT系統(tǒng)和醫(yī)療設備,產生的數據對同樣的檢測指標呈現不同的名稱和單位;更深層的原因是大量醫(yī)療數據一直以來就是非結構化的,如超聲、CT等影像數據都是語言文字描述性的結論。
經綸世紀創(chuàng)立了數字醫(yī)學的新模式。他們聯(lián)合醫(yī)學專家建立了一本規(guī)范化的數據庫“字典”,整理出各類關鍵字、各項檢測指標對應的醫(yī)學解釋和所代表的各種疾病及疾病風險可能性的集合。
比如,一張甲狀腺腫瘤彩超,會用腫瘤大小、左側右側、第幾區(qū)、清晰度等參數數值編碼,把結論標準化和結構化。而因為數據量的龐雜及處理大量數據的需要,經綸世紀開發(fā)了自然語言處理技術,對文字描述式的醫(yī)療記錄數據進行自動識別和轉化。
只有在數據清洗后,才能談數據的分析和智能應用。過去幾年,經綸世紀開發(fā)了十多種機器學習算法及智能健康服務物聯(lián)網系統(tǒng),例如,與中國臨床腫瘤學會甲狀腺專家委員會合作,建立評估癌癥術后復發(fā)風險及康復跟蹤治療管理的評估與干預模型。初始模型是基于專家提供的醫(yī)學理論及臨床指南,如癌癥復發(fā)最大的幾項危險因素及治療原則。之后再把大量患者診療及康復治療跟蹤數據引進來,開展大數據分析及模型優(yōu)化,建立個性化評估與干預模型,達到精準“量化已知”和“發(fā)現未知”的終極目標。
對于“量化已知”,現在系統(tǒng)可以針對患者的個性化數據動態(tài)生成評估與治療建議(檢測與用藥),醫(yī)生據此對患者提供個性化跟蹤治療措施,對癌癥復發(fā)風險高的患者加強跟蹤檢查,調整用藥。而對于“發(fā)現未知”這部分,要經過幾年時間的持續(xù)跟蹤服務與動態(tài)大數據采集,通過大數據分析,發(fā)現前所未知的疾病預后康復關聯(lián)關系,建立精準化癌癥康復管理模型與臨床管理路徑。
去年,英特爾推出大數據分析平臺TAP(Trusted Analytical Platform),使得經綸世紀能更快更好地開展大數據分析及建模。非常關鍵的是,TAP系統(tǒng)打通了靜態(tài)大數據建模和動態(tài)大數據模型校準的實時動態(tài)循環(huán)學習路徑。
以經綸世紀開發(fā)的針對亞健康、常見慢病的健康服務管理云平臺與APP為例,這些APP可在北京協(xié)和醫(yī)院等全國一些三甲醫(yī)院獲得,每天APP上反饋回來的數據,讓分析模型能夠持續(xù)學習和校準。
當全美頂級腫瘤專家、美國加州大學舊金山分校醫(yī)學院馬克·舒曼教授(Professor Marc Shuman)看到經綸世紀這套基于大數據分析、建立評估與干預模型、結合醫(yī)學服務臨床路徑的服務模式后,對余博士說:“我愿意參與并組織美國方面的專家團隊,與你們共同做這件極其有意義的事?!笔媛淌谡J為,經綸世紀所做的,不僅在中國,在全球范圍也是一個具有重大意義的人工智能精準醫(yī)療創(chuàng)新模式。
現在,余博士正在探索用這套新模式幫助解決老百姓看病難、看病貴的問題。他認為,必須建立一個“院前疾病預防管理、院中疾病診療、院后疾病康復跟蹤管理”的一體化醫(yī)療健康服務體系。特別是針對慢性疾病需要長期跟蹤,解決途徑一定是基于現有醫(yī)院醫(yī)療服務為基礎,提供一個由智能化技術支撐的、從醫(yī)院延伸到千家萬戶的醫(yī)療健康服務。最近,衛(wèi)計委相關部門找到余博士,研究智能化醫(yī)療技術與“十三五”計劃、健康中國戰(zhàn)略的結合途徑。
余博士認為,今年是十三五計劃的開局之年,也將是包括大數據、服務機器人等智能技術在醫(yī)療健康與關懷服務領域開始落地實用的元年。
“人工智能、機器人在許多方面比人強,但是并不能完全取代人來提供服務?!庇嗖┦空f。上世紀60年代開始,業(yè)界曾一度希望用人工智能(A1)來模擬人的思考,進而取代人的工作。但做著做著就遇到了瓶頸——人類對大腦的工作與認知的研究還遠遠不夠,怎么能用計算機來真正模擬人腦?
“今天我們在做的是具有實用意義的IA(Intelligence Augmentation,智能增強)。今天的機器人可以有巨大的計算能力、海量的知識存儲與記憶、快速的學習與決策能力,可以永不疲倦地工作?!庇嗖┦空f。經綸世紀與英特爾合作開發(fā)的智能服務機器人可以作為居家養(yǎng)老、開展醫(yī)養(yǎng)結合服務的家庭伴侶。同時,根據國家“十三五”計劃提出的“強基層、分級診療、雙向轉診”醫(yī)療改革發(fā)展戰(zhàn)略,也計劃將經綸世紀開發(fā)的機器人用于社區(qū)醫(yī)生的全科醫(yī)生助手。
從2C到2B
如果人工智能在一些老百姓看得見、摸得著的消費領域正在走向實用,那么它在企業(yè)級市場則剛剛起步。
最近,SCRM(社交化客戶關系管理)SaaS服務供應商六度人和的創(chuàng)始人兼CEO張星亮告訴我,今年他的工作目標之一是尋找人工智能領域的專業(yè)企業(yè)合作,從而實現更智能的SaaS服務。
“智能化是企業(yè)軟件的未來發(fā)展方向,消費領域的人工智能技術會逐步被引入企業(yè)級市場?!睆埿橇琳f。而他進一步解釋說,企業(yè)軟件的智能化趨勢與職場新生代有關。
以前,針對“聽話”的70后和80后,老板可以用管理軟件梳理企業(yè)流程,讓員工填寫數據,進而對企業(yè)進行管理。但現在,老板在90后面前再用老套的“我管你”的思路,可能就會遇到挫折。
“現在的企業(yè)軟件要換個思路,從‘管理轉化成‘賦能。它要從賦能角度讓員工實現更高的工作效率和業(yè)績?!睆埿橇琳f,“而賦能就需要智能技術?!?/p>
怎么在軟件中實現智能呢?六度人和從2009年就開始這方面的摸索,張星亮總結說,企業(yè)級軟件智能化要經歷兩個階段,即通過連接獲得數據,通過數據構建智能。
張星亮感嘆實現連接很不容易。恰巧騰訊是六度人和的股東,六度人和的SaaS服務能成為較早與QQ、微信實現連接的服務。它也通過自己開發(fā)的專利技術,實現與電話的連接。六度人和還經過長期積累,打通了與市場上幾乎所有郵件系統(tǒng)的連接。
之后,六度人和把客戶銷售人員在不同渠道,如QQ、微信、郵件、短信、座機、手機上的工作數據——文字聊天、語音、郵件都自動記錄到SaaS軟件中,存儲起來。
現在,有了這些數據,六度人和可以通過初步的建模分析,實現一些實時、淺層的智能,給銷售人員和管理者賦能。例如,六度人和有很多金融類客戶。金融行業(yè)每位銷售人員通常要維護一兩千客戶,以往,他們每天都要將上百個聯(lián)系過程憑記憶手工錄入到管理軟件中。但銷售人員錄入的數據都是感性的文字描述,不便于統(tǒng)計、分析和呈現,對企業(yè)管理的意義不大。但現在,SaaS服務能通過分析通話時長、QQ聊天頻次和關鍵字等,初步識別出意向客戶,并對意向客戶開展一些自動化的服務。
后河網就享受到了這樣的智能和自動化服務。后河網是一家互聯(lián)網金融服務企業(yè),在業(yè)務起步階段需要快速獲得一批高質量客戶的數據,他們靠電話銷售來篩選。在使用六度人和SaaS服務的過程中,一通電話打下來,后河網可以給客戶貼上9種不同的標簽,如“接通無效”、“投資意向不明確”、“有意向但有疑慮”等。其中,針對“有意向但有疑慮”的客戶,系統(tǒng)能自動發(fā)送短信,感謝客戶接聽了自己的電話;系統(tǒng)還能自動發(fā)送郵件,提供公司的介紹和一些方案,讓客戶有更多了解;最后,系統(tǒng)還能提醒銷售人員與客戶互加微信好友,保持持續(xù)溝通。
后河網的銷售主管在查看銷售人員電話錄音統(tǒng)計分析時,也能發(fā)現和解決一些問題。如發(fā)現一個銷售打的電話很多,但每個接通的時長都很短,就說明該銷售人員的話術可能有問題,需要給他提供優(yōu)秀話術的培訓。
由于這些初步的智能和自動化功能,后河網銷售人員由每天打100多個電話,提升到200多個。最終,9個銷售10天完成了330萬元的銷售業(yè)績。
張星亮感到,現在智能技術已經能真正為企業(yè)帶來價值,也有了口碑相傳的效應。
今年,張星亮也計劃把金融行業(yè)積累的智能化模型,擴展到更多模式接近的行業(yè)中,如教育、旅游、房地產和汽車等。
“做人工智能,企業(yè)自己首先要具備一定的數據收集能力。因為如果全部依賴大數據公司提供數據,在一定程度上,企業(yè)自己將沒有數據甄別能力?!睆埿橇琳f,這也是連接的價值和意義。
接下來,雖然軟件企業(yè)都有一定的智能化開發(fā)能力,但針對深層次的數據挖掘,如自然語言技術、客戶畫像等,張星亮認為還是要尋找專業(yè)領域的企業(yè)合作?,F在,國內已經有一批專業(yè)企業(yè)。而六度人和今年也計劃與專業(yè)語音識別企業(yè)合作,探索更深層次的智能。
小冰想干嘛
無論是2C還是2B,人工智能要想得到更大范圍、更深層次的發(fā)展,必然需要一些通用的智能技術,或者直白點說,就是“通吃型”的基礎性應用。
在我采訪微軟小冰前,曾做過小范圍調查,看看大家怎么看小冰。大部分人反饋說,這個能調侃的機器人似乎還沒有做什么,不知道微軟做“她”的用意。
對于這個疑問,微軟(亞洲)互聯(lián)網工程院資深總監(jiān)、小冰項目負責人李笛說,小冰所探索的,是用戶和機器人在任何話題上都能很自然地交流。過去,人們做機器人都有直接的目的,比如像大白一樣的私人健康顧問或者一個幫人訂餐的助手,這些都在垂直領域里。但如果今天你訂完餐,順便跟機器人說了聲“辛苦親了”,他就搞不定了,很快,你就不會再用這個機器人了,因為它沒有“通用”這一層。
“通用人工智能最基本的定義是能滿足人們混合對話的需求,這是非常關鍵的。”李笛說。仔細回想下,我們日常的對話不會始終圍繞一個特定任務。而當我們與一個機器人打交道后,很多時候,我們對它的情感需求比對完成一個任務的需求更大,這是我們經常忽略的。
現在,美國一些做特定領域機器人的企業(yè),也在研發(fā)和應用中發(fā)現,他們需要自然交互的基礎能力。如果沒有這樣的基礎能力,用戶很難與機器人產生黏性。
我認同李笛的這個理念。恰好在最近舉辦的一個互聯(lián)網大會上,一位機器人展臺的工作人員誠懇地告訴我,他們遇到了一個問題,兒童陪伴機器人拿回家沒兩天,就被小朋友丟到腦后了。原因是機器人不能真正與小朋友對上話,于是,小朋友很快就失去了興趣?,F在,這家企業(yè)開始改進機器人的對話能力,而由于這方面的改善,已把小朋友的使用時間每周提升了平均七八分鐘。
那么,我們如何做到“有溫度”的機器人呢?
李笛說,在微軟剛剛開始上線小冰的時候,提出了“情感計算框架”。過去,大家衡量機器人只用IQ,很少提到EQ?!拔覀兪堑谝粋€認為人工智能需要同時衡量EQ的企業(yè)”。現在,業(yè)界逐漸接受并開始往這個方向發(fā)展了。在這個“情感計算框架”中包含了理念、技術和一系列評價標準。
李笛常用一個“腳踝腫了”的案例來介紹小冰的情感認知能力。一位微軟同事將一張“腫了的腳踝”圖片發(fā)給小冰,小冰能把判斷決策焦點放在“腳踝腫了”上,還能用一種有情感的方式來表達,問他“這個傷得嚴重嗎?”
我也嘗試與小冰做了一些類似的溝通,有些成功,有些不成功。小冰仍在進化的路上。
李笛對我強調,人工智能要形成一個正循環(huán)——你要有技術,由技術形成產品,再通過產品與用戶的真正交互反過來推動技術,這是個三元自我循環(huán)過程。
去年8月,小冰針對微信公眾號上線了一個免費商業(yè)解決方案,任何一個第三方通過掃描二維碼,就可把公眾號的管理對話權交給小冰。小冰也與某電商企業(yè)合作,通過語義理解和大數據分析,為用戶提供選購參考。她在這些產品化過程中實現了三元自我正循環(huán)。
令李笛很自豪的是,過去兩年,小冰已進行了超過150億次對話,從過去訓練數據100%來自微軟搜索引擎,到現在每天有幾千萬用戶的主動交流,這加速了小冰的自我進化。
與目前人工智能企業(yè)的運作模式不同,小冰采用了類似蘋果的做法,提供一套封閉的標準體系,也就是小冰自然語言通用對話系統(tǒng)。各行各業(yè)的供應商可以加入到微軟小冰平臺上,而不是小冰提供一個API,由第三方調用。李笛說,這樣做,小冰將會有機會了解不同行業(yè)的應用場景,而不是那個應用場景輸入了小冰的技術。這個模式能確保用戶體會到比較完整的人工智能體驗的體驗和最終的體驗實現。
李笛透露,小冰會堅持做通用機器人,同時,在未來半年內,會實實在在推出一個垂直領域端到端的東西,幫助用戶把一件事情完成,而不僅僅是一個概念。
同時,小冰也一直在等待任何一個堅持想把某個領域人工智能技術做好的企業(yè),加入到小冰的平臺上。以前,很多機器人企業(yè)找過小冰,但李笛發(fā)現,這些產品的真實目的都是硬件出貨?!叭绻沁@樣的理念,我們就沒有辦法合作”。
現在,人工智能非?;馃幔袠I(yè)跟風、資本追逐。業(yè)內一些企業(yè)的心很大,給人以圈地的感覺。但李笛認為,如果不把通用基礎技術和縱深領域鉆研透,用戶是不會用的,到頭來,圈地運動最終將不攻自破。
超算大賽中的年輕人
人工智能技術也引發(fā)了硬件基礎架構行業(yè)的思考和行動。
4月底,在武漢舉辦的2016世界大學生超級計算機競賽(ASC16)總決賽上,我遇到了浙江大學參賽選手徐啟源。在大賽中,他和同學大膽采用了一種高性能異構加速方案,最終以每秒12.03萬億次浮點運算創(chuàng)造了新的世界紀錄。
徐啟源告訴我,人工智能是他和同隊同學未來的職業(yè)理想。小時候因為看了電影《黑客帝國》和小說《機器人三部曲》,徐啟源對機器人和人工智能產生了極大的興趣。從小學5年級開始,他接觸機器人編程,初中開始參加機器人比賽。進入大學后,他開始了解類腦計算。在學校中,徐啟源與醫(yī)學院的同學們一起做了有趣的案例。他們用最新的人工智能模式識別算法,去識別、理解小白鼠大腦的信號,然后在計算機上對小白鼠的行為進行控制。比如,在電腦上發(fā)一個信號讓小白鼠往左走,小白鼠就會走向左方。
因為類腦計算需要大量計算能力,徐啟源因而接觸到了高性能計算?!坝幸痪湓挘绻覀冏约耗苈斆鞯乩斫獾酱竽X的復雜,那么大腦就會復雜到使得我們無法理解。這才要借助計算機?!彼f。
超級計算機是計算機中功能最強、運算速度最快、存儲容量最大的一類計算機,原先多用于海羊模擬、材料科學、生命基因等高科技領域和尖端技術研究。最近幾年,這種計算平臺也開始進入機器學習、深度學習這些需要大量計算的領域。
在此次ASC16競賽題目中也首次引入人工智能和深度學習題目,這也增加了大賽對學生的吸引力。比賽總冠軍華中科技大學代表隊就針對基于深度學習的智能語音識別應用,設計了深度神經網絡優(yōu)化方案,對英文、中文普通話、四川方言三個語種共幾十萬條語音數據做了高準確度訓練模型,還將計算性能最高提升了108倍。
“大數據和高性能計算在相互融合,而且最后會結合到一起。”ASC競賽專家委員會主席、全球最快超級計算機排行榜Top500發(fā)起人、美國橡樹嶺國家實驗室及田納西大學教授Jack Dongarra對我說。他專門寫了一篇文章,講述大數據和高性能計算融合的趨勢。
“人工智能的研究方法,從過去的規(guī)則和推理,發(fā)展到現在的基于統(tǒng)計和大數據,是技術變化所推動的?!卞X德沛教授說,“從現在看,人工智能的應用,包括圖像識別等,都是在超算支持下進行的。我覺得大數據和超算確實要聯(lián)合在一起做?!?/p>
在產業(yè)界,人工智能最近的這波高潮是互聯(lián)網企業(yè)推動的,原先互聯(lián)網領域更傾向于用自己的一些工具和方法。浪潮集團副總裁胡雷鈞介紹說,最近兩年,互聯(lián)網企業(yè)發(fā)現,把原來高性能計算比較成熟的技術拿來,能快速提高水平。比如,把GPU或MIC技術引入人工智能領域后,能夠運行或訓練的人工智能網絡,規(guī)模比原先大很多。實際上,科大訊飛把原先的模型擴展到幾十幾倍,甚至達到上千倍。這樣,原來兩三個星期才能訓練一個模型,現在可能一兩天就能訓練出來。所以,今年以來,阿里、百度、科大訊飛、NVIDIA、英特爾、賽靈思、浪潮等產業(yè)鏈的合作非?;钴S。
目前,為了實現自己的人工智能夢,徐啟源制定了跨學科的學習計劃,包括超算、生命科學、數學理論,甚至文學和哲學。他說,這些對找到有效、快速的研究方法都有啟發(fā)性。
人工智能是萬能的嗎
雖然人工智能在一些行業(yè)實實在在地嶄露頭角,但它絕非無所不能,人們也并不需要過度想象。
在最近一個人工智能周末公開課上,積木盒子智能投顧項目負責人鄭毓棟談到人工智能在金融領域的應用?,F在,人工智能可以在資產配置上發(fā)揮作用,因為大類資產像股票、黃金有一定回歸性和周期性。例如,在經濟開始復蘇時,股市會先行;當經濟開始衰敗、通脹開始時,黃金價格會上升。由此,近幾年,美國智能投顧行業(yè)開展得相當蓬勃。此外,人工智能在市場數據收集、整理歸納、初級分析師工作上也發(fā)揮價值。
但人工智能在其他金融市場的應用目前還要打一個問號。例如,深度學習在公開市場,如股票模擬或預測上沒有特別成功的案例。
究其原因,金融市場非常復雜,影響市場的因素成千上萬,且變化極快。而人工智能算法本身有其缺陷性,如深度學習往往陷入一個局部最優(yōu)解,但金融市場往往需要全局性和趨勢性判斷。而且,深度學習擅長從大量數據中找到一個信號,但這個信號是偶然產生,還是因果關系,是目前機器還不能判斷的。比如在1983年到1990年7年間,斯里蘭卡黃油出口與美國股指高度相關,但不能證明兩者是因果關系。
而在今年某智能汽車大會上,華為中央研究院副院長袁庭球也提出一個問題:無人駕駛是不是一定要使用人工智能和深度學習技術?最近AlphaGo很熱,它的取勝是在確定了邊界和一定規(guī)則狀況下的取勝。同時,它失敗的一局也表明Al存在崩潰的可能性,但自動駕駛對概率性的崩潰是零容忍的。
袁庭球認為,業(yè)界可能要跳出擬人的誤區(qū),跳出概率性AI的思路,在商業(yè)或技術上做一些取舍和平衡,這個革命才會很快的爆發(fā)。