沈曉衛(wèi)
(IBM中國(guó)研究院,北京 100085)
【觀點(diǎn)摘要】
具有洞察力的系統(tǒng)
傳統(tǒng)的IT系統(tǒng)是基于記錄的系統(tǒng),即數(shù)據(jù)都是結(jié)構(gòu)化的。過(guò)去幾十年,大多數(shù)的IT技術(shù)都是用于構(gòu)建一個(gè)基于記錄的系統(tǒng)。今天我們看到一種新形態(tài)的系統(tǒng),把它叫作基于互動(dòng)的系統(tǒng),這種互動(dòng)可能是與人的互動(dòng)(如社交媒體),也可能是與物理世界的互動(dòng)(如物聯(lián)網(wǎng)這樣的系統(tǒng))。在這里,大多數(shù)的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)。我們今天面臨的問(wèn)題,就是如何基于一個(gè)傳統(tǒng)的基于記錄的系統(tǒng)和一個(gè)新興的基于互動(dòng)的系統(tǒng)共同構(gòu)建一個(gè)具有洞察力的系統(tǒng)。IT系統(tǒng)最核心的價(jià)值之一就是從數(shù)據(jù)中產(chǎn)生洞察力,這種數(shù)據(jù)包括傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)和新興的非結(jié)構(gòu)化數(shù)據(jù),例如大量的多媒體數(shù)據(jù)。
認(rèn)知計(jì)算
大數(shù)據(jù)的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過(guò)傳統(tǒng)IT技術(shù)可以處理的范圍,因此如果沒(méi)有認(rèn)知計(jì)算,就幾乎無(wú)法解決大數(shù)據(jù)的問(wèn)題。也正是基于此,新的IT系統(tǒng)在做分析時(shí)需要一種自我學(xué)習(xí)能力。從宏觀角度來(lái)看,可以認(rèn)為今天的IT世界已經(jīng)開(kāi)始從傳統(tǒng)的基于編程的時(shí)代進(jìn)入認(rèn)知計(jì)算時(shí)代。在IBM研究院有一項(xiàng)重要的工作內(nèi)容叫“全球技術(shù)展望”,探討未來(lái)3~10年最重要的技術(shù)趨勢(shì)。從2012年開(kāi)始,每一年全球技術(shù)展望中都有同認(rèn)知計(jì)算相關(guān)的課題。我們認(rèn)為在未來(lái)幾年之內(nèi),如何構(gòu)建一個(gè)認(rèn)知計(jì)算的平臺(tái),如何做更好的基于對(duì)話(huà)和推理的具有實(shí)用性的系統(tǒng)等方面的研究可能有重大的突破。更長(zhǎng)期來(lái)看,如何做模擬人腦的計(jì)算,做具有邊緣計(jì)算這種特性的系統(tǒng),如何做量子計(jì)算,這些都屬于可能在未來(lái)有非常重大影響力的研究方向。
物聯(lián)網(wǎng)3.0
今天的物聯(lián)網(wǎng)已經(jīng)進(jìn)入到了3.0時(shí)代。物聯(lián)網(wǎng)3.0有兩個(gè)非常重要的特征:①方案從本地部署向云端推進(jìn)。未來(lái)物聯(lián)網(wǎng)的解決方案,應(yīng)該是從云端來(lái)提供部署,而不僅僅是在本地部署。②認(rèn)知計(jì)算會(huì)發(fā)揮非常重要的作用,同時(shí),物理模型會(huì)被用于描述物理世界。物聯(lián)網(wǎng)3.0非常重要的特征是“智能化”,從簡(jiǎn)單的數(shù)據(jù)采集推進(jìn)到深度數(shù)據(jù)分析,進(jìn)而產(chǎn)生可具有執(zhí)行力的洞察力。物聯(lián)網(wǎng)3.0能夠推動(dòng)產(chǎn)業(yè)轉(zhuǎn)型的兩個(gè)方面——云計(jì)算和深度智能化。在這個(gè)過(guò)程中,“認(rèn)知計(jì)算”是一個(gè)非常重要的技術(shù)手段。
IBM研究院關(guān)于認(rèn)知計(jì)算的探索性研究
1)Medical Sieve。需要Watson具備視覺(jué)能力。在醫(yī)療行業(yè)有非常多的多媒體數(shù)據(jù)需要理解,這個(gè)技術(shù)幫助過(guò)濾必要的臨床和影像診斷信息,形成總結(jié)和建議,大大減少臨床醫(yī)生觀看X射線(xiàn)、CT等醫(yī)學(xué)影像的工作量,可準(zhǔn)確定位可疑病癥。
2)Debater。需要認(rèn)知系統(tǒng)具備思辨能力?!跋蚯嗌倌赇N(xiāo)售暴力視頻游戲應(yīng)該被禁止”是一個(gè)論點(diǎn)。Debater需要在幾秒鐘內(nèi)大概瀏覽四百萬(wàn)篇文章。這四百萬(wàn)篇文章中大概有五億個(gè)語(yǔ)句,每一個(gè)語(yǔ)句又有很多種可能的理解。面對(duì)這樣的信息規(guī)模,需要排查出最多幾十條同這個(gè)觀點(diǎn)有關(guān)的論點(diǎn)。與此同時(shí),這個(gè)系統(tǒng)也可以提供反方的依據(jù)。
3)SyNAPSE。未來(lái)的認(rèn)知系統(tǒng)需要具有感知能力。與現(xiàn)有的馮諾依曼架構(gòu)的計(jì)算機(jī)系統(tǒng)不同,模擬人腦中神經(jīng)元的系統(tǒng)能夠?qū)崟r(shí)識(shí)別出用正常速度拍攝的路口視頻中的人、自行車(chē)、公交車(chē)、卡車(chē)等。這樣的信息處理與傳統(tǒng)的數(shù)據(jù)處理是不同的。
重慶理工大學(xué)學(xué)報(bào)(自然科學(xué))2015年10期