林琳
數(shù)據(jù)問(wèn)題是企業(yè)人工智能項(xiàng)目沒(méi)有達(dá)到預(yù)期目標(biāo)的主要原因。但是,如果企業(yè)能從錯(cuò)誤中吸取教訓(xùn)并長(zhǎng)期堅(jiān)持,那么在人工智能方面的努力將會(huì)得到回報(bào)。
18個(gè)月前,Cooper公司為其客戶(hù)服務(wù)代理商推出了智能推薦系統(tǒng),以便為客戶(hù)問(wèn)題提供解決方案。該公司前身為Nationstar公司,是美國(guó)最大的非銀行抵押貸款提供商,擁有380萬(wàn)客戶(hù),因此該項(xiàng)目被視為該公司一個(gè)令人關(guān)注的節(jié)省成本的項(xiàng)目。但公司首席信息官Sridhar Sharma說(shuō),該公司花費(fèi)9個(gè)月的時(shí)間才發(fā)現(xiàn)代理商沒(méi)有使用它,又花了6個(gè)月的時(shí)間來(lái)弄清楚原因。
Cooper公司陷入人工智能的困境并不是異?,F(xiàn)象。根據(jù)調(diào)研機(jī)構(gòu)IDC公司最近的一項(xiàng)調(diào)查,只有約30 %的受訪(fǎng)者表示其人工智能項(xiàng)目的成功率為90 %,大多數(shù)受訪(fǎng)者表示其失敗率為10 % ~ 49 %,而3 %的受訪(fǎng)者表示一半以上的人工智能項(xiàng)目已經(jīng)失敗。
超過(guò)四分之一的受訪(fǎng)者認(rèn)為,缺乏員工以及對(duì)人工智能技術(shù)具有不切實(shí)際的期望是面臨的主要挑戰(zhàn)。另有23 %的人表示他們的人工智能項(xiàng)目因?yàn)槿狈Ρ匾臄?shù)據(jù)而失敗。
Sharma說(shuō):“失敗的第一個(gè)征兆是有些人想退出這個(gè)項(xiàng)目。但如果這樣做,就注定要失敗?!?/p>
Cooper公司計(jì)劃2020年將重新回到客戶(hù)服務(wù)項(xiàng)目,作為其客戶(hù)關(guān)系管理(CRM)系統(tǒng)改革的一部分,企業(yè)將繼續(xù)致力于人工智能技術(shù)的開(kāi)發(fā)。其最新的機(jī)器學(xué)習(xí)項(xiàng)目涉及分析非結(jié)構(gòu)化數(shù)據(jù),已經(jīng)具有積極的商業(yè)價(jià)值,并有助于為未來(lái)創(chuàng)建更好的語(yǔ)言訓(xùn)練數(shù)據(jù)。他補(bǔ)充說(shuō),“這些措施的成本并不低,當(dāng)事情不順利時(shí),需要企業(yè)首席執(zhí)行官和首席財(cái)務(wù)官的支持。”
缺乏數(shù)據(jù)
數(shù)據(jù)問(wèn)題是人工智能項(xiàng)目達(dá)不到預(yù)期目標(biāo)的主要原因。根據(jù)麥肯錫公司2018年秋天發(fā)布的一份調(diào)查報(bào)告,限制人工智能技術(shù)應(yīng)用的兩大挑戰(zhàn)與數(shù)據(jù)有關(guān)。
首先,與Cooper公司一樣,許多公司很難獲得適當(dāng)標(biāo)記的數(shù)據(jù)來(lái)訓(xùn)練他們的機(jī)器學(xué)習(xí)算法。如果數(shù)據(jù)沒(méi)有正確分類(lèi),工作人員必須花費(fèi)大量時(shí)間做標(biāo)記,這可能會(huì)延遲項(xiàng)目或?qū)е马?xiàng)目失敗。第二個(gè)數(shù)據(jù)問(wèn)題是沒(méi)有項(xiàng)目的正確數(shù)據(jù)。
普華永道公司合伙人兼全球人工智能領(lǐng)導(dǎo)人Anand Rao表示,“企業(yè)通常沒(méi)有合適的數(shù)據(jù),如果無(wú)法使用未標(biāo)注的數(shù)據(jù)建立模型,就會(huì)感到沮喪。這就是企業(yè)實(shí)施人工智能項(xiàng)目一直失敗的地方。”
美國(guó)奧杜邦協(xié)會(huì)正在使用人工智能來(lái)幫助保護(hù)野生鳥(niǎo)類(lèi)。奧杜邦協(xié)會(huì)保護(hù)科學(xué)副總裁Chad Wilsey說(shuō),“如果我們不采取任何措施來(lái)減緩氣候變化的速度,那么42 %的草原鳥(niǎo)類(lèi)可能面臨滅絕,但如果我們能夠采取行動(dòng),那么可以將其比例降低到8 %?!?/p>
并非所有奧杜邦協(xié)會(huì)的人工智能項(xiàng)目都取得了成功。去年夏天,該組織試圖利用機(jī)器學(xué)習(xí)來(lái)計(jì)算海灘上的褐鵜鶘和剪嘴鷗的數(shù)量。該試點(diǎn)項(xiàng)目基于一組志愿者收集的圖像,這些志愿者通過(guò)無(wú)人機(jī)在德克薩斯州海岸附近的一個(gè)島上進(jìn)行調(diào)查。Wilsey說(shuō),“我們有興趣了解通過(guò)的颶風(fēng)如何影響鳥(niǎo)類(lèi)種群?!崩?,大多數(shù)可用的鳥(niǎo)類(lèi)圖片都是由地面上的工作人員拍攝的,而不是無(wú)人機(jī)直接拍攝。Wilsey說(shuō),由于這是一項(xiàng)試點(diǎn)研究,奧杜邦協(xié)會(huì)沒(méi)有資源拍攝更多的照片。
訓(xùn)練數(shù)據(jù)偏差
另一個(gè)人工智能項(xiàng)目因缺乏數(shù)據(jù)而受阻的例子是弗里茨實(shí)驗(yàn)室試圖創(chuàng)建一個(gè)模型來(lái)識(shí)別照片中人們的頭發(fā)。弗里茨實(shí)驗(yàn)室?guī)椭苿?dòng)開(kāi)發(fā)者構(gòu)建可以直接在手機(jī)上運(yùn)行的人工智能模型,而無(wú)需將數(shù)據(jù)發(fā)送回中央服務(wù)器進(jìn)行處理。
該公司首席技術(shù)官Jameson Toole說(shuō),“我們希望建立一個(gè)能夠在實(shí)時(shí)視頻中檢測(cè)頭發(fā)并實(shí)時(shí)改變顏色的功能。”
他說(shuō),起初一切看起來(lái)都很好,但算法中存在一個(gè)重大缺陷,如果系統(tǒng)公開(kāi)上市的話(huà),其問(wèn)題會(huì)非常嚴(yán)重。
Toole說(shuō),“值得慶幸的是,我們?cè)谵k公室和我們招募的人員之間進(jìn)行了大量的人工測(cè)試,我們意識(shí)到對(duì)于某些人群來(lái)說(shuō),這并不是一件好事,我們重新篩選了數(shù)據(jù)集,以確定數(shù)據(jù)集中沒(méi)有人是這些人群的一部分?!?/p>
他說(shuō),有很多圖像數(shù)據(jù)集可供訓(xùn)練,包括免費(fèi)的和商業(yè)的數(shù)據(jù)集。但是企業(yè)必須檢查是否有他們需要的特定類(lèi)型的足夠數(shù)據(jù)。他說(shuō):“企業(yè)首先要花費(fèi)一定的時(shí)間,努力構(gòu)建自己的代表用戶(hù)群的測(cè)試用例?!?/p>
根據(jù)普華永道公司最近的一項(xiàng)調(diào)查,一半以上的公司沒(méi)有評(píng)估人工智能偏見(jiàn)的正式流程。更糟糕的是,只有25 %的受訪(fǎng)者表示他們會(huì)在實(shí)施之前優(yōu)先考慮人工智能解決方案的道德含義。
數(shù)據(jù)集成問(wèn)題
有時(shí),問(wèn)題不在于缺乏數(shù)據(jù),而在于數(shù)據(jù)太多。普華永道公司零售業(yè)務(wù)方面的人工智能和數(shù)據(jù)常務(wù)董事表示,一家全球性大型銀行就面臨這種情況。他表示,如果能夠回到過(guò)去,這家銀行就會(huì)更早地開(kāi)始將不同的數(shù)據(jù)渠道匯集在一起。他說(shuō),“這是我們沒(méi)有做的事情,這是一個(gè)很大的錯(cuò)誤。我們收集了數(shù)據(jù),其結(jié)果是我們沒(méi)有獲得完全的、全方位的客戶(hù)視圖。”
他補(bǔ)充說(shuō),該數(shù)據(jù)整合問(wèn)題損害了這家銀行創(chuàng)建有效營(yíng)銷(xiāo)信息的能力,導(dǎo)致收入損失,該銀行現(xiàn)在正轉(zhuǎn)向多渠道客戶(hù)數(shù)據(jù)視圖,包括在線(xiàn)、移動(dòng)和面對(duì)面互動(dòng)。
他說(shuō),“孤立的數(shù)據(jù)是我們擁有并仍然存在的最大挑戰(zhàn)之一,這個(gè)挑戰(zhàn)不是技術(shù)問(wèn)題,而是商業(yè)問(wèn)題,第一個(gè)問(wèn)題是合規(guī)性,我們不允許混合某些類(lèi)型的數(shù)據(jù);另一個(gè)問(wèn)題與企業(yè)優(yōu)先事項(xiàng)有關(guān),還有很多其他項(xiàng)目正在運(yùn)行,誰(shuí)會(huì)為將數(shù)據(jù)混雜一起而支付費(fèi)用?這本身并不是銀行的增值業(yè)務(wù),這是每個(gè)銀行都必須面對(duì)的挑戰(zhàn)?!?/p>
他說(shuō),“如果再次開(kāi)展這個(gè)項(xiàng)目,應(yīng)該在銀行首次開(kāi)始處理人工智能用例時(shí)啟動(dòng)數(shù)據(jù)集成過(guò)程。我不認(rèn)為真的會(huì)做到這一點(diǎn),因?yàn)橛刑嗟臄?shù)據(jù)來(lái)源,并不可能都完全完成?!?/p>
他表示,該銀行預(yù)計(jì)在未來(lái)18~24個(gè)月內(nèi)將連接其主要數(shù)據(jù)源,現(xiàn)在該銀行只連接了10 % ~15 %。
數(shù)據(jù)漂移
人工智能項(xiàng)目面臨的另一個(gè)問(wèn)題是企業(yè)依賴(lài)歷史數(shù)據(jù)而不是活動(dòng)交易數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練。埃森哲公司董事總經(jīng)理安德里Andreas Braun表示,許多情況下,在轉(zhuǎn)換為實(shí)時(shí)數(shù)據(jù)時(shí),對(duì)單個(gè)靜態(tài)歷史快照進(jìn)行過(guò)培訓(xùn)的系統(tǒng)表現(xiàn)都不佳。
埃森哲公司負(fù)責(zé)歐洲數(shù)據(jù)和人工智能業(yè)務(wù)的Braun說(shuō),“企業(yè)可以卸載一些數(shù)據(jù),訓(xùn)練一些模型,并在實(shí)驗(yàn)室中獲得相當(dāng)好的模型提升,可是一旦把它重新融入組織,就會(huì)開(kāi)始出現(xiàn)問(wèn)題?!?/p>
歷史數(shù)據(jù)樣本和通過(guò)實(shí)時(shí)系統(tǒng)傳輸?shù)臄?shù)據(jù)之間可能存在顯著差異,例如,實(shí)時(shí)檢測(cè)欺詐或發(fā)現(xiàn)洗錢(qián)行為,因?yàn)檫@些模型沒(méi)有經(jīng)過(guò)訓(xùn)練,無(wú)法識(shí)別其行為的微小變化。
他說(shuō):“如果某個(gè)用戶(hù)在某個(gè)時(shí)間點(diǎn)(可能是晚上、周六或周日)復(fù)制數(shù)據(jù),那么這種情況將會(huì)凍結(jié)數(shù)據(jù)。實(shí)驗(yàn)室的分析非常容易,但是,當(dāng)機(jī)器學(xué)習(xí)模型重新融入到實(shí)時(shí)系統(tǒng)中時(shí),其情況會(huì)變?cè)??!?/p>
未經(jīng)處理的非結(jié)構(gòu)化數(shù)據(jù)
根據(jù)咨詢(xún)機(jī)構(gòu)德勤公司最近的一項(xiàng)調(diào)查,62 %公司處理非結(jié)構(gòu)化數(shù)據(jù)仍然依賴(lài)電子表格,只有18 %的公司在分析工作中利用了產(chǎn)品圖片、客戶(hù)音頻文件或社交媒體評(píng)論等非結(jié)構(gòu)化數(shù)據(jù)。
此外,德勤公司零售和消費(fèi)產(chǎn)品戰(zhàn)略和分析實(shí)踐負(fù)責(zé)人Ben Stiller表示,該公司收集的大量歷史數(shù)據(jù)缺乏對(duì)人工智能有用的背景,或者以摘要形式存儲(chǔ)。“數(shù)據(jù)限制當(dāng)然可以從一開(kāi)始就為失敗做好準(zhǔn)備?!彼f(shuō)。
Stiller說(shuō):“根據(jù)調(diào)查顯示,像Cooper這樣利用非結(jié)構(gòu)化數(shù)據(jù)的公司,其業(yè)務(wù)超出業(yè)務(wù)目標(biāo)的可能性要高出24 %。這真的需要企業(yè)對(duì)數(shù)據(jù)的看法發(fā)生根本性的轉(zhuǎn)變?!?/p>
例如,Cooper公司以大約15億個(gè)客戶(hù)文檔的形式擁有大量非結(jié)構(gòu)化數(shù)據(jù)。因此,客戶(hù)服務(wù)代理會(huì)花費(fèi)很多時(shí)間查找?guī)椭蛻?hù)所需的文檔,有時(shí)還需要與客戶(hù)溝通回訪(fǎng)。
因此,該公司使用機(jī)器學(xué)習(xí)技術(shù)掃描了所有15億份文件,并仔細(xì)分析了第一批1.5億份文件,這些文件屬于200種最常用的文件。
Cooper公司的Sharma說(shuō),“現(xiàn)在我們有一個(gè)機(jī)器學(xué)習(xí)項(xiàng)目,并且?guī)?lái)了價(jià)值,現(xiàn)在正在實(shí)施中?!?/p>
當(dāng)企業(yè)重返以前問(wèn)題纏身的人工智能客戶(hù)服務(wù)項(xiàng)目時(shí),除了加快客戶(hù)服務(wù)呼叫的速度,文檔分析還幫助創(chuàng)建一個(gè)更好的語(yǔ)言字典,供將來(lái)使用。
文化挑戰(zhàn)
除了數(shù)據(jù)外,組織問(wèn)題對(duì)人工智能的成功提出了重大挑戰(zhàn)。Sharma說(shuō),如果回到過(guò)去,會(huì)專(zhuān)注于客戶(hù)在詳細(xì)解決問(wèn)題時(shí)使用的語(yǔ)言,并讓主題專(zhuān)家與人工智能開(kāi)發(fā)人員配合工作。
Sharma說(shuō),“必須讓客戶(hù)與我們的技術(shù)團(tuán)隊(duì)一起合作,這樣的場(chǎng)景始終是最重要的,必須讓他們一起共事,并使其成為一份全職工作?!?/p>
除非企業(yè)能從這些錯(cuò)誤中吸取教訓(xùn),否則實(shí)現(xiàn)人工智能承諾的機(jī)會(huì)可能會(huì)減少,因?yàn)槭〉娜斯ぶ悄茼?xiàng)目可能會(huì)讓投資團(tuán)隊(duì)不再提供融資,并可能對(duì)員工和客戶(hù)滿(mǎn)意度產(chǎn)生負(fù)面影響。
Stiller說(shuō):“人工智能的早期失敗項(xiàng)目可能會(huì)讓執(zhí)行團(tuán)隊(duì)放棄在這個(gè)領(lǐng)域的重大投資,這有可能導(dǎo)致企業(yè)落后于競(jìng)爭(zhēng)對(duì)手?!?/p>
這一切都從企業(yè)管理層開(kāi)始。正如德勤公司的調(diào)查顯示,企業(yè)高層對(duì)于人工智能項(xiàng)目的支持至關(guān)重要。Stiller說(shuō):“如果企業(yè)首席執(zhí)行官提供支持,那么其業(yè)務(wù)目標(biāo)的成功率可能會(huì)超過(guò)77 %?!?/p>
因此,不要讓挫折破壞企業(yè)對(duì)人工智能組織的承諾,因?yàn)槿斯ぶ悄軙?huì)得到長(zhǎng)期的回報(bào),他說(shuō):“隨著時(shí)間的推移,企業(yè)實(shí)施的項(xiàng)目越多,投資回報(bào)率就會(huì)越高?!?/p>