国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

控制人工智能?你也可以

2016-12-14 16:54:30王杰夫
第一財(cái)經(jīng) 2016年47期
關(guān)鍵詞:先知范式百度

王杰夫

康執(zhí)璽用鼠標(biāo)從屏幕邊上拖來(lái)一些長(zhǎng)方形的模塊,并把它們用線依次連接起來(lái),一個(gè)人工智能機(jī)器學(xué)習(xí)的模型就做好了,前后用了不到一刻鐘。根據(jù)模型初始數(shù)據(jù)的不同,這個(gè)模型可以有不同的功能,例如識(shí)別信用卡詐騙,或是檢測(cè)垃圾郵件。

“如果沒(méi)有先知平臺(tái),搭建一個(gè)識(shí)別信用卡詐騙模型可能需要花費(fèi)數(shù)據(jù)團(tuán)隊(duì)幾個(gè)月的時(shí)間,”康執(zhí)璽告訴《第一財(cái)經(jīng)周刊》,“普通技術(shù)員工經(jīng)過(guò)一個(gè)月的訓(xùn)練,差不多能熟練使用先知平臺(tái)上的模型。”康執(zhí)璽是第四范式先知平臺(tái)的產(chǎn)品負(fù)責(zé)人,為了讓普通技術(shù)人員也可以輕松搭建機(jī)器學(xué)習(xí)模型,他和團(tuán)隊(duì)已經(jīng)不間斷工作了一年之久。

第四范式是一個(gè)提供AI機(jī)器學(xué)習(xí)模型的通用型平臺(tái)。該公司的算法工程團(tuán)隊(duì)開發(fā)了一系列的基礎(chǔ)設(shè)施組件,以此組成了大規(guī)模分布式機(jī)器學(xué)習(xí)框架(General Distributed Brain Technology,GDBT)??祱?zhí)璽稱,未來(lái)兩年,普通技術(shù)人員可以在“先知平臺(tái)”上做出類似AlphaGo復(fù)雜度的人工智能,“這里面的難點(diǎn)不是AlphaGo本身,難點(diǎn)是如何讓普通人也可以做出AlphaGo”。

目前市面上比較流行的計(jì)算框架,例如Hadoop、Sparkd更適合執(zhí)行傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)(ETL)任務(wù)。而第四范式“先知平臺(tái)”的框架由C++語(yǔ)言編寫,可以在單機(jī)、MPI、Yarn、Mesos等多個(gè)分布式環(huán)境運(yùn)行,例如很多企業(yè)在計(jì)算時(shí)所用的硬件資源并不相同,GDBT可以針對(duì)不同的硬件資源、不同的算法場(chǎng)景,就調(diào)度、計(jì)算模式、機(jī)器學(xué)習(xí)算法部件的抽象等做優(yōu)化。

成立兩年多來(lái),第四范式相繼拿到紅杉資本和創(chuàng)新工場(chǎng)數(shù)千萬(wàn)元人民幣的天使輪和A輪融資。雖然還沒(méi)實(shí)現(xiàn)自負(fù)盈虧,但是創(chuàng)始人戴文淵稱,公司已經(jīng)開始有了營(yíng)收。

AI for Everyone,這既是第四范式的公司目標(biāo),也是戴文淵2014年決定從華為諾亞方舟實(shí)驗(yàn)室離職創(chuàng)業(yè)的原因。在這之前,他最常問(wèn)自己的問(wèn)題是“人工智能要?jiǎng)?chuàng)造更大的價(jià)值,要通過(guò)什么方式去做”。

過(guò)去十幾年,人工智能在學(xué)術(shù)領(lǐng)域一直處于發(fā)展瓶頸期。直到2007年左右,還在讀碩士的戴文淵和一些同行感覺(jué)到機(jī)器學(xué)習(xí)在理論上取得了很大進(jìn)展,這時(shí)候就需要海量數(shù)據(jù)來(lái)推動(dòng)人工智能的發(fā)展。戴文淵認(rèn)為,這個(gè)機(jī)會(huì)很可能發(fā)生在互聯(lián)網(wǎng)公司,于是2009年他進(jìn)入百度工作,參與搭建百度鳳巢。這是一個(gè)全新的廣告銷售系統(tǒng),百度鳳巢系統(tǒng)背后的人工智能需要識(shí)別信息、廣告,以及智能地匹配不同的權(quán)重因素。

作為百度鳳巢的總架構(gòu)師,戴文淵需要當(dāng)一個(gè)全才—不只要懂機(jī)器學(xué)習(xí)的原理,還要精通數(shù)學(xué)統(tǒng)計(jì)、編程、分布式計(jì)算,以及要有很強(qiáng)的架構(gòu)能力?!安粌H要設(shè)計(jì)算法,還要懂業(yè)務(wù)”,戴文淵為此專門用半年的時(shí)間學(xué)習(xí)網(wǎng)絡(luò)營(yíng)銷,只有這樣才能明白人工智能可以應(yīng)用在哪些方面。百度鳳巢用了三四百人,花了三四年才做出來(lái),投入的成本之大,甚至影響到了百度公司的業(yè)績(jī),為此李彥宏還出面向股東做過(guò)解釋。不過(guò),如今百度鳳巢已經(jīng)成為拉動(dòng)百度利潤(rùn)增長(zhǎng)的核心,人工智能終于有了產(chǎn)業(yè)效果。

對(duì)于戴文淵來(lái)說(shuō),百度鳳巢的成功意味著AI for Someone已經(jīng)實(shí)現(xiàn),更關(guān)鍵的是,他從中看到了AI for Everyone的機(jī)會(huì)。但是讓人工智能服務(wù)每個(gè)技術(shù)人員的目標(biāo)還有重重困難,當(dāng)前,絕大多數(shù)的AI技術(shù)都集中在Google、Facebook、百度等互聯(lián)網(wǎng)公司巨頭手中,作為商業(yè)公司的它們不可能將AI核心技術(shù)完全開放出來(lái)。比如Google,雖然開源了深度學(xué)習(xí)系統(tǒng)TensorFlow,但是這套系統(tǒng)上手難度高,另一方面,與Google自家的服務(wù)深度綁定,對(duì)于不想依附Google的中小企業(yè)并不友好。

因此戴文淵認(rèn)為,與其等待大公司的“施舍”,不如做一家人工智能的企業(yè)服務(wù)公司,專門為那些養(yǎng)不起大型AI團(tuán)隊(duì)的公司提供AI服務(wù)。

在構(gòu)建百度鳳巢時(shí),戴文淵開始嘗試簡(jiǎn)化搭建機(jī)器學(xué)習(xí)模型的工程。工作之余,他動(dòng)手寫了一堆機(jī)器學(xué)習(xí)的組件,并找來(lái)一個(gè)實(shí)習(xí)生,讓后者通過(guò)這些機(jī)器學(xué)習(xí)組件搭建一個(gè)全新的模型。短短一個(gè)月,這名實(shí)習(xí)生做出了一個(gè)機(jī)器學(xué)習(xí)的模型。這個(gè)結(jié)果讓戴文淵很振奮,如果一個(gè)實(shí)習(xí)生一個(gè)月就能做出來(lái)一個(gè)機(jī)器學(xué)習(xí)模型,那招來(lái)10個(gè)實(shí)習(xí)生,經(jīng)過(guò)培訓(xùn),一年就能服務(wù)120個(gè)客戶。事實(shí)上,這也成為第四范式最初的運(yùn)作模式。

然而這種模式很快就遇到了問(wèn)題。首先是人才的短缺,戴文淵意識(shí)到這相當(dāng)于把人工智能公司做成勞動(dòng)密集型公司,但人工智能的人才資源嚴(yán)重不足。另一方面,由于出售的產(chǎn)品是一套機(jī)器學(xué)習(xí)的模型,買家只能使用卻無(wú)法修改,一旦出了問(wèn)題或者遇到需要調(diào)整的地方,還需要第四范式再次提供服務(wù)。

因此在最初階段,金融客戶只愿意把一些非核心的的項(xiàng)目外包給第四范式。對(duì)于大型金融機(jī)構(gòu)來(lái)說(shuō),風(fēng)險(xiǎn)控制是業(yè)務(wù)核心,交給第三方公司去做相當(dāng)于命脈交到其他人手里,這是它們無(wú)法接受的。

了解到實(shí)際的客戶需求后,戴文淵意識(shí)到第四范式還是要做一個(gè)通用型平臺(tái),“就像在賣建造機(jī)器學(xué)習(xí)模型的釘子和錘子”。在這種模式下,第四范式只負(fù)責(zé)提供機(jī)器學(xué)習(xí)的工具,工具用來(lái)做什么就與他們無(wú)關(guān)了。一個(gè)金融機(jī)構(gòu)購(gòu)買先知平臺(tái)后開發(fā)了十幾套機(jī)器學(xué)習(xí)模型,至于有沒(méi)有用來(lái)開發(fā)風(fēng)控模型這些核心產(chǎn)品,“這就是商業(yè)機(jī)密了,我們也不清楚”,戴文淵說(shuō)。

雖然看起來(lái)產(chǎn)品形態(tài)更加簡(jiǎn)單了,開發(fā)難度反而比之前大了好幾倍。從產(chǎn)品上看,釘子和錘子因?yàn)橐o普通人用,所以耐用性要好,比如對(duì)于建模時(shí)所輸入的數(shù)據(jù)不能挑剔,即使數(shù)據(jù)有空缺、格式不對(duì),也不可以宕機(jī)。從內(nèi)核上看,考慮到工具將來(lái)的迭代發(fā)展,底層代碼要從頭開始寫,原來(lái)戴文淵在百度鳳巢時(shí)寫的組件不夠用了。

在這之后,第四范式的算法工程團(tuán)隊(duì)開發(fā)了一系列基礎(chǔ)設(shè)施組件,逐步搭建了一套大規(guī)模分布式機(jī)器學(xué)習(xí)框架GDBT?,F(xiàn)在,先知平臺(tái)已經(jīng)開發(fā)出2.0版本,無(wú)論建模還是評(píng)估,只要從應(yīng)用左側(cè)拖動(dòng)相應(yīng)的組件并連接,就能完成計(jì)算,而且每套先知平臺(tái)都可以像Office工具一樣反復(fù)使用。不過(guò),與傳統(tǒng)企業(yè)工具的銷售模式不同,不同版本的先知平臺(tái)根據(jù)所能調(diào)用的運(yùn)算核心來(lái)定價(jià),售價(jià)越高,所能調(diào)用的核心越多,建模時(shí)的數(shù)據(jù)處理能力也就越強(qiáng)。

金融業(yè)也是最符合人工智能應(yīng)用場(chǎng)景的領(lǐng)域。人工智能第一波商業(yè)化應(yīng)用就在華爾街的高頻交易上。戴文淵稱,全國(guó)性的股份制商業(yè)銀行已購(gòu)買先知平臺(tái)。據(jù)第四范式提供的數(shù)據(jù),某家股份制商業(yè)銀行基于先知平臺(tái)搭建的交易分期服務(wù),40天內(nèi)交易分期的響應(yīng)率提升了68%。11月初結(jié)束的第三屆世界互聯(lián)網(wǎng)大會(huì)上,第四范式公布了先知平臺(tái)的公有云版本,戴文淵也離他設(shè)想的AI for Everyone更近了一步。目前,先知平臺(tái)業(yè)務(wù)的主要拓展方向仍然集中在金融領(lǐng)域。戴文淵表示,選擇金融作為切入口的直接原因就是數(shù)據(jù),一般來(lái)講,傳統(tǒng)企業(yè)比較忽視數(shù)據(jù)積累,而金融業(yè)的優(yōu)勢(shì)在于業(yè)務(wù)數(shù)據(jù)保存得很完整。對(duì)于機(jī)器學(xué)習(xí)模型來(lái)說(shuō),原始數(shù)據(jù)質(zhì)量越高、數(shù)量越大,建造出的模型就越好。

猜你喜歡
先知范式百度
以寫促讀:構(gòu)建群文閱讀教學(xué)范式
甘肅教育(2021年10期)2021-11-02 06:14:08
范式空白:《莫失莫忘》的否定之維
春江水暖鴨先知
Robust adaptive UKF based on SVR for inertial based integrated navigation
孫惠芬鄉(xiāng)土寫作批評(píng)的六個(gè)范式
管窺西方“詩(shī)辯”發(fā)展史的四次范式轉(zhuǎn)換
百度年度熱搜榜
我不是什么先知
延河(2017年7期)2017-07-19 20:52:04
春天的小先知(外兩首)
百度遭投行下調(diào)評(píng)級(jí)
锡林郭勒盟| 东兰县| 济源市| 安宁市| 威远县| 井冈山市| 柳河县| 玉林市| 洪泽县| 十堰市| 嘉义县| 沁水县| 潍坊市| 玉林市| 华亭县| 奈曼旗| 通辽市| 赤城县| 张家口市| 华坪县| 晋江市| 故城县| 达尔| 资中县| 辉县市| 青田县| 抚宁县| 策勒县| 汝南县| 同德县| 海丰县| 北辰区| 来凤县| 麦盖提县| 龙川县| 洛扎县| 永年县| 徐水县| 石屏县| 扶绥县| 依安县|