国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能開源平臺發(fā)展態(tài)勢研究

2018-08-22 02:20:26
信息通信技術(shù)與政策 2018年8期
關(guān)鍵詞:開源深度人工智能

陳 絲 中國信息通信研究院信息化與工業(yè)化融合研究所助理工程師

1 引言

近年來,人工智能成為全球信息領域產(chǎn)業(yè)競爭的新一輪焦點,對促進技術(shù)進步、推動產(chǎn)業(yè)升級、實現(xiàn)社會發(fā)展的重要性愈發(fā)顯現(xiàn)。從產(chǎn)業(yè)角度講,開源平臺占據(jù)人工智能產(chǎn)業(yè)生態(tài)的核心地位,具有統(tǒng)領產(chǎn)業(yè)進步節(jié)奏、帶動終端場景與云端服務協(xié)同發(fā)展的重要作用,處于承上啟下的關(guān)鍵地位,其意義媲美移動互聯(lián)網(wǎng)操作系統(tǒng)。我國應密切關(guān)注開源平臺發(fā)展,促進開源平臺與產(chǎn)業(yè)布局的雙重提升,構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢。

2 產(chǎn)業(yè)總體發(fā)展態(tài)勢

2.1 發(fā)展歷程

(1)2016年人工智能產(chǎn)業(yè)爆發(fā)——“發(fā)展元年”

人工智能歷經(jīng)3次發(fā)展浪潮,目前正在進入第四次浪潮。

第一次浪潮是在20世紀50年代,即計算智能時代,以1956年達特茅斯會議首次提出人工智能概念為標志,該階段重視邏輯忽略知識。由于機器翻譯的失敗,人工智能跌入低谷。

第二次浪潮發(fā)生在20世紀70年代,即感知智能時代,以1965年第一個專家系統(tǒng)誕生為標志,該階段重視知識,但學習能力不足。由于專家系統(tǒng)應用效果不佳,人工智能再次陷入低谷。

第三次浪潮發(fā)生在20世紀80年代,即認知智能時代,以1986年BP神經(jīng)網(wǎng)絡算法提出為標志,具備自主學習能力。但由于計算能力不足,人工智能又陷入低谷。

當前,人工智能進入第四次浪潮,以2006年Hitton提出深度學習理論為標志。2016年3月,A lphaGo以4:1戰(zhàn)勝世界傳奇選手李世石九段,人工智能在圍棋領域的水平超過人類,該事件成為人工智能應用的里程碑事件。互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等技術(shù)的發(fā)展,GPU、芯片、軟件計算能力的提升,深度學習算法的不斷進步和資本的大批進入,都促進了人工智能進一步發(fā)展,但整體來看人工智能技術(shù)仍處在較為初級的發(fā)展階段。

(2)2017年開源平臺成為人工智能產(chǎn)業(yè)的戰(zhàn)略制高點

2017年,人工智能產(chǎn)業(yè)快速發(fā)展,芯片、數(shù)據(jù)、開源平臺、算法、應用是人工智能產(chǎn)業(yè)生態(tài)的五大關(guān)鍵要素。從產(chǎn)業(yè)角度講,開源平臺更是產(chǎn)業(yè)要素重中之重。開源開放平臺能夠提供人工智能基礎算法的底層架構(gòu)和接口,具有統(tǒng)領產(chǎn)業(yè)進步節(jié)奏、帶動終端場景與云端服務協(xié)同發(fā)展的核心作用,占據(jù)承上啟下的關(guān)鍵地位,具有媲美移動互聯(lián)網(wǎng)操作系統(tǒng)的意義。在移動互聯(lián)網(wǎng)時代,Android系統(tǒng)通過GMS與下游云服務松耦合,通過版本控制與上游芯片、整機廠商緊耦合,實現(xiàn)以Android系統(tǒng)為核心的移動互聯(lián)網(wǎng)閉環(huán)。以Google開源平臺TensorFlow為例,其與機器學習算法緊密相關(guān),體現(xiàn)出平臺能力和應用性能,TensorFlow向上與谷歌云緊密綁定,以云平臺模式提供云機器學習服務,向下與芯片和硬件廠商緊密耦合做定制優(yōu)化,谷歌TPU專用于TensorFlow。

2.2 全球發(fā)展態(tài)勢

(1)國際巨頭企業(yè)競相布局人工智能開源平臺,意圖占領產(chǎn)業(yè)制高點

人工智能國際企業(yè)均在開源其人工智能平臺,意圖加快掌握技術(shù)產(chǎn)業(yè)組織的主動權(quán),占領客戶、應用和數(shù)據(jù)資源,逐步建立新的產(chǎn)業(yè)格局和技術(shù)標準。

2015年11月9日,Google發(fā)布深度學習框架TensorFlow并宣布開源,迅速得到廣泛關(guān)注,在圖形分類、音頻處理、推薦系統(tǒng)和自然語言處理等場景下都被大面積推廣,由于開源算法和模型最豐富,吸引了ARM、京東等大批合作伙伴,是GitHub最受歡迎的機器學習開源項目。2015年5月,F(xiàn)acebook正式宣布開源深度學習框架Caffe,Caffe是一種經(jīng)典的圖形領域框架,使用簡單,也是第一個主流工業(yè)級深度學習工具。2016年1月25日,微軟開源其深度學習與人工智能領域研究成果 Computational Network Toolkit(CNTK),CNTK在語音和圖像辨識能力方面,比Google的Tensor等4個開發(fā)者常用的Toolkit有更快的運算速度,支持自動調(diào)參功能,應用在Skype、微軟小冰、必應搜索、Xbox商用開發(fā)等場景。2015年9月,亞馬遜開放了深度學習框架MXNet,其具有優(yōu)異分布式計算性能,擁有卡耐基梅隆、英特爾、英偉達等眾多合作伙伴,國內(nèi)圖森互聯(lián)和地平線等公司也有使用。2015年11月,IBM宣布開源機器學習平臺SystemML。它是一種靈活的可伸縮機器學習(ML)語言,可根據(jù)數(shù)據(jù)和集群特性使用基于規(guī)則和成本的優(yōu)化技術(shù)動態(tài)地編譯和優(yōu)化,應用在不同工業(yè)領域。2016年9月,百度開源其深度學習平臺Paddle,可提供機器視覺、自然語言理解、搜索引擎排序、推薦系統(tǒng)等功能。2017年6月,騰訊和北京大學、香港科技大學聯(lián)合開發(fā)的高性能分布式計算平臺 Angel正式開源,具有較強的容錯設計和穩(wěn)定性。眾多開源學習框架促進人工智能應用程序發(fā)展。據(jù)IDC預測,到2020年,60%的人工智能應用程序?qū)⒃陂_源平臺上運行。

(2)谷歌開源平臺TensorFlow占據(jù)優(yōu)勢領先地位

無論是從關(guān)注度、下載量、貢獻者數(shù)量以及發(fā)布版本數(shù)量來看,谷歌開源平臺TensorFlow都占據(jù)優(yōu)勢領先地位。根據(jù)Github開源框架熱度(截至2017年11月10日)統(tǒng)計,TensorFlow關(guān)注度接近8萬次,下載量接近4萬次,成為最受歡迎的深度學習平臺,Caffe、CNTK、MXNet等關(guān)注度遠低于TensorFlow。根據(jù)Github開源框架貢獻者、Releases數(shù)量(截至2017年11月10日)統(tǒng)計,TensorFlow貢獻者數(shù)量達到1128人次,吸引了最廣泛的人工智能開發(fā)者,說明其生態(tài)活躍、成長性極強。從發(fā)布版本數(shù)量看,其數(shù)量為42次,證明谷歌因嚴謹?shù)膶徍藱C制和發(fā)布要求具備較強的實用性能。

(2)企業(yè)以平臺為核心呈現(xiàn)多元化發(fā)展模式

企業(yè)以平臺為核心呈現(xiàn)上升、拓展、下沉、打通4種發(fā)展模式??v向打通模式,從硬件到開源平臺,再到云平臺至應用服務,貫通產(chǎn)業(yè)鏈上下游,構(gòu)建全產(chǎn)業(yè)生態(tài),谷歌為其典型代表;向上搶占行業(yè)應用服務模式,以業(yè)務為導向,通過核心平臺向上搶占重點行業(yè)應用,如亞馬遜、阿里等;算法下沉于硬件模式,核心算法固化于硬件,以硬件形態(tài)提供行業(yè)通用或?qū)S糜嬎隳芰?,如寒武紀;拓展基礎能力,以核心平臺開放基礎能力,為行業(yè)提供基礎能力,如訊飛為行業(yè)提供基礎語音識別基礎技術(shù)、商湯為行業(yè)提供人臉識別基礎技術(shù)等。在4種發(fā)展模式中,云平臺和應用服務產(chǎn)生的所有數(shù)據(jù)均回流于訓練平臺進行數(shù)據(jù)反哺,可有效提升平臺的綜合能力。

3 核心關(guān)鍵技術(shù)

3.1 開源平臺核心架構(gòu)實現(xiàn)從設備層到工作層的一體化設計

以TensorFlow架構(gòu)為例,從底向上分為設備管理和通信層、數(shù)據(jù)操作層、圖計算層、API接口層、工作層和視圖層。其中,設備管理和通信層、數(shù)據(jù)操作層、圖計算層是核心層;底層設備通信層直接面向硬件,負責網(wǎng)絡通信和設備管理,設備管理可以實現(xiàn)TF設備異構(gòu)的特性,支持CPU、GPU、Mobile等不同設備,網(wǎng)絡通信依賴gRPC通信協(xié)議實現(xiàn)不同設備間的數(shù)據(jù)傳輸和更新;數(shù)據(jù)操作層決定算法邏輯的完備性,圖計算層體現(xiàn)算法設計的集團流程,接口層實現(xiàn)功能模塊的接口封裝,工作層直接面向開發(fā)者;視圖層是TensorFlow特有的,可實現(xiàn)計算流圖可視化。

3.2 TensorFlow:機器學習框架,算法與模型豐富,適用大規(guī)模多應用部署

TensorFlow是谷歌研發(fā)的第二代人工智能學習系統(tǒng)。第一代人工智能學習系統(tǒng)DistBelief誕生于2011年,之后谷歌對DistBelief進行了各方面的改進,在此基礎上研發(fā)出TensorFlow。Tensor(張量)意味著N維數(shù)組,F(xiàn)low(流)意味著基于數(shù)據(jù)流圖的計算,TensorFlow為張量從圖像的一端流動到另一端的計算過程。TensorFlow是將復雜的數(shù)據(jù)結(jié)構(gòu)傳輸至人工智能神經(jīng)網(wǎng)中進行分析和處理過程的系統(tǒng)。TensorFlow可被用于語音識別或圖像識別等多項機器深度學習領域。TensorFlow在GitHub上開源,任何人都可以用。谷歌的產(chǎn)品均基于TensorFlow開發(fā),如AlphaGo(見圖1)。

圖1 TensorFlow

3.3 MXNet:深度學習開發(fā)框架,亞馬遜基于此建立生態(tài)

MXNet是機器學習社區(qū)(DMLC)發(fā)布的深度學習框架。編程方式采用混合符號編程和命令式編程,從而最大限度提高效率和生產(chǎn)力,其核心是動態(tài)的依賴調(diào)度,能夠自動并行符號和命令的操作。圖形優(yōu)化層,使得符號執(zhí)行速度快,內(nèi)存使用高效。MXNet便攜、輕量,而且能夠擴展到多個GPU和多臺機器。MXNet結(jié)構(gòu)從上到下分別為各種主語言的嵌入、編程接口(矩陣運算、符號表達式、分布式通訊)、兩種編程模式的統(tǒng)一系統(tǒng)實現(xiàn)以及各硬件的支持(見圖2)。

3.4 Caffe:第一個主流工業(yè)級深度學習工具,圖形領域的經(jīng)典框架

Caffe深度學習框架結(jié)構(gòu)清晰、執(zhí)行速度快,由加利福尼亞大學伯克利分校博士生賈揚清開發(fā),后轉(zhuǎn)交給加利福尼亞大學伯克利視覺與學習中心(BVLC)維護。Caffe支持視覺領域的算法框架,可移植性好,Intel針對Caffe做了定制優(yōu)化,整合了Intel的MKL,支持 Intel Xeon(見圖3)。

3.5 Torch:機器學習開發(fā)框架,網(wǎng)絡結(jié)構(gòu)設計靈活,適合學術(shù)研究用

Torch由Facebook人工智能研究院(FAIR)于2015年1月發(fā)布,其開源的內(nèi)容包括Fbcunn、ConvNets等,F(xiàn)bcunn用于對圖像識別、自然語言處理以及其它大規(guī)模深度學習系統(tǒng)的深度學習加速環(huán)節(jié),ConvNets是基于FFT的快速卷積層,采用基于NVIDIA的cuFFT庫構(gòu)建的自定義CUDA內(nèi)核。此外,還包括許多其它基于CUDA的模塊和容器(Container)(見圖4)。

3.6 開源平臺呈現(xiàn)集大成趨勢

開源平臺呈現(xiàn)集大成趨勢,通用算法、典型算法均可支持,對通用CPU、GPU等部署環(huán)境大多支持。總體來說呈現(xiàn)3種趨勢:一是命令式和符號式編程相結(jié)合,即結(jié)構(gòu)靈活調(diào)試方便,節(jié)省內(nèi)存,提高運行時間;二是云側(cè)和端側(cè)協(xié)同共生,大多數(shù)框架支持云側(cè)部署,端側(cè)部署是發(fā)展熱點,同時支持訓練和推理;三是支持多元化算法,支持多種算法邏輯,更新迭代及時,能夠支持最新的算法和硬件。

4 我國發(fā)展態(tài)勢

4.1 我國發(fā)展策略從引導到推動,打造人工智能開放協(xié)同生態(tài)

(1)國家層面

2017年7月,國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確指出要統(tǒng)籌布局人工智能創(chuàng)新平臺,強化對人工智能研發(fā)應用的基礎支撐,形成促進人工智能軟件、硬件和智能云之間相互協(xié)同的生態(tài)鏈。規(guī)劃強調(diào)按照“構(gòu)建一個體系、把握雙重屬性、堅持三位一體、強化四大支撐”進行布局,其中“一個體系”指構(gòu)建開放協(xié)同的人工智能科技創(chuàng)新體系,“雙重屬性”指把握人工智能技術(shù)屬性和社會屬性高度融合的特征,“三位一體”指堅持人工智能研發(fā)攻關(guān)、產(chǎn)品應用和產(chǎn)業(yè)培育推進,“四大支撐”指全面支撐科技、經(jīng)濟、社會發(fā)展和國家安全。規(guī)劃從頂層設計為我國人工智能技術(shù)和產(chǎn)業(yè)發(fā)展指明了方向。

圖2 MXNet

圖3 Caffe

圖4 Torch

(2)部委層面

發(fā)改委人工智能創(chuàng)新發(fā)展重大工程中提出面向深度學習應用的開源平臺建設及應用??萍疾咳斯ぶ悄苤卮箜椖恐刑岢鲩_展國家人工智能開源開放創(chuàng)新平臺建設,依托BAT和科大訊飛開展第一批試點。工信部《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018—2020年)》中也提出支持開源開放平臺建設。這些項目及計劃與國家《新一代人工智能發(fā)展規(guī)劃》一脈相承,同時從具體領域細化了發(fā)展目標,更具有可操作性。

4.2 我國企業(yè)積極布局,上升、拓展、下沉模式并存,打通模式尚未形成

在企業(yè)層面,BAT和科大訊飛等企業(yè)加緊布局。例如,百度建設自動駕駛國家新一代人工智能開放創(chuàng)新平臺,無人駕駛小巴將于2018年量產(chǎn);阿里云建設城市大腦國家新一代人工智能開放創(chuàng)新平臺,在杭州等城市開展城市大腦建設;騰訊建設醫(yī)療影像國家新一代人工智能開放創(chuàng)新平臺,旗下首款人工智能醫(yī)療產(chǎn)品“騰訊覓影”于2017年11月全面落地河北?。豢拼笥嶏w建設智能語音國家新一代人工智能開放創(chuàng)新平臺,產(chǎn)品切入教育、安防等領域??傊?,企業(yè)通過建設開源創(chuàng)新平臺增強技術(shù)實力和產(chǎn)業(yè)競爭力,是產(chǎn)業(yè)生態(tài)不可或缺的環(huán)節(jié)。

上升、拓展、下沉模式是我國企業(yè)主要模式,打通模式有待形成。上升模式,以大型互聯(lián)網(wǎng)企業(yè)為主,提供云服務和行業(yè)級、消費級產(chǎn)品,如百度、阿里、騰訊等;拓展模式,以算法類公司和由算法進入垂直行業(yè)的應用公司為主,提供云服務和行業(yè)產(chǎn)品,如訊飛、商湯、曠視、云從、思必馳等;下沉模式,以初創(chuàng)芯片公司為主,憑借技術(shù)領先與芯片巨頭錯位發(fā)展,需與應用廠商密切綁定,如寒武紀、地平線、深鑒科技等。

5 結(jié)束語

發(fā)展開源平臺至關(guān)重要,筆者從政策推動、核心突破、產(chǎn)業(yè)發(fā)展、生態(tài)建設4個方面提出建議:

(1)在國家政策方面分析,要聚焦開源平臺建設重點,統(tǒng)籌專項;引進消化再吸收,鼓勵企業(yè)加大研發(fā);發(fā)揮基金撬動作用,鼓勵社會資本加入。

(2)在核心突破方面,加大對機器學習核心理論的研究探索,加強對有監(jiān)督學習、弱/無監(jiān)督學習理論的突破,加大對量子、類腦等前沿技術(shù)的布局。

(3)在產(chǎn)業(yè)發(fā)展方面,要鼓勵大型互聯(lián)網(wǎng)企業(yè)發(fā)展自主開源平臺,鼓勵初創(chuàng)企業(yè)發(fā)展垂直領域?qū)S闷脚_,在聯(lián)盟內(nèi)開展有關(guān)開源平臺的推介和支持。

(4)在生態(tài)建設方面,加強產(chǎn)業(yè)鏈上下游協(xié)同,注重產(chǎn)學研聯(lián)動,加速基于平臺的成果轉(zhuǎn)化,積極吸取開源經(jīng)驗,加大運維投入。

猜你喜歡
開源深度人工智能
深度理解一元一次方程
五毛錢能買多少頭牛
深度觀察
深度觀察
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
深度觀察
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
大家說:開源、人工智能及創(chuàng)新
西乡县| 安丘市| 长白| 大安市| 太仆寺旗| 蓬莱市| 乌拉特后旗| 广西| 屏南县| 长兴县| 隆子县| 五常市| 兴宁市| 正定县| 浠水县| 田阳县| 九龙坡区| 姜堰市| 乐昌市| 夏邑县| 湖北省| 宁南县| 雷波县| 阜阳市| 翁牛特旗| 乳山市| 修水县| 左权县| 房产| 宁明县| 松原市| 会泽县| 南平市| 喀喇| 林口县| 综艺| 翁牛特旗| 株洲县| 信宜市| 宁乡县| 北流市|