劉小鵬 劉凡豐
(1. 北京大學 學科建設辦公室,北京 100871;2. 復旦大學 高等教育研究所,上海 200433)
人工智能(Artificial Intelligence,以下簡稱AI)的概念于1956 年提出,得益于近年來算力、算法的改善,AI 成為一個廣受關注的高新科技領域。 2016 年1 月,Nature 以封面論文的形式介紹了谷歌公司DeepMind 團隊開發(fā)的AI 程序Alpha-Go。 2017 年7 月,Science 推出AI ???,介紹AI在各個學科領域的應用[1]。 有觀點認為,AI 改變了科學,已成為引領第四次工業(yè)革命的核心部分,將對傳統(tǒng)的創(chuàng)新模式產(chǎn)生根本性的影響[2]。
隨著AI 應用范圍不斷擴大,相關概念、技術、理論仍在不斷發(fā)展。 目前的主流觀點認為,AI 的研究范疇包括自然語言處理、機器學習、神經(jīng)網(wǎng)絡、模式識別、智能搜索等,應用領域包括機器翻譯、語言和圖像理解、自動程序設計、專家系統(tǒng)等,涉及數(shù)學、心理學、神經(jīng)生理學、信息論、計算機科學、哲學、認知科學、不確定論以及控制論等學科。正是由于AI 的跨學科特點,很多研究型大學較早就開展了相關的研究,但是大都并沒有設置專門的培養(yǎng)AI 人才的本科專業(yè)或研究生專業(yè)。
隨著2017 年7 月國務院頒布《新一代人工智能發(fā)展規(guī)劃》和2018 年4 月教育部印發(fā)《高等學校人工智能創(chuàng)新行動計劃》,各地高校紛紛開始籌建AI 專業(yè)和AI 學院、研究院或研究中心。 《新一代人工智能發(fā)展規(guī)劃》特別強調(diào)要把高端人才隊伍建設作為AI 發(fā)展的重中之重,完善AI 領域?qū)W科布局。 但是,目前在我國人工智能(AI)還不是一級學科,各個高校的AI 相關專業(yè)教學和科研活動散落在多個學科或機構中,存在著碎片化、低水平重復的問題,一定程度上阻礙了相關領域前沿技術的發(fā)展和創(chuàng)新人才的培養(yǎng)。 高校對如何布局人工智能學科發(fā)展的思路尚不明晰。
下文嘗試從學科布局的角度,研究美國卡耐基·梅隆大學(Carnegie Mellon University,CMU)、麻省理工學院(Massachusetts Institute of Technology,MIT)、斯坦福大學(Stanford University)等三所研究型大學人工智能領域的機構設置、研究方向、人才培養(yǎng)體系情況等,探索有利于AI 發(fā)展的學科布局思路,希望為我國相關高校制定學科發(fā)展規(guī)劃提供借鑒。
人工智能是多學科交叉的研究領域,但與計算機學科有著密不可分的關系,也有學者認為AI是計算機學科的一個分支。 根據(jù)U.S.News 計算機科學專業(yè)最佳全球大學排名[3]、泰晤士高等教育計算機專業(yè)世界大學排名[4]和QS 世界大學計算機科學與信息系統(tǒng)排名[5],麻省理工學院、斯坦福大學、卡耐基·梅隆大學均名列前茅。 由美國麻省大學阿默斯特分校Emery Berger 教授開發(fā)的CS Rankings 基于計算機科學各領域頂級會議上的論文數(shù)量,對全球范圍的高校進行排名,近年來在計算機科學領域內(nèi)產(chǎn)生廣泛影響[6]。 從CS Rankings 近十年的數(shù)據(jù)來看,這三所大學無論是在整個計算機領域還是在AI 領域都始終穩(wěn)居前列。
圖靈獎(A.M.Turing Award)被稱為是計算機界的諾貝爾獎,由美國計算機協(xié)會(Association for Computing Machinery,ACM)于1966 年設立,專門獎勵那些對計算機事業(yè)做出重要貢獻的個人,對獲獎者的要求極高,評獎程序極嚴[7]。 據(jù)統(tǒng)計,截止2018 年,在總計67 位圖靈獎得主中,來自斯坦福大學、MIT 和CMU 的畢業(yè)生高達21 人。圖靈獎獲得者在獲獎時大多數(shù)都是在高校工作,其中在MIT、斯坦福和CMU 這三所高校的人數(shù)最多,分別有8 人、6 人和5 人。 歷史上共有8 位圖靈獎獲得者的研究領域與AI 密切相關,其中6 位在獲獎時是這三所高校的教授。 CMU 依靠大批知名教授培養(yǎng)了眾多優(yōu)秀的畢業(yè)生而在整個計算機領域享有盛譽,被稱為“AI 大本營”。
這三所美國一流大學近三年紛紛強力啟動AI 領域的基礎研究和人才培養(yǎng)計劃。 例如,CMU宣布設立美國高校第一個AI 本科專業(yè),將從2018 年秋季開始招生[8];斯坦福大學宣布啟動“以人為中心的AI 計劃”(Human-Centered AI Initiative,HAI),推進AI 研究、教育、政策和實踐以惠及全人類[9];MIT 宣布將投資10 億美元打造一個全新機構“Stephen A.Schwarzman 計算學院”,將計算和AI 的力量帶到MIT 所有研究領域,以引領計算機技術和AI 技術的發(fā)展及全球影響,這是迄今為止美國學術界對AI 的最大投資[10]。
卡耐基·梅隆大學1986 年建立了全美乃至世界第一個計算機科學系,是美國為數(shù)不多的將計算機學科單獨作為學院建制的院校之一,目前是全球最大的計算機學院[11]。 學院包括7 個系或研究所,分別是:計算機科學系、計算生物學系、人機交互研究所、軟件研究所、語言技術研究所、機器學習系和機器人研究所。 除了計算機科學學院之外,CMU 與計算機相關的實體機構還包括工學院下設的電子與計算機工程系。
CMU 計算機學院在自動駕駛、人臉識別、自然語言處理等方面做出了許多開創(chuàng)性的研究。 在學院機構設置中,既有按學科門類設立的系,又有按研究對象設立的研究所,二者在組織架構中具有同等的地位,但實際工作中側(cè)重點各有不同,同時滿足了人才培養(yǎng)、基礎研究和應用研究等不同需要。 其中,(1)計算機科學系發(fā)源于Herbert A.Simon 等人1956 年建立的計算中心,現(xiàn)有約80名教學科研人員,研究涵蓋了計算機相關的主要領域,包括:AI、計算機安全、圖形學、編程語言、系統(tǒng)、理論等;(2)計算生物學系發(fā)源于1989 年,正式成立于2007 年,涉及學科包括數(shù)學、統(tǒng)計學、化學、物理學、生物學和計算機科學等,研究領域包括:自動發(fā)現(xiàn)、實驗工具設計、基因測序等;(3)機器學習系成立于2006 年,研究領域包括:機器學習、機器人、AI、統(tǒng)計與計算機科學等;(4)人機交互研究所綜合計算機科學、設計、社會科學和學習科學等學科;(5)軟件研究所的研究領域包括:軟件結(jié)構、社會網(wǎng)絡分析、大數(shù)據(jù)、網(wǎng)絡物理系統(tǒng)、社會技術系統(tǒng)、程序分析、使用隱私與安全、安全工程、軟件保障與質(zhì)量等;(6)語言技術研究所的研究領域包括:自然語言處理、計算語言學、信息提取與問答、信息檢索、文本挖掘與分析、知識表達、推理與獲取、教育語言技術、機器學習、機器翻譯、多模式計算與交互、語音處理、口語接口和對話處理等;(7)機器人研究所的研究領域包括:現(xiàn)場與服務機器人、圖形與創(chuàng)新工具、以人為中心的機器人、操作與接口、機器人結(jié)構、機器人基礎、傳感與感知等。 工學院下設的電子與計算機工程系研究領域包括應用程序、系統(tǒng)與技術、理論與技術基礎三方面,下設11 個研究中心和5 個實驗室。
CMU 計算機學院的計算機科學系、計算生物學系可以授予相應學科的學士、碩士和博士學位,人機交互研究所、軟件研究所、語言技術研究所和機器人研究所則主要開設相關領域的研究生學位項目或輔修、雙學位項目。 各系或研究所還為有興趣的學生提供輔修或雙學位,以及與美術學院、數(shù)學系、哲學系等聯(lián)合設立的跨學科學位項目。機器學習系2002 年啟動了世界上第一個機器學習博士學位項目并持續(xù)至今,2012 年面向全校本科生開設機器學習輔修專業(yè),2014 年設立機器學習碩士學位項目及第二學位項目,2015 年增加了統(tǒng)計學與機器學習本科生專業(yè)。
AI 在CMU 已經(jīng)有50 多年的發(fā)展歷史。CMU 也把研究和創(chuàng)造新的AI 的前沿領域看作自己的義務,并為發(fā)展AI 戰(zhàn)略投入了大量的人、財、物資源。 CMU 在2018 年設立美國高校第一個AI本科專業(yè),培養(yǎng)目標是讓學生可以廣泛地思考如何解決各種不同學科中的問題,重點學習如何根據(jù)視覺、語言、大規(guī)模數(shù)據(jù)庫之類的復雜輸入進行決策或者增強人類的能力。 所有計算機學院的學生共同學習了核心的計算機科學課程和一些其他入門課程后,大二時就可以選擇AI、計算機科學或者計算生物學中的一個方向作為自己的本科專業(yè)。 選擇了AI 方向的學生會有額外的統(tǒng)計和概率、計算建模、機器學習以及符號化計算課程。 此外,道德和社會責任也將會是這個專業(yè)方向強調(diào)的內(nèi)容,包括如何用AI 為整個社會帶來福利的獨立研究。 根據(jù)CMU 計算機科學學院的公告,現(xiàn)階段AI 專業(yè)的招生規(guī)模計劃為每年30 ~50 名學生(整個計算機學院每年新生約735 名)[8]。
麻省理工學院以世界頂尖的工程學和計算機科學享譽世界,其計算機學科與電子工程共同依托工學院下設的電子工程與計算機科學系。 在系之下則沒有再設置行政層級,按照不同類型的劃分,包括4 個實驗室(Labs)、7 個研究領域(Areas)和9 個研究主題(Themes)。 4 個實驗室分別是:計算機科學與AI 實驗室(CSAIL)、信息與決策系統(tǒng)實驗室(LIDS)、微系統(tǒng)技術實驗室(MTL)、電子研究實驗室(RLE)。 研究領域包括:信息系統(tǒng)、電路、應用物理與器件、生物醫(yī)學科學與工程、計算機科學(AI)、計算機科學(系統(tǒng))、計算機科學(理論)。 研究主題包括:大數(shù)據(jù)、生物交叉、連接科學與工程、網(wǎng)絡安全、能源、多核處理器和云計算、納米技術與量子信息處理、機器人、無線網(wǎng)絡和移動計算。 當然,還有一些涉及計算機領域的研究機構或研究項目分布在其他實體機構中,部分也有自己獨立的實驗室(如林肯實驗室)。
在AI 方面,MIT 有世界一流的計算機科學與AI 實驗室(CSAIL),這是一個典型的交叉學科研究機構,其目標是尋求理解和發(fā)展使人與機器都能便于理解的推理、感知和行為的人工系統(tǒng)[12]。該實驗室的研究方向涵蓋了計算機與AI 的方方面面,如:算法與理論、AI 與機器學習、計算生物學、計算機結(jié)構、圖形與可視化、人機交互、程序語言與軟件工程、機器人、安全與密碼學、系統(tǒng)與網(wǎng)絡等。 此外,該實驗室所開展的研究項目還涉及電氣工程、航空航天、腦與認知科學、媒體藝術、大氣和行星科學、醫(yī)學等領域。
在人才培養(yǎng)方面,MIT 的院系與研究機構有明確的分工。 無論是本科生還是研究生規(guī)模,電子工程與計算機科學系都是MIT 最大的系。 設有6 個本科生學位項目,分別是:電子科學與工程、電子工程與計算機科學、計算機科學與工程、電子工程/物理學雙學位、計算機科學與分子生物學、計算機—經(jīng)濟與數(shù)據(jù)科學。 課程設置靈活,強調(diào)動手能力,使學生能夠從整體的視角去看待問題和解決問題,并聚焦于建模和抽象,為將來在各行各業(yè)取得成功做好準備。 研究生學位項目包括:科學碩士、工學碩士、電子工程與計算機工程碩士、哲學博士和科學博士等,其中科學碩士是攻讀博士學位必須要拿到的學位,而工程碩士只招收MIT 畢業(yè)的本科生。 類似CSAIL 這樣的實驗室不能直接招收本科生,如果對相關領域感興趣,可以申請暑期項目,而MIT 目前在校的本科生也可以申請本科生研究機會項目(Undergraduate Research Opportunities Program,簡稱UROP)。 對于研究生來說,要想進入CSAIL,除了申請電子工程與計算機科學系,還可以申請數(shù)學系、航空航天系、機械工程系等機構的研究生項目。
斯坦福大學在計算機理論、硬件、軟件、數(shù)據(jù)庫和AI 等各個領域都居于美國乃至世界領先地位。 其計算機科學系是工學院的一部分,共有教研人員60 人。 下設的研究機構包括:AI 實驗室、信息實驗室、理論組、計算機圖形/人機交互組、計算機系統(tǒng)實驗室等。 研究領域包括:AI、計算生物學、計算機視覺、機器學習、自然語言處理、機器人、教育、計算機圖像、人機交互、計算機系統(tǒng)、體系結(jié)構、計算機安全、網(wǎng)絡、分布式系統(tǒng)、程序設計、數(shù)據(jù)科學、理論等。 此外,計算機學科還與化學、遺傳學、語言學、物理、醫(yī)學、工程、建筑、機械制造等諸多領域開展交叉學科研究。 斯坦福大學AI 實驗室(SAIL)成立于1962 年,現(xiàn)已成為卓越的AI 研究、教學、理論和實踐中心。
斯坦福大學計算機科學系設有理學學士、碩士、哲學博士學位。 參與3 個本科生跨學科培養(yǎng)項目,分別是:計算機系統(tǒng)工程、符號系統(tǒng)、數(shù)學與計算科學。 AI 方面的本科學位涵蓋的課程非常全面,幾乎已經(jīng)和很多研究生課程相差無幾。 課程內(nèi)容也非常前沿,其中包括:計算生物學、語音識別、認知、機器學習等,并且在網(wǎng)上公開了許多他們有關機器人和深度學習的課程。 研究生培養(yǎng)的特點是核心課程設置小而精、注重學生數(shù)理及編程基礎、授課形式豐富多樣、激勵模式完善有效[13]。 AI 碩士研究生在攻讀學位期間的必修課程只有一門,學生可根據(jù)興趣選修幾門AI 具體方向的課程。 博士研究生項目以學術研究為導向,對課程的要求同樣很少,但競爭則更激烈。
目前知名度非常高的華裔學者吳恩達、李飛飛都是斯坦福大學教授。 李飛飛參與建立了著名的ImageNet 計算機視覺識別數(shù)據(jù)庫及挑戰(zhàn)賽,每年都會吸引各大公司的圖像識別程序員的參加,極大促進了圖像識別領域的技術發(fā)展。 “硅谷—斯坦?!蹦J绞菄H上最成功的產(chǎn)學研聯(lián)動模式。 一方面,斯坦福大學源源不斷地為硅谷輸送優(yōu)秀人才和科研成果,谷歌、雅虎、思科等頂尖企業(yè)創(chuàng)始人、高級人才均來自這所大學,一些新的創(chuàng)業(yè)公司其原型甚至來源于創(chuàng)始人在斯坦福大學的一個課堂作業(yè)。 反過來,硅谷企業(yè)也通過捐贈、數(shù)據(jù)共享等方式反哺斯坦福大學,共同成長。
AI 是一個高度交叉的學科領域,目前各方面的情況尚未成熟且都處于高速發(fā)展期,因此各高校發(fā)展AI 在組織架構、課程設置、資源投入等方面有許多尚處于探索之中。 國內(nèi)不少高校采取了各不相同的人工智能學科發(fā)展策略:有的依托計算機學院成立AI 學院,有的成立相對獨立的學院或研究院;有的將科研重點集中在AI 算法方面,也有些更多關注和應用緊密結(jié)合的智能系統(tǒng);有的招收本科生,有的只是科研和研究生培養(yǎng)。 美國這三所一流大學布局AI 學科的經(jīng)驗可以給我國高校幾點啟示。
CMU 之所以能成為國際知名高校,很大的原因在于其優(yōu)先發(fā)展計算機學科的正確戰(zhàn)略選擇。20 世紀60 年代末CMU 制訂實施的戰(zhàn)略規(guī)劃,采取了實用主義的發(fā)展策略,而不是一味追求規(guī)模擴張[14]。 以跨學科教學科研為核心,以信息科技為戰(zhàn)略突破重點,以開放包容的姿態(tài)面對社會,利用自身在工程技術等領域的前期優(yōu)勢,大力開展應用性科學研究與人才培養(yǎng),密切外界聯(lián)系來實現(xiàn)自身發(fā)展,將資源增量集中用于自身優(yōu)勢領域。半個世紀以來,CMU 一直引領全美甚至全世界的信息科學與技術的發(fā)展。
近20 年來計算機科學與信息技術滲透到多個學科,作為一種“溶劑”來“融化”和帶動其他相關學科的發(fā)展。 例如,與生物學研究相結(jié)合,發(fā)展成為計算生物學;與語言學研究相結(jié)合,發(fā)展成為計算語言學;等等。 這些現(xiàn)在都成為人工智能學科的若干研究方向。 美國這三所大學的AI 學科(計算機學科)都非常注重與其他學科的合作,例如,斯坦福大學計算機學科與哲學學科的合作,使優(yōu)勢學科、熱門學科與其他基礎學科、冷門學科能夠在同一個校園內(nèi)和諧共存。
傳統(tǒng)學科的人才培養(yǎng)也許需要按照本—碩—博依次遞進的方式設立項目,而以問題為導向的交叉學科領域可先設立博士生項目,讓不同背景的學生迅速接觸研究前沿。 對于AI 這一交叉學科領域來說,所需的核心課程散落在不同學科之中,通過明確內(nèi)涵,區(qū)分AI 與現(xiàn)有院系的差別,相關高校找準了自身的特色,有效避免了重復建設的問題。
AI 領域應重點培養(yǎng)三類人才,分別代表理論的前沿研究者、技術的實現(xiàn)者以及與行業(yè)交叉的應用者。 各高校的計算機專業(yè)本科生教育,以培養(yǎng)創(chuàng)新型人才為目標,體現(xiàn)靈活性、多樣性和完整性的特點。 學習計劃由計算機專業(yè)課程和其他學科領域的通識課程以及自由選修課程構成,注重基礎和學生的自由選擇,關注學生知識廣度、思維融通性以及思想和情感的交流。 在專業(yè)核心課程設置上,按照解決實際問題的邏輯順序來組織計算機原理、函數(shù)編程原理、計算機系統(tǒng)簡介等課程,與課程體系中的其他課程形成有機的內(nèi)在聯(lián)系。 三所大學的AI 實驗室通過實踐研究課程加強對學生獨立科研能力的培訓,而且也對其他院系的學生都一視同仁地歡迎,形成了良好的實驗室文化,學生未來無論是從事學術研究還是進入產(chǎn)業(yè)界,都在此得到了專業(yè)系統(tǒng)的訓練。
國內(nèi)高校近幾年發(fā)展AI 的熱情很高,在論文和專利上甚至有了一定的領先優(yōu)勢,但是人才培養(yǎng)與科技創(chuàng)新不是一蹴而就的短期工程。 從學科發(fā)展戰(zhàn)略、人才培養(yǎng)體系、發(fā)揮優(yōu)勢特色幾方面來看,與相關領域國際頂尖高校相比還有不小差距。無論是設置學院、系,還是研究院、實驗室,關鍵還是要充分考慮自身的特點、基礎和優(yōu)勢,并將這些優(yōu)勢與AI 學科的發(fā)展趨勢相結(jié)合,這樣才能形成自己的特色。 未來還需要在AI 相關的領域持續(xù)投入,才能彌補我國目前的AI 人才缺口,才能使我國的AI 產(chǎn)業(yè)得到更好更快地發(fā)展。