程曉光
(中國科學技術部,北京 100862)
隨著科技進步和產業(yè)變革的加速演進,人工智能(AI)已經成為各國必爭的科技創(chuàng)新高地。放眼全球,在政府、學術機構、企業(yè)等各個層面,AI都受到高度重視,其在學術研究、技術創(chuàng)新、人才教育等方面的發(fā)展都呈現全新態(tài)勢。
越來越多的國家開始重視AI研究,AI已成為學術領域的熱點。
學術論文方面,據微軟學術圖表(Microsoft Academic Graph,MAG)[1]統(tǒng)計,2000至2020 年間,通過各種途徑發(fā)表的AI論文數量從不到4.8萬篇增加至23萬篇,提升了約4倍(見圖1),占所有論文的比重從不到2%提高至3%?!?021年人工智能指數報告》(“Artificial Intelligence Index Report 2021”)顯示[2],東亞、歐洲、北美是論文產出的主要區(qū)域。在每個主要國家和地區(qū),產生論文的第一大戶都是大學。但列第二位的則有所不同:在美國排第二的為企業(yè),約占全部論文的19.2%,而在中國和歐盟排第二的都是公共研究機構,占比分別達到15.6%和17.2%。
圖1 2000—2020年全球發(fā)表的AI論文數量
科研期刊依然是論文發(fā)表最主要的載體,2020年期刊發(fā)表AI論文數量接近8萬篇,是2000年的5.4倍,尤其是近年來增速明顯,2019年比2018年增加19.6%,2020年比2019年又進一步增加34.5%。東亞、歐洲、北美是期刊出版最多的前三大區(qū)域。自從2017年以來,中國一直是AI領域期刊出版物最多的國家,并且在2020年首次超越美國成為世界人工智能期刊上被引用論文頻次最高的國家,占比達到20.7%,而美國為19.8%。
學術會議是論文發(fā)表的另一重要途徑,2000年至2019年間,通過AI學術會議發(fā)表的文章增加了4倍,但2010—2020年增長緩慢,一直維持在4萬篇左右,2019年的會議論文僅是2010年的1.09倍,受疫情影響,2020年更是比2019年減少20%以上。
一是高強度的AI研發(fā)產生了大量科研成果。除了2020年受疫情影響略有下降外,AI領域專利數量自2000年以來經歷了快速增加(見圖2)。根據斯坦福大學針對全球40多個國家的不完全統(tǒng)計,2019年全球AI注冊專利數量已經達到101 876件,是2000年21 806件的4.7倍,占所有專利的比例也從2000年的2.0%提高到了2.9%。從地區(qū)看,AI專利的主要產區(qū)是北美,約55%的專利源自北美地區(qū),此外,歐洲和東亞各占20%左右。
圖2 2000—2020年 AI領域新增專利數量
二是AI技術進一步完善。AI系統(tǒng)現在可以合成文本、音頻和圖像,而且水平足夠高,人類難以辨別真?zhèn)巍1热鐖D像合成技術能“深度偽造”,將人臉疊加到照片或電影中其他人的臉上。這也促使研究者探索深度偽造檢測技術,讓計算機能很好地區(qū)分不同的圖像輸出。得益于機器學習和自然語言處理技術的進步,機器能在視覺問答中提供更加準確的自然語言答案,自2015年首次發(fā)布以來,該算法準確率增長了近40%,最高達到76.4%,已接近人類80.8%的準確率基線。
三是逐步走向產業(yè)化。一方面,技術的成熟讓相關的AI模型的訓練時間和訓練成本明顯降低,如訓練一個現代圖像識別系統(tǒng),根據斯坦福DAWNBench團隊進行的測試[3],2017年需要耗資1 100美元的項目,現在只用花7.43美元,成本僅為原來的1/150。另一方面,AI在越來越多的領域得到應用,交通、金融、農業(yè)、軍事等領域都逐漸變得更“智能”,特別是疫情期間,隨著機器學習的采用,醫(yī)療保健和生物醫(yī)學行業(yè)的格局發(fā)生了實質性的變化,AI大大簡化了原有的化合物結構設計技術。AI初創(chuàng)公司PostEra的機器學習技術能夠在48小時內完成此前需要3~4周時間進行的化學合成路線設計,加速了新冠病毒相關藥物的發(fā)現;原谷歌人工智能部門DeepMind的深度學習模型AlphaFold破解了長達數十年的蛋白質折疊生物學難題。
四是投資明顯增加。2020年全球AI領域社會總投資(包括私人投資、公開募股、并購和少數股權等)較2019年增長了40%,達到679億美元。從國家來看,美國仍然是資本最集中的地區(qū),2020年社會資本投資AI超過236億美元,其次是中國(99億美元)和英國(19億美元)。從領域看,2020年生物醫(yī)藥領域獲得的投資最多,超過138億美元,是2019年的4.5倍;其次是智慧交通領域,達到45億美元;再次是教育領域的41億美元。然而,獲得投資的AI初創(chuàng)企業(yè)數量卻連續(xù)3年明顯減少,2017年超過4 000家AI初創(chuàng)企業(yè)實現融資,到2020年僅有不到1 000家。
2020年,全球AI領域人才招聘數量繼續(xù)增長。近5年來,巴西、印度、加拿大、新加坡、南非是新增崗位中AI崗位占比增長最快的前5個國家,如巴西5年內AI職位占比增加了3倍多,中國增速相對較慢,僅為1.3倍;美國甚至出現了多年來的首次下滑,發(fā)布的AI工作崗位從2019年的32.5萬個減少到2020年的30.1萬個。
教育方面,世界頂級大學紛紛部署加大AI教育投入,2017—2020年間,本科生的AI相關課程數量增加了102.9%,研究生階段則增加了41.7%。同時越來越多AI領域博士生選擇走出學校,進入產業(yè)。2010—2019年,進入企業(yè)從事AI相關工作的應屆博士畢業(yè)生比例從2010年的44.4%增至2019年的65.7%,繼續(xù)從事學術研究的比例則從42.1%下降到23.7%。
以美國為例,在獲得計算機科學博士學位的人中,人工智能相關博士在2010年占比為14.2%,2019年上升至約23%。與此同時,其他計算機科學領域的熱門程度有所下降,如網絡、軟件工程和編程語言等。2019年,新入學AI博士研究生中國際學生的比例繼續(xù)上升,達到64.3%,比2018年上升4.3%。在外籍畢業(yè)生中,多達81.8%的人選擇繼續(xù)留在美國。
AI技術的快速發(fā)展得益于其廣泛的應用場景。AI早已不再是簡單的軟件或硬件,已經成為包括算法、數據、硬件、應用、人才等一系列要素的集合。隨著計算機系統(tǒng)解決問題和執(zhí)行任務的能力迅速提高,機器智慧正在越來越多的領域替代人類智慧,AI成為當前人類能夠獲得的最強大工具,可以擴展知識、促進社會繁榮并豐富人類經驗。以下是未來AI應用中的幾個關鍵方面:
一是預測,憑借模型、算法的進步,AI能夠更加精準地預測,從以往數據中總結學習,并預測未來的事件,這在幾乎所有領域都能得到應用,如天氣預報,自動駕駛中對于其他車輛行駛軌跡的預判,精準農業(yè)中對于種植、灌溉、施肥的決策等等。
二是設計和優(yōu)化,在完成一系列復雜任務時進行優(yōu)化和統(tǒng)籌,以根據需求達到節(jié)省時間和金錢、提高安全性等目的,如智慧城市的規(guī)劃設計、交通線路規(guī)劃等。
三是建模和模擬,在生物、物理、經濟和社會研究中通過構建虛擬模型,進行仿真操作,可以節(jié)省很多實際中需要的測試和實驗,在提高實驗效率的同時能夠給出更多的解決方案。在COVID-19大流行中,研究人員在藥物分子設計、蛋白質構象等研究中廣泛使用了AI技術。
四是自然語言處理,人類自然語言與計算機的及時準確互動,不僅可以讓智能電子設備的操作更加簡單,也可以廣泛應用在文本分類、機器翻譯、輿情監(jiān)測等領域。
五是視覺圖像處理,通過用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,幫助做出正確的“決定”,讓AI可以應用在更多需要從圖像或多維數據中感知的領域,如生產線產品檢測、自動駕駛、醫(yī)學成像分析等。
以上幾個關鍵作用讓AI在科學研究、醫(yī)療健康、教育、智慧城市等領域得到了實實在在的應用,AI在日常生活中已經無處不在,正以各種方式重塑我們的生活。
(1)AI創(chuàng)新的步伐正在加速。AI領域中機器學習、計算機視覺、機器人等幾項熱點技術都在加快更新?lián)Q代。如計算機視覺領域,谷歌公司的“谷歌大腦”(Google Brain)模型2013年對于圖像識別的準確度普遍在60%~70%之間,2020年已經可以達到90%以上,模型訓練的速度提高了8倍。又如智能翻譯領域,2017年商業(yè)領域帶訓練模型的獨立機器翻譯云平臺僅有8家,2020年增至28家,其中LibriSpeech數據庫對于單詞識別的錯誤率從2017年的5%下降至僅1%。
(2)AI研發(fā)工具傳播更加廣泛。曾經,尖端的深度學習技術需要大量的數據、計算能力和專業(yè)知識,非常昂貴。隨著技術加速進步,AI的應用程序和開發(fā)工具也逐步公開,為更多人所用,許多平臺都是開源免費的,不少領域的訓練成本也都大幅降低。云計算的普及和數據共享使用將使AI創(chuàng)新不再是少數人的專屬,能夠拓展到全球范圍實施。
(3)AI正在改變人機關系。在現代社會中,人們對機器和自動化的需求程度在不斷加深。以智能手機為例,目前的手機都具有多種支持AI的功能,包括語音助手、照片標記、面部識別安全性、搜索應用程序、推薦和廣告引擎等。在手機功能越來越強大的同時,人們對其依賴程度也在升級。此外,智能電器、智慧家居等都在通過提供更加便捷、精準、高效的服務改變人們的生活習慣。AI正在將曾經的幻想轉化為跨學科的現實,讓機器扮演更加重要的角色。
其發(fā)展應用呈現出更加積極的趨勢,同時也面臨新的挑戰(zhàn)。隨著AI從精英科學發(fā)展成為主流工具,今后其或在某些方面遇到難以突破的瓶頸。一是訓練模型需要的數據將更為珍貴,各國政府、企業(yè)、研究機構都更加重視并加強對數據和隱私的保護,或限制AI的快速發(fā)展;二是隨著應用的普及,AI在就業(yè)、生物、社會公平,甚至機器與人的關系方面都將面臨現實的倫理挑戰(zhàn);三是部分領域AI帶來的顛覆性創(chuàng)新,如自動駕駛,相關監(jiān)管措施是否能及時跟進,將對其應用產生深刻影響。
正是由于其廣闊的應用前景,AI有望成為塑造全球競爭格局的重要因素,或將為早期采用的國家?guī)盹@著的經濟、戰(zhàn)略優(yōu)勢。許多國家都在布局加強AI研發(fā)和應用,AI競賽逐漸由研究機構、企業(yè)之間的競爭轉變?yōu)閲抑g的角力。
自從2017年以來,全球已有30多個國家和地區(qū)發(fā)布了優(yōu)先發(fā)展AI的國家戰(zhàn)略,投身AI全球競爭(見表1)。其中既有美國、歐盟、法國、德國、英國、新加坡等發(fā)達國家和地區(qū),也有印度、墨西哥、印度尼西亞、巴西、馬來西亞、烏克蘭等發(fā)展中國家。各國均試圖通過AI戰(zhàn)略支持本國AI產業(yè)發(fā)展,在國際競爭中占據有利位勢。
表1 近年發(fā)布AI國家戰(zhàn)略的國家和地區(qū)
加拿大、德國、印度、英國等多國都在戰(zhàn)略中明確要對發(fā)展AI進行直接資金支持,并列出了預算額度。日本、英國、沙特阿拉伯等國家還成立了專門的AI管理機構。在政策的大力支持下,這些國家的AI技術、人才、產業(yè)都在快速發(fā)展。新加坡已經成為AI職位占比最高的國家,2020年的數據顯示,AI相關崗位占全部工作崗位的比例達到了2.4%。據統(tǒng)計,印度前50類技能崗位中AI技術相關崗位數量最多,甚至超過了美國、中國、德國等AI強國。
在眾多國家中,美國仍是公認的AI第一強國,擁有強大的企業(yè)和研究機構,政府每年也投入大量財力支持研發(fā),2020財年非國防和情報部門的AI撥款就達到9.735億美元,2021財年這一數字進一步提高至15億美元,同比增加近55%。然而,美國的領先地位正在逐漸被中國趕上,個別領域甚至已經被超越。如中國在2017年之后一直保持全球AI論文發(fā)表數量第一,并逐步擴大領先優(yōu)勢,2020年更是首次超過美國成為世界AI期刊上被引用頻次最高的國家。
2019年,美國信息技術與創(chuàng)新基金會(ITIF)的數據創(chuàng)新中心曾發(fā)布研究報告《誰將在人工智能角逐中勝出:中國、歐盟或美國?》[4],對中、美、歐AI發(fā)展現狀進行比較測算——美國以44.2分領先,中國以32.3分位居第二,歐盟則以23.5分位居第三。美國的領先地位彰顯無疑,而中國則以追趕之勢跟進。谷歌前董事長埃里克·施密特認為,中國在面部識別、健康數據、電子商務等很多方面具有領先地位,美國在發(fā)展AI方面“僅比中國領先一到兩年”[5]。
中國的快速崛起引起美國各界的擔憂。大量美國媒體、智庫鼓吹中國即將在AI領域超越美國。2021年3月4日,美國國家人工智能安全委員會(NSCAI)投票通過,并向美國國會提交了長達756頁的2021年度最終建議報告[6],詳細闡述了AI對于社會發(fā)展和國家安全的重要作用,并對如何維護AI技術優(yōu)勢、保障國家安全提出了措施建議,尤其是將中國明確為未來美國在AI領域的最大競爭對手,針對性地呼吁美國聯(lián)邦政府采取措施。報告成為美國民主共和兩黨共識,得到了包括聯(lián)邦政府在內各界的重視,拜登政府也表示支持報告在知識產權、人才、加速創(chuàng)新、微電子、國際合作等方面提到的許多具體政策建議??梢灶A見,未來中美AI領域的戰(zhàn)略博弈將會進一步演化,在吸引人才、突破關鍵技術等方面的競爭會更加激烈。
隨著越來越多的國家加入全球AI競爭,迫切需要制定全球范圍內行之有效的國際規(guī)則、標準,同時國家間也需要通過互利合作達到取長補短、共同進步的目的。為滿足一些國家共同發(fā)展的目的,各種AI倡議應運而生,很多非常重要的國際倡議、論壇、組織也紛紛納入AI議題,涉及AI的原則標準、數據共享、研發(fā)合作等方面內容(見表2)。日本、韓國、英國、美國和歐盟成員國等國家積極參與了政府間AI方面的合作。也有一些國家通過積極締結雙邊協(xié)議來推進AI國際合作。
表2 主要AI相關國際合作
值得注意的是,不同于特朗普的一意孤行,拜登政府更加注重通過聯(lián)合盟友維護其世界霸主的地位。專家預測美國或將在科技領域牽頭發(fā)起成立“科技民主聯(lián)盟”[7],借西方民主價值觀拉攏盟友共同促進AI和新興技術的發(fā)展和使用,并進一步對中國實施科技封鎖與遏制,中美科技競爭或將升級邁入新階段。
雖然我國AI技術研發(fā)在全球的影響力顯著提高,又擁有全球最豐富的應用落地場景,但AI倫理、人才培養(yǎng)等問題仍需重視。習近平總書記在黨的十九大報告中明確提出,要“推動互聯(lián)網、大數據、人工智能和實體經濟深度融合”,將人工智能視為供給側結構性改革和推動實體經濟發(fā)展的重要一環(huán)。相關部門貫徹落實十九大精神,出臺了一系列戰(zhàn)略舉措,有力地推動我國在AI技術和產業(yè)化方面的進步。結合近年來全球AI發(fā)展動態(tài),為貫徹落實新發(fā)展理念,進一步加快我國AI技術創(chuàng)新,提出以下建議:
(1)理順促進AI發(fā)展的體制機制。為更好地發(fā)揮政府在AI創(chuàng)新方面的重要作用,一些國家成立了指導AI發(fā)展的專門機構,一方面解決部門間各自為戰(zhàn),碎片、重復支持AI研發(fā)的情況,另一方面也可更高效地加強對民間AI創(chuàng)新的引導。建議進一步理順我國促進AI發(fā)展的體制機制,成立專門機構或小組負責統(tǒng)籌部門間的支持政策,避免重復支持、無效支持,實現政府資源效益最大化和跨部門政策的良好銜接,并進一步促進AI成果轉化,使我國從AI論文強國變成AI專利強國。
(2)強化AI數據資源共享。近一兩年來,鼓勵相關數據和模型的資源共享已經成為美國、英國、日本、韓國等國家在AI管理上的重要共識,也是國際合作的一項重要議題。這是由AI技術的特征決定的,為了朝更智能的方向前進,最基礎、最關鍵的大數據支撐是必不可少的。美國谷歌、Meta(原臉書)、亞馬遜等科技企業(yè)憑借其商業(yè)模式和壟斷地位掌握了大量用戶數據,對其進一步研究機器學習、深度學習至關重要。我國在加強數據保護的基礎上,要充分利用數據資源,鼓勵開放共享,推進行業(yè)整體發(fā)展前進。
(3)加強人才培養(yǎng)。人才是第一資源,在未來AI戰(zhàn)略競爭中,誰能夠在世界范圍內吸引、培養(yǎng)和留住人才,誰就會取得優(yōu)勢。據統(tǒng)計,我國AI人才目前缺口超過500萬,國內的供求比例為1∶10,供需比例嚴重失衡,同時80%以上的外籍美國AI博士應屆畢業(yè)生選擇留在美國。繼續(xù)加強人才培養(yǎng)、補齊人才短板,是我國的當務之急。特別要探索產學合作、國內國際合作、跨界跨領域合作的育才機制,營造有利于AI人才成長與培養(yǎng)的沃土,推動構建和完善既有利于發(fā)展人才獨創(chuàng)能力,又能有效調動潛力的平臺條件,為未來做好準備。
(4)營造有利的國際環(huán)境。AI未來發(fā)展之路還有很長,以美國為首的發(fā)達國家一方面以舉國之力發(fā)展本國AI技術,另一方面也在充分發(fā)揮其影響力積極參與AI國際規(guī)則的制定,甚至意圖聯(lián)合盟友對我國進行戰(zhàn)略打壓。憑借現有產業(yè)基礎和技術實力,我國有能力且應當在未來AI領域競爭中發(fā)揮比較優(yōu)勢,補齊發(fā)展短板,下好先手棋,努力成為行業(yè)規(guī)則的重要制定者,引領技術朝有利于我國的方向發(fā)展,逐步在新的國際體系中占據重要位置,實現社會主義現代化強國的建設目標。
(5)重視AI發(fā)展的社會倫理和法規(guī)建設。AI在多個領域的加速應用,導致相應的倫理問題逐漸凸顯,尤其是隱私、就業(yè)、社會公平等領域,也是許多國際組織、協(xié)會、聯(lián)盟等積極討論的議題,甚至可能成為美歐等國打壓我國AI產業(yè)的關鍵。同時,對AI的監(jiān)管必須與時俱進,在交通、金融、醫(yī)藥等應用較好的領域要及時完善相關行業(yè)法律法規(guī),明確發(fā)展AI中的倫理規(guī)則,積極引導,讓新業(yè)態(tài)有規(guī)可循、有法可依,促進應用落地。
(6)密切跟蹤全球發(fā)展趨勢。當前AI創(chuàng)新進入高速發(fā)展階段,相關技術加速進步,產品日新月異,產業(yè)爆發(fā)式增長。美國、德國、韓國、以色列等科技強國都結合自身特點選擇重點領域布局突破。要持續(xù)跟蹤把握領域前沿發(fā)展趨勢,掌握發(fā)達國家在研發(fā)方向、支持舉措、監(jiān)管規(guī)則等方面的最新動態(tài),結合我國國情學習借鑒。■