尹騁宇,劉怡良,彭海霞
(西安交通大學(xué),陜西 西安 710049)
汽車是人類生產(chǎn)生活中不可缺少的重要運(yùn)輸工具,隨著汽車領(lǐng)域技術(shù)的發(fā)展和理念的更新,過去的幾十年里行業(yè)發(fā)生了巨大的變革,涵蓋了可持續(xù)發(fā)展、技術(shù)創(chuàng)新和全球競(jìng)爭(zhēng)等多個(gè)方面。全球車輛保有量在2017 年時(shí)就首次超過10 億輛,并且正在繼續(xù)增長(zhǎng),被國(guó)家視為經(jīng)濟(jì)增長(zhǎng)的重要驅(qū)動(dòng)力。進(jìn)入二十一世紀(jì)后,環(huán)保和節(jié)能問題的重要性日益攀升,汽車行業(yè)也正在經(jīng)歷一場(chǎng)能源革命,汽車制造商正在加速推出更多環(huán)保型汽車,包括電動(dòng)汽車(EV,Electric Vehicle)、混合動(dòng)力驅(qū)動(dòng)車、可變排量發(fā)動(dòng)機(jī)汽車等。
在汽車行業(yè)發(fā)展如火如荼的同時(shí),駕駛安全問題也不容忽視。根據(jù)世界衛(wèi)生組織的一份有關(guān)道路安全的報(bào)告,道路交通死亡人數(shù)已經(jīng)增長(zhǎng)至超過每年135 萬人,由駕駛員導(dǎo)致的事故占總數(shù)的60% 到70% 之間。在這種大背景下,自動(dòng)駕駛(Autonomous Driving)技術(shù)正在快速發(fā)展,代表了汽車行業(yè)又一大技術(shù)革命,同時(shí)也是對(duì)于交通觀念的范式轉(zhuǎn)變。這項(xiàng)變革除了需要車輛工程等傳統(tǒng)制造業(yè)外,還融合了傳感器技術(shù)、人工智能技術(shù)與最新的無線通信技術(shù),使車輛能夠在無人工干預(yù)的情況下正常行駛。目前正處于自動(dòng)駕駛的快速發(fā)展時(shí)期,大多數(shù)自動(dòng)駕駛車輛還處于需要人工輔助的階段,無需人工輔助的車輛仍然在研發(fā)和測(cè)試過程中。
實(shí)現(xiàn)自動(dòng)駕駛的關(guān)鍵問題之一是使車輛具有高度的自主性和決策能力,這正是生成式人工智能(Generative Artificial Intelligence)擅長(zhǎng)的領(lǐng)域。生成式人工智能具有如下優(yōu)勢(shì):第一,生成式人工智能使用將傳感器數(shù)據(jù)、高清地圖和車聯(lián)網(wǎng)數(shù)據(jù)等作為多模態(tài)輸入,單車智能的預(yù)測(cè)和決策效果更為精準(zhǔn)。第二,生成式人工智能可以應(yīng)用于模型訓(xùn)練,通過模擬不同交通情景以訓(xùn)練車輛應(yīng)對(duì)不同路況。第三,生成式人工智能可以為高動(dòng)態(tài)、大規(guī)模異構(gòu)車聯(lián)網(wǎng)提供靈活的網(wǎng)絡(luò)部署和優(yōu)化方案,進(jìn)而促進(jìn)多車智能的發(fā)展。當(dāng)前的自動(dòng)駕駛和車聯(lián)網(wǎng)綜述側(cè)重于傳統(tǒng)的感知決策算法、專用短程通信(DSRC,Dedicated Short Range Communications)和LTE-V2X 等技術(shù)[1-2],鮮有文獻(xiàn)討論生成式人工智能對(duì)網(wǎng)聯(lián)自動(dòng)駕駛的重要意義,本文從單車智能和網(wǎng)聯(lián)協(xié)同兩個(gè)方面,討論生成式人工智能技術(shù)對(duì)自動(dòng)駕駛的決策、感知、導(dǎo)航、網(wǎng)絡(luò)等模塊的促進(jìn)作用,在此基礎(chǔ)上提出基于人工智能代理的網(wǎng)聯(lián)自動(dòng)駕駛模型。
自動(dòng)駕駛也被稱為無人駕駛技術(shù)(Driverless Technology),能夠使汽車在沒有司機(jī)干預(yù)的情況下自主完成駕駛、導(dǎo)航和避障等操作,自動(dòng)駕駛技術(shù)的核心是在實(shí)時(shí)數(shù)據(jù)和環(huán)境提示指導(dǎo)下的獨(dú)立導(dǎo)航和決策的能力。在美國(guó)汽車工程師學(xué)會(huì)給出的標(biāo)準(zhǔn)中[3],自動(dòng)駕駛的等級(jí)可以分為六個(gè)等級(jí),我國(guó)于2021 年也提出了類似的汽車自動(dòng)化分級(jí)[4],同樣分為六個(gè)等級(jí):L0 應(yīng)急輔助、L1 部分駕駛輔助、L2 組合輔助駕駛、L3 有條件自動(dòng)駕駛、L4高度自動(dòng)駕駛、L5 完全自動(dòng)駕駛?,F(xiàn)在成熟的自動(dòng)駕駛技術(shù)還處于L2 和L3 級(jí)別,但是高度甚至完全自動(dòng)駕駛的前景是可觀的。
自動(dòng)駕駛從系統(tǒng)架構(gòu)的角度大致可以分為兩種,即單車智能[5-6]以及網(wǎng)聯(lián)協(xié)同[7-8]。目前產(chǎn)業(yè)界研究方向主要集中單車智能上,即車輛僅通過自身搭載的人工智能、計(jì)算機(jī)視覺、傳感器和全球定位系統(tǒng)之間的協(xié)作完成規(guī)劃和決策[9],目前已經(jīng)存在的自動(dòng)駕駛方案絕大多數(shù)為單車智能方案。
而隨著車聯(lián)網(wǎng)和無線通信技術(shù)的發(fā)展,自動(dòng)駕駛開始逐漸向網(wǎng)聯(lián)化發(fā)展,我國(guó)政府推進(jìn)的基于C-V2X 技術(shù)的網(wǎng)聯(lián)自動(dòng)駕駛[10],美國(guó)政府也后續(xù)跟進(jìn),基于C-V2X的自動(dòng)駕駛技術(shù)受到了各國(guó)的重視。網(wǎng)聯(lián)自動(dòng)駕駛一種可利用車聯(lián)網(wǎng)技術(shù),實(shí)現(xiàn)車與車、車與路、車與云等的信息交互,從而提高自動(dòng)駕駛的安全性、可靠性和智能化水平。多國(guó)也對(duì)車聯(lián)網(wǎng)技術(shù)給出了一些前瞻性文件,如歐盟《網(wǎng)聯(lián)自動(dòng)駕駛路線圖》[11]。
生成式人工智能利用深度學(xué)習(xí)技術(shù),自動(dòng)或半自動(dòng)的生成各種類型的內(nèi)容,如文本、圖片、音頻和視頻等,具有創(chuàng)造力和多樣性,可以在自動(dòng)駕駛技術(shù)的多個(gè)方面發(fā)揮重要作用。
生成式人工智能經(jīng)過長(zhǎng)時(shí)間的發(fā)展,已經(jīng)存在許多種模型,如長(zhǎng)短期記憶網(wǎng)絡(luò)、變分自編碼器(VAEs)、生成對(duì)抗網(wǎng)絡(luò)、Transformers 等經(jīng)典架構(gòu),和在Transformers 基礎(chǔ)上發(fā)展而來的大預(yù)言模型GPT4 等大語(yǔ)言模型、在圖片生成上大放異彩的擴(kuò)散模型(Diffusion Models)。生成式人工智能擁有其他人工智能技術(shù)無可比擬的自主性和創(chuàng)造力,能夠成為自動(dòng)駕駛應(yīng)對(duì)未來復(fù)雜路況的有效解決方案。
單車智能一般采用自我系統(tǒng)方案,自我系統(tǒng)方案讓汽車可以僅憑自身傳感器收集到的數(shù)據(jù)完成自動(dòng)駕駛的預(yù)測(cè)、規(guī)劃和決策任務(wù),使汽車能夠全程“自給自足”地自動(dòng)駕駛。如圖1 所示,傳統(tǒng)的單車智能自動(dòng)駕駛自我系統(tǒng)方案采取模塊化系統(tǒng)方案,模塊化系統(tǒng)是一個(gè)連接輸入和運(yùn)動(dòng)輸出的離散組件的管道,每個(gè)功能都單獨(dú)開發(fā)并集成到汽車中,如感知、預(yù)測(cè)和規(guī)劃功能,所以負(fù)責(zé)產(chǎn)生轉(zhuǎn)向和加速指令的規(guī)劃和控制模塊在駕駛中扮演重要角色[12]。模塊化管道首先將原始環(huán)境數(shù)據(jù)輸入感知模塊,通過定位模塊進(jìn)行障礙物檢測(cè)和定位,然后規(guī)劃和預(yù)測(cè)車輛的最佳和安全軌跡,最后電機(jī)控制器輸出控制信號(hào)[13]。但是這種方法在面對(duì)復(fù)雜、多樣化和不確定的駕駛情況時(shí)不夠靈活有效,且容易出現(xiàn)錯(cuò)誤傳播(Error Propagation),即某個(gè)模塊產(chǎn)生的錯(cuò)誤會(huì)沿著管道向下傳播,最終導(dǎo)致嚴(yán)重錯(cuò)誤,第一例自動(dòng)駕駛相關(guān)死亡事故就是因?yàn)榇藛栴}產(chǎn)生的悲劇[14]。
圖1 單車智能的模塊化系統(tǒng)方案和端到端方案
端到端驅(qū)動(dòng)方案旨在將駕駛?cè)蝿?wù)作為一個(gè)端到端的過程進(jìn)行處理,而不是將其分解為多個(gè)子任務(wù),模型直接從傳感器輸入產(chǎn)生自我運(yùn)動(dòng)。端到端系統(tǒng)的優(yōu)點(diǎn)非常明顯。第一,結(jié)構(gòu)簡(jiǎn)單,感知、預(yù)測(cè)和規(guī)劃組成一個(gè)可以聯(lián)合訓(xùn)練的模型。第二,優(yōu)化目標(biāo)一致,不會(huì)出現(xiàn)不同模塊優(yōu)化目標(biāo)不一致的情況。端到端系統(tǒng)也有弊端。首先,模型必須足夠復(fù)雜以處理不同的情況和任務(wù)。其次,模型是黑盒模型,不具備解釋性,沒有嚴(yán)格的可靠性。第三,后續(xù)維護(hù)困難,無法對(duì)單個(gè)模塊進(jìn)行優(yōu)化升級(jí)。目前生成式人工智能有望部分解決上述問題,生成式人工智正在朝著多模態(tài)的方向發(fā)展,本文認(rèn)為可以將多模態(tài)特性應(yīng)用于自動(dòng)駕駛,把車載傳感器采集的多模態(tài)數(shù)據(jù)輸入自動(dòng)駕駛大模型進(jìn)行訓(xùn)練。在文獻(xiàn)[15] 中提出了一種可以輸入圖片和文字的多模態(tài)大語(yǔ)言模型,可以借鑒該模型的設(shè)計(jì)思路,針對(duì)不同的傳感器輸入分別設(shè)計(jì)模塊進(jìn)行編碼和抽象化并同時(shí)訓(xùn)練,這樣可以避免因凍結(jié)部分模型導(dǎo)致訓(xùn)練不充分的問題。文獻(xiàn)[16] 使用模塊化的組件,同時(shí)優(yōu)化所有組件,以實(shí)現(xiàn)卓越的性能。文獻(xiàn)[17] 將生成式世界模型應(yīng)用于自動(dòng)駕駛,用于對(duì)生成駕駛場(chǎng)景車輛行為控制。文獻(xiàn)[18] 提出的BEVGPT 是將鳥瞰圖作為輸入,能夠預(yù)測(cè)多幀鳥瞰圖,并據(jù)此給出決策和運(yùn)動(dòng)規(guī)劃。
以生成式人工智能的方式為自動(dòng)駕駛訓(xùn)練貢獻(xiàn)出了一種新的方法。文獻(xiàn)[19] 將生成式人工智能應(yīng)用于生成自動(dòng)駕駛仿真環(huán)境,可以針對(duì)特定場(chǎng)景產(chǎn)生大量事件進(jìn)行訓(xùn)練。文獻(xiàn)[17]將生成式世界模型應(yīng)用于訓(xùn)練自動(dòng)駕駛,該模型能夠輸出高質(zhì)量的駕駛場(chǎng)景視頻,實(shí)現(xiàn)車輛的精細(xì)控制訓(xùn)練。圖2 中展示了經(jīng)典的駕駛場(chǎng)景仿真、定位導(dǎo)航和環(huán)境感知場(chǎng)景,在自動(dòng)駕駛訓(xùn)練場(chǎng)景中,生成式人工智能會(huì)在仿真環(huán)境中隨機(jī)生成高度擬真的隨機(jī)事件。
圖2 自動(dòng)駕駛技術(shù)
以上兩種方案介紹了目前生成式人工智能在單車智能上的運(yùn)用,但是皆未涉及到網(wǎng)聯(lián)自動(dòng)駕駛,一方面是網(wǎng)聯(lián)自動(dòng)駕駛起步較晚,另一方面是網(wǎng)聯(lián)自動(dòng)駕駛對(duì)于人工智能的依賴程度要遠(yuǎn)低于單車智能。網(wǎng)聯(lián)自動(dòng)駕駛訓(xùn)練成為生成式人工智能的進(jìn)一步研究工作。
由于高級(jí)別的網(wǎng)聯(lián)自動(dòng)駕駛需要非常精確的定位,傳統(tǒng)的三種方案有全球衛(wèi)星導(dǎo)航系統(tǒng)(GNSS,Global Navigation Satellite System)與慣性測(cè)量單元(IMU,Inertial Measurement Unit)融合方案GNSS-IMU,同時(shí)完成定位與地圖構(gòu)建的SLAM(Simultaneous Localization and Mapping)以及基于先驗(yàn)地圖的定位[7]。但上述方案依然難以滿足要求。圖2 中定位導(dǎo)航部分展示了一個(gè)經(jīng)典的定位導(dǎo)航場(chǎng)景,汽車通過GNSS 和基站,配合IMU 進(jìn)行精確定位。
生成式人工智能在定位導(dǎo)航方面具有以下三個(gè)方面的優(yōu)勢(shì)。首先,可以分析大量地理數(shù)據(jù),對(duì)地圖數(shù)據(jù)進(jìn)行增強(qiáng),以便導(dǎo)航應(yīng)用和駕駛員更好地理解道路和地標(biāo)。其次,基于生成式人工智能的導(dǎo)航算法可以分析駕駛員的歷史駕駛數(shù)據(jù)、偏好和形式習(xí)慣,為駕駛員提供個(gè)性化建議。最后,可以接收車聯(lián)網(wǎng)的數(shù)據(jù),對(duì)實(shí)時(shí)交通狀況進(jìn)行分析,預(yù)測(cè)擁堵程度和路況,這有助于選擇最優(yōu)駕駛路線,在做到出行便利的同時(shí),實(shí)現(xiàn)節(jié)能減排的目標(biāo)。
傳感器技術(shù)是自動(dòng)駕駛技術(shù)的核心技術(shù)之一[9],傳感器收集到的數(shù)據(jù)將直接影響自動(dòng)駕駛效果。為了自動(dòng)駕駛的可靠性,大多數(shù)自動(dòng)駕駛汽車都需要高冗余的傳感器部署。本文將傳感器分為對(duì)外傳感器和對(duì)內(nèi)傳感器。其中對(duì)外傳感器主要用于感知環(huán)境,包括動(dòng)態(tài)和靜態(tài)物體,如動(dòng)態(tài)的車輛、人,以及靜態(tài)的道路、障礙物、建筑物等。對(duì)外傳感器包括單目攝像頭、全景相機(jī)、攝像頭陣列、事件攝像頭、雷達(dá)、激光雷達(dá)、超聲波傳感器等。對(duì)內(nèi)傳感器主要負(fù)責(zé)是測(cè)量車輛狀態(tài),例如慣性測(cè)量單元能夠測(cè)量車輛的速度和位置變化,車輪編碼器負(fù)責(zé)里程計(jì),轉(zhuǎn)速表用于測(cè)量速度,高低表用于測(cè)量高度。圖2 中環(huán)境感知部分展示了一個(gè)駕駛過程中的環(huán)境感知場(chǎng)景,車輛通過搭載的雷達(dá)傳感器感知到了側(cè)面經(jīng)過的動(dòng)態(tài)車輛和路邊的靜態(tài)樹木。
生成式人工智能在感知模塊上具有重要應(yīng)用。首先,可以對(duì)傳感信息,例如攝像頭圖像進(jìn)行語(yǔ)義分割,將圖像中的不同區(qū)域標(biāo)記為不同的實(shí)物,如道路、行人、建筑物等,幫助車輛更好地理解道路環(huán)境,并做出正確的預(yù)測(cè)和運(yùn)動(dòng)規(guī)劃。其次,生成式人工智能可以對(duì)環(huán)境進(jìn)行精確建模,包括道路、障礙物等,從而輔助SLAM 系統(tǒng)的運(yùn)行。最后,生成式人工智能可以通過圖像增強(qiáng)來改善低照度或惡劣天氣條件下的感知效果。
車聯(lián)網(wǎng)按照通信傳輸距離可以劃分為短距離通信和長(zhǎng)距離通信技術(shù)。短距離通信技術(shù)主要有藍(lán)牙、UWB、ZigBee 等,主要應(yīng)用場(chǎng)景是遙控、互聯(lián)、識(shí)別以及信息傳輸?shù)龋ㄐ啪嚯x一般不超過一公里。長(zhǎng)距離通信技術(shù),包括DSRC、Wi-Fi、C-V2X(Cellular Vehicle-to-Everything)和NR-V2X 技術(shù)等,其中DSRC 和C-V2X 是學(xué)術(shù)界和產(chǎn)業(yè)界的兩種主流技術(shù)標(biāo)準(zhǔn),DSRC 是基于IEEE 802.11 標(biāo)準(zhǔn)基礎(chǔ)上改進(jìn)而來,C-V2X 是基于蜂窩移動(dòng)通信的車聯(lián)網(wǎng)技術(shù),目前C-V2X 在國(guó)際技術(shù)和產(chǎn)業(yè)競(jìng)爭(zhēng)中已經(jīng)形成明顯的超越態(tài)勢(shì)[20],5G 時(shí)代,C-V2X 進(jìn)一步發(fā)展為NR-V2X。
NR-V2X 使用了多種新技術(shù)以應(yīng)對(duì)車聯(lián)網(wǎng)更高的通信需求。其中毫米波(mmWave)技術(shù)用于開發(fā)高頻段,極大地提高傳輸速率,以應(yīng)對(duì)不斷提高的傳輸速率需求。網(wǎng)絡(luò)切片技術(shù)可以把運(yùn)營(yíng)商的物理網(wǎng)絡(luò)切分成多個(gè)虛擬專用網(wǎng),根據(jù)不同需求劃分不同的網(wǎng)絡(luò),NR-V2X 可面向自動(dòng)駕駛業(yè)務(wù)形成定制化的虛擬專網(wǎng),為不同的應(yīng)用提供不同質(zhì)量的網(wǎng)絡(luò)服務(wù),提高網(wǎng)絡(luò)的利用效率。移動(dòng)邊緣計(jì)算可以與車聯(lián)網(wǎng)相結(jié)合,由移動(dòng)邊緣計(jì)算服務(wù)器完成決策和數(shù)據(jù)壓縮,能夠降低核心網(wǎng)的傳輸時(shí)延和傳輸數(shù)據(jù)量。除此之外,如圖3 所示,語(yǔ)義通信、通感一體化和新型空口技術(shù)將會(huì)成為6G 時(shí)代車聯(lián)網(wǎng)的新范式,生成式人工智能與下一代車聯(lián)網(wǎng)之間存在著深刻的關(guān)系,可以在多個(gè)方面進(jìn)行協(xié)同工作以提高網(wǎng)聯(lián)自動(dòng)駕駛的性能。
圖3 下一代車聯(lián)網(wǎng)技術(shù)
在下一代車聯(lián)網(wǎng)中,語(yǔ)義通信(Semantic Communication)是一種產(chǎn)生范式改變的通信技術(shù),與傳統(tǒng)通信的編碼壓縮不同,語(yǔ)義通信主要目的是利用AI 技術(shù)對(duì)通信數(shù)據(jù)進(jìn)行語(yǔ)義理解、壓縮、編碼和解碼,提取關(guān)鍵信息進(jìn)行傳輸,從而節(jié)省帶寬,提高信息傳輸效率,在接收端通過AI 對(duì)接受到信息進(jìn)行解碼并恢復(fù)原本的信息,從而實(shí)現(xiàn)高效、可靠、安全的信息傳輸[21]。
使用語(yǔ)義通信技術(shù)可以極大地減少車聯(lián)網(wǎng)的帶寬占用,大型模型的訓(xùn)練樣本量級(jí)通常是數(shù)百萬至數(shù)十億級(jí)別的數(shù)據(jù),具有更強(qiáng)大的表示能力和泛化能力,有助于車載通信終端理解收到的語(yǔ)義信息。在應(yīng)對(duì)未來爆發(fā)增長(zhǎng)的車流量時(shí),車聯(lián)網(wǎng)能夠擁有更高的網(wǎng)絡(luò)承載量,避免網(wǎng)絡(luò)擁塞問題。
在傳統(tǒng)的通信過程中,無線感知一直是獨(dú)立發(fā)展的技術(shù),與無線通信系統(tǒng)的發(fā)展沒有具體交集,定位是5G通信系統(tǒng)中唯一提供的感知服務(wù),但是在6G 移動(dòng)通信系統(tǒng)發(fā)展規(guī)劃中,定位之外的感知功能將集成到通信過程中,成為通信的新功能[22]。
生成式人工智能與通感一體化技術(shù)相結(jié)合,可以利用生成式人工智能整合車輛的多種感知信息,包括視覺、雷達(dá)、激光雷達(dá)等,以提供全方位的環(huán)境感知,在下一代車聯(lián)網(wǎng)中完成更高精度的定位與追蹤,地圖構(gòu)建和環(huán)境重構(gòu)以及人類感官增強(qiáng)和手勢(shì)動(dòng)作識(shí)別等任務(wù)。
下一代車聯(lián)網(wǎng)將使用車聯(lián)網(wǎng)的專用數(shù)據(jù)鏈,集成多輸入多輸出(MIMO,Multi-Input Multi-Output)技術(shù)、智能反射面技術(shù)、毫米波/THz 通信技術(shù)和非地面網(wǎng)絡(luò)技術(shù),這些專用數(shù)據(jù)鏈技術(shù)有助于改善車聯(lián)網(wǎng)的通信性能,支持更多的數(shù)據(jù)傳輸和更廣泛的覆蓋范圍,從而提高車輛之間的互聯(lián)性和自動(dòng)駕駛系統(tǒng)的整體性能[19]。
新型空口技術(shù)的智能資源部署基于對(duì)現(xiàn)有數(shù)據(jù)的訓(xùn)練,然而車聯(lián)網(wǎng)的廣覆蓋域特點(diǎn)導(dǎo)致現(xiàn)有的模型難以覆蓋大部分的場(chǎng)景。例如車聯(lián)網(wǎng)資源管理除了時(shí)頻空等傳統(tǒng)資源以外,還包括波束資源、設(shè)備資源、衛(wèi)星資源、移動(dòng)邊緣計(jì)算和云資源。面向車聯(lián)網(wǎng)的模型壓縮、模型剪枝、硬件優(yōu)化以及隱私保護(hù)等技術(shù)的進(jìn)一步研究,有助于建立高效穩(wěn)定安全的車輛專用數(shù)據(jù)鏈。
生成式大語(yǔ)言模型的浪潮推動(dòng)了人工智能代理(AI Agent)相關(guān)研究快速發(fā)展,大模型與人類之間的交互通過提示詞(Prompt)實(shí)現(xiàn),而人工智能代理的工作只需要給定一個(gè)目標(biāo),其就能夠獨(dú)立思考,調(diào)用合適的工具鏈來逐步完成給定的目標(biāo),他不僅具備按照人類指令完成任務(wù)的能力,還具備獨(dú)立發(fā)起任務(wù)和執(zhí)行行動(dòng)的能力。其在網(wǎng)聯(lián)自動(dòng)駕駛領(lǐng)域也有非常廣闊的應(yīng)用場(chǎng)景,通過將人工智能代理整合入自動(dòng)駕駛系統(tǒng),統(tǒng)籌管理所有功能組件,用戶只需給出目的地,其他任務(wù)將由人工智能代理自動(dòng)生成,并自主決定路線,完成整個(gè)自動(dòng)駕駛過程,人工智能代理的引入將補(bǔ)全自動(dòng)駕駛?cè)狈ψ灾餍缘淖詈笠粔K短板。
圖4 是基于人工智能代理的網(wǎng)聯(lián)自動(dòng)駕駛模型,該模型將原始數(shù)據(jù)通過編碼器抽象化后放入生成式模型,決策與規(guī)劃交予人工智能代理執(zhí)行,人工智能代理根據(jù)生成式模型的預(yù)測(cè)結(jié)果進(jìn)行規(guī)劃,可以參考過往駕駛數(shù)據(jù)與駕駛員的習(xí)慣,讓自動(dòng)駕駛更加具有創(chuàng)造性和自主性。
從自動(dòng)駕駛、車聯(lián)網(wǎng)和生成式人工智能的發(fā)展趨勢(shì)上看,端到端驅(qū)動(dòng)方案開始逐漸取代模塊化系統(tǒng)方案,國(guó)家在大力發(fā)展車聯(lián)網(wǎng),目前已有多個(gè)車聯(lián)網(wǎng)自動(dòng)駕駛試驗(yàn)區(qū),生成式人工智能正在AI 領(lǐng)域高歌猛進(jìn)。
在技術(shù)方面,可以預(yù)見未來汽車將更加注重智能化和網(wǎng)聯(lián)化協(xié)同發(fā)展,隨著我國(guó)車聯(lián)網(wǎng)基礎(chǔ)設(shè)施建設(shè)逐漸完善,新的無線通信技術(shù)開始在車聯(lián)網(wǎng)應(yīng)用,自動(dòng)駕駛的發(fā)展重心將由單車智能向網(wǎng)聯(lián)自動(dòng)駕駛轉(zhuǎn)移,生成式人工智能的作用將繼續(xù)加強(qiáng)。在產(chǎn)業(yè)方面,未來的汽車產(chǎn)業(yè)將形成一個(gè)多元化和協(xié)同化的平臺(tái),汽車制造的上下游,包括汽車制造商、零件供應(yīng)商、平臺(tái)運(yùn)營(yíng)商等。生成式人工智能將實(shí)現(xiàn)跨行業(yè)、跨領(lǐng)域的合作創(chuàng)新,且更加注重用戶體驗(yàn)和用戶需求,提供更加個(gè)性化和差異化的服務(wù)。在應(yīng)用方面,隨著自動(dòng)駕駛等級(jí)的不斷提高,在2030 年之間預(yù)計(jì)將實(shí)現(xiàn)L5 自動(dòng)駕駛,屆時(shí)出行方式將發(fā)生翻天覆地的變化,從城市道路到高速公路,從特定范圍到全國(guó),從個(gè)人到物流企業(yè),從交通到社會(huì)生態(tài)。
本文總結(jié)了目前自動(dòng)駕駛領(lǐng)域的關(guān)鍵技術(shù),并針對(duì)自動(dòng)駕駛領(lǐng)域的需要分析了生成式人工智能應(yīng)用于單車自動(dòng)駕駛技術(shù)和網(wǎng)聯(lián)自動(dòng)駕駛技術(shù)的可行性,突顯了其在推動(dòng)自動(dòng)駕駛領(lǐng)域不斷進(jìn)步的潛力。隨著生成式人工智能的不斷發(fā)展,其在自動(dòng)駕駛及相關(guān)領(lǐng)域的應(yīng)用逐漸擴(kuò)大,這種趨勢(shì)將引領(lǐng)新一波技術(shù)創(chuàng)新浪潮,為實(shí)現(xiàn)車輛高級(jí)別自動(dòng)駕駛打下堅(jiān)實(shí)基礎(chǔ)。本文還提出了一種基于人工智能代理的網(wǎng)聯(lián)自動(dòng)駕駛模型的設(shè)想,該設(shè)想嘗試將人工智能代理技術(shù)應(yīng)用于端到端自動(dòng)駕駛,用人工智能代理的自主性為自動(dòng)駕駛賦能。
自動(dòng)駕駛技術(shù)的核心在于對(duì)感知、決策和執(zhí)行的智能集成。在感知方面,各種傳感器技術(shù)如激光雷達(dá)、攝像頭和雷達(dá)等不斷演進(jìn),以提供更精準(zhǔn)、全面的環(huán)境感知。生成式人工智能在圖像處理、目標(biāo)識(shí)別和場(chǎng)景理解等方面展現(xiàn)出卓越的表現(xiàn),為車輛提供更準(zhǔn)確的感知能力,從而提高駕駛的安全性和可靠性。決策層面的智能化是實(shí)現(xiàn)自動(dòng)駕駛的關(guān)鍵,生成式人工智能在決策方面的應(yīng)用,使車輛能夠更加智能地分析復(fù)雜的交通情境,做出實(shí)時(shí)的決策,這種能力對(duì)于應(yīng)對(duì)城市交通的復(fù)雜性以及各種意外情況至關(guān)重要。在執(zhí)行層面,生成式人工智能對(duì)于車輛的精準(zhǔn)控制和路徑規(guī)劃也發(fā)揮著重要作用,通過高度仿真訓(xùn)練與路徑優(yōu)化,車輛能夠更加靈活地適應(yīng)不同的駕駛場(chǎng)景,并更好地與周圍車輛和基礎(chǔ)設(shè)施進(jìn)行協(xié)同操作,這種精準(zhǔn)的執(zhí)行能力是實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛的必備條件,也是生成式人工智能在自動(dòng)駕駛技術(shù)中的關(guān)鍵優(yōu)勢(shì)之一。