李國良
(清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系 北京 100084)
由于數(shù)據(jù)的增多、算力的提升、算法的優(yōu)化,機(jī)器學(xué)習(xí)技術(shù)近年來得到了快速發(fā)展,也為系統(tǒng)軟件的自動(dòng)化、智能化、自治化帶來了很多機(jī)會(huì).第一,傳統(tǒng)基于手工的優(yōu)化方法可以轉(zhuǎn)變?yōu)樽詣?dòng)的優(yōu)化方法,例如系統(tǒng)軟件參數(shù)的調(diào)優(yōu)和診斷,傳統(tǒng)手工方法需要花費(fèi)數(shù)周來完成系統(tǒng)優(yōu)化,而機(jī)器學(xué)習(xí)可以通過數(shù)據(jù)驅(qū)動(dòng)方法來自動(dòng)調(diào)整參數(shù),提升調(diào)參性能.第二,傳統(tǒng)啟發(fā)式方法逐漸轉(zhuǎn)變?yōu)橹悄芑姆椒ǎ鐐鹘y(tǒng)的基于均勻性分布和獨(dú)立性假設(shè)的估計(jì)問題導(dǎo)致估計(jì)不準(zhǔn),可以通過機(jī)器學(xué)習(xí)算法進(jìn)行智能化的估計(jì)來提升估計(jì)準(zhǔn)確率.第三,傳統(tǒng)經(jīng)驗(yàn)式軟件設(shè)計(jì)方法可以走向自治化的設(shè)計(jì)方法,例如傳統(tǒng)的系統(tǒng)軟件設(shè)計(jì)都是依賴于專家的經(jīng)驗(yàn)進(jìn)行設(shè)計(jì),由于專家的經(jīng)驗(yàn)往往受限,難以探索未知空間,而基于機(jī)器學(xué)習(xí)的方法可以探索更加廣泛的空間,可以自治化地設(shè)計(jì)系統(tǒng)軟件.
論文“機(jī)器學(xué)習(xí)方法賦能系統(tǒng)軟件:挑戰(zhàn)、實(shí)踐與展望”介紹了上海交通大學(xué)陳海波團(tuán)隊(duì)在并發(fā)索引結(jié)構(gòu)、鍵值存儲(chǔ)系統(tǒng)、并發(fā)控制協(xié)議等方面應(yīng)用機(jī)器學(xué)習(xí)方法的工作。
1)基于機(jī)器學(xué)習(xí)模型的索引設(shè)計(jì),包括利用簡單的線性模型來降低復(fù)雜模型執(zhí)行開銷大的問題、設(shè)計(jì)后備機(jī)制來解決模型預(yù)測誤差的問題、兩階段壓縮方法實(shí)現(xiàn)新索引構(gòu)建來解決并發(fā)更新和查詢的問題.
2)基于機(jī)器學(xué)習(xí)的鍵值存儲(chǔ)系統(tǒng),包括基于機(jī)器學(xué)習(xí)方法替代客戶端的索引結(jié)構(gòu)緩存以提供高效查詢性能的同時(shí)減少索引結(jié)構(gòu)所需內(nèi)存空間、設(shè)計(jì)了一種混合的系統(tǒng)架構(gòu)并構(gòu)建了原型系統(tǒng)XStore.
3)基于機(jī)器學(xué)習(xí)的并發(fā)控制協(xié)議,包括能夠精確區(qū)分事務(wù)執(zhí)行的建模方式來降低執(zhí)行開銷、基于one-hot 編碼構(gòu)建了行動(dòng)空間來覆蓋現(xiàn)有并發(fā)控制算法、后備機(jī)制來保證事務(wù)并發(fā)正確性.
該文還分析了機(jī)器學(xué)習(xí)賦能系統(tǒng)軟件的經(jīng)驗(yàn)和教訓(xùn),建議通過簡單的學(xué)習(xí)模型以應(yīng)對(duì)復(fù)雜的推理時(shí)延、降低后備機(jī)制開銷以應(yīng)對(duì)機(jī)器學(xué)習(xí)帶來的錯(cuò)誤、深入理解系統(tǒng)瓶頸再引入學(xué)習(xí)模型.
機(jī)器學(xué)習(xí)為系統(tǒng)軟件自動(dòng)化、智能化、自治化帶來了很多機(jī)遇,但是在適應(yīng)性、昂貴代價(jià)、在線系統(tǒng)部署等方面還存在眾多挑戰(zhàn).此論文是一個(gè)很好的開端,在此文的基礎(chǔ)上,建議持續(xù)深入研究,推動(dòng)機(jī)器學(xué)習(xí)在系統(tǒng)軟件的發(fā)展和落地.