陳偉
隨著信息、數(shù)據(jù)產(chǎn)生的加速發(fā)展,人們已經(jīng)生活在一個“數(shù)據(jù)大爆炸”的時代。在這樣的背景下,海量數(shù)據(jù)占據(jù)了越來越多的存儲系統(tǒng),存儲規(guī)模也逐漸增大。如何保障計算機系統(tǒng)在人為損壞或自然災(zāi)害等突發(fā)情況下的可靠性,已經(jīng)成為國家數(shù)據(jù)安全的戰(zhàn)略目標。
華中科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院胡燏翀教授,長期深耕于計算機系統(tǒng)數(shù)據(jù)可靠性領(lǐng)域,主要研究通過利用容錯技術(shù)如網(wǎng)絡(luò)編碼,糾刪碼等,設(shè)計與實現(xiàn)“高可靠、高性能、高安全”的計算機存儲系統(tǒng),包括云存儲、大數(shù)據(jù)存儲、內(nèi)存數(shù)據(jù)庫、重刪備份、異構(gòu)存儲等。他創(chuàng)新開發(fā)的大比例編碼存儲可靠性技術(shù),為我國多個民族骨干企業(yè)提供解決“卡脖子”的關(guān)鍵技術(shù),降低存儲成本并提升存儲性能,為保障我國數(shù)據(jù)存儲更可靠、高效、安全做出了重大貢獻。
追風(fēng)逐電 扎根數(shù)據(jù)存儲
荊楚之風(fēng),歷久彌新;荊楚人才,層出不窮。胡燏翀,1983年1月出生于湖北武漢,他天賦好學(xué),從小就表現(xiàn)出對計算機的濃厚興趣。2001年,以優(yōu)異的成績被中國科學(xué)技術(shù)大學(xué)少年班錄取,成為其中的“零零班”(教學(xué)改革試點班)學(xué)子,攻讀計算機科學(xué)與技術(shù)。
2005年,本科畢業(yè)后,胡燏翀又憑借突出的表現(xiàn),獲得直博資格,在導(dǎo)師許胤龍教授的指導(dǎo)下繼續(xù)留在華中科技大學(xué)深造,從此時起,他就開展了面向計算機存儲領(lǐng)域的可靠性編碼理論研究。當(dāng)時分布式存儲新型編碼研究方興未艾,胡燏翀敏銳地看到了分布式存儲與網(wǎng)絡(luò)編碼技術(shù)將會在未來極具發(fā)展?jié)摿?,他的博士畢業(yè)論文就是關(guān)于分布式存儲容錯的修復(fù)機制的研究,發(fā)表在計算機通信領(lǐng)域頂級期刊IEEE-JSAC,這也是早期網(wǎng)絡(luò)編碼和分布式存儲結(jié)合的重要論文之一。
博學(xué)而篤志 切問而近思
2010年,胡燏翀博士畢業(yè)后,先后在香港中文大學(xué)的網(wǎng)絡(luò)編碼研究所和計算機科學(xué)與工程系開展博士后研究,成為第一批將可靠性編碼應(yīng)用到云存儲系統(tǒng)中的博士后研究員,其間,他取得了一系列優(yōu)秀的研究成果,受到了學(xué)界的廣泛認可。2015年博士后工作結(jié)束,胡燏翀以副教授身份加入到華中科技大學(xué)計算機科學(xué)與技術(shù)學(xué)院的馮丹教授團隊。
此后,胡燏翀長期扎根計算機系統(tǒng)可靠性領(lǐng)域,針對大規(guī)模分布式存儲系統(tǒng)所面臨的“成本高、故障多、擴展慢”三大挑戰(zhàn),圍繞極致存儲開銷、高效故障修復(fù)、高效存儲擴展三個核心科學(xué)問題取得系列性成果,實現(xiàn)了高效可靠性存儲編碼在“理論-算法-系統(tǒng)”的完整技術(shù)鏈路。他將自己的研究總結(jié)為“三快”:“讓編碼速度更快、讓修復(fù)速度更快、讓擴容速度更快”。追風(fēng)逐電,向更快進發(fā),讓數(shù)據(jù)存儲更可靠、高效、安全,是他研究工作的主要任務(wù)。
迄今為止,胡燏翀已經(jīng)主持國家重點研發(fā)計劃青年科學(xué)家項目、國家自然科學(xué)基金、湖北省科技廳重點研發(fā)計劃項目,以及其他省部級項目和企業(yè)合作項目10余項。近5年來,共發(fā)表論文58篇,其中第一/通訊作者發(fā)表于計算機學(xué)會A類會議/期刊FAST、SC、INFOCOM和TOS、TIT、TPDS、TON、JSAC、TIFS以及云計算頂級學(xué)術(shù)會議SoCC、系統(tǒng)結(jié)構(gòu)權(quán)威會議ICDCS、ICPP等。同時,他還擔(dān)任多個國內(nèi)外會議包括ICPE 2022、中國計算機學(xué)會芯片大會(2022)等宣傳/網(wǎng)站主席。胡燏翀的研究工作受到了國際學(xué)術(shù)界廣泛關(guān)注和引用,谷歌學(xué)術(shù)顯示被引用1826次,谷歌學(xué)術(shù)h指數(shù)21,引者包括IEEE學(xué)會Fellow,國際著名期刊主編、MIT和Berkeley等著名高校教授數(shù)十人。
創(chuàng)新編碼 服務(wù)民族企業(yè)
隨著信息技術(shù)的飛速發(fā)展,新技術(shù)帶來海量數(shù)據(jù)的爆炸式增長,這也導(dǎo)致存儲成本不斷上升,如何利用編碼技術(shù)降低存儲成本,一直都是胡燏翀想要破解的難題。海康威視作為華中科技大學(xué)的緊密合作企業(yè),共建了“海量信息存儲聯(lián)合實驗室”,2018年??低曁岢隽诵枨?,希望能利用大比例編碼降低存儲成本。
當(dāng)時,國際在此方面只有理論,相關(guān)的技術(shù)實踐只有一家國外公司在做,但具體細節(jié)并未公開。對此,胡燏翀排除萬難深入探索,他從網(wǎng)絡(luò)編碼技術(shù)的原始論文入手設(shè)計大比例編碼,帶領(lǐng)團隊在國際上率先提出了大比例(條帶)糾刪碼(Wide-stripe Erasure Coding,WEC)系列技術(shù)成果。論文再次發(fā)表于“文件和存儲技術(shù)會議”(FAST),并由于在計算機領(lǐng)域的應(yīng)用,相關(guān)成果還發(fā)表于計算機超算領(lǐng)域頂會“全球超級計算大會”(SC)。??低晳?yīng)用其相關(guān)成果后,不僅節(jié)省了20%的存儲成本,還超過了微軟云和亞馬遜云的存儲成本降幅。研究工作取得31項專利,授權(quán)19項。此后,胡燏翀還將大比例糾刪碼技術(shù)超低成本的優(yōu)勢分別應(yīng)用于高性能計算、大數(shù)據(jù)中心、全閃集群等不同領(lǐng)域之中,解決了各種不同的需求。
一直以來,在傳統(tǒng)大規(guī)模存儲系統(tǒng)的主要存儲介質(zhì)——機械硬盤(Hard Disk Drive,HDD)都被美國和日本三大廠商西部數(shù)據(jù)、希捷及東芝所壟斷,為大力發(fā)展中國存儲產(chǎn)業(yè),必須掌握數(shù)字經(jīng)濟競爭主動權(quán)。隨著我國國產(chǎn)整機和閃存生產(chǎn)能力的逐步提升,研究“去HDD”大規(guī)模存儲系統(tǒng)下相關(guān)核心技術(shù),將會是未來國家戰(zhàn)略和企業(yè)發(fā)展的重大需求之一,而當(dāng)前阻礙其大規(guī)模應(yīng)用的主要原因在于其成本高昂,是HDD成本的三至五倍。因此,胡燏翀在2022年申請獲批了“面向低冗余成本的大規(guī)模全閃集群下大比例糾刪碼技術(shù)研究”的面上項目,將此前提出的大比例編碼技術(shù)應(yīng)用到固態(tài)硬盤(Solid State Disk,SSD)上,大大降低了SSD成本,為國內(nèi)大規(guī)模閃存集群提供了重要的技術(shù)支撐。
在當(dāng)今大數(shù)據(jù)時代,研制新一代高性能計算系統(tǒng),將大幅提升我國算力,滿足國家發(fā)展的戰(zhàn)略需求。但是,隨著并行計算系統(tǒng)規(guī)模擴展到千萬核級別,處理器、內(nèi)存故障頻頻發(fā)生,同時網(wǎng)絡(luò)連通度也會因頻發(fā)故障而大大降低,因而系統(tǒng)的計算、存儲、傳輸三大性能將因“故障頻發(fā)”而受到嚴重影響。為應(yīng)對頻發(fā)的故障,保障千萬核并行計算系統(tǒng)的可靠性,必須解決“大規(guī)模并行計算系統(tǒng)故障頻發(fā)下性能保障關(guān)鍵”科學(xué)問題。因此,胡燏翀申請并獲批主持了國家重點研發(fā)計劃“大規(guī)模并行計算系統(tǒng)的可靠性編碼理論和技術(shù)研究”青年科學(xué)家項目。
針對“故障頻發(fā)下性能保障”關(guān)鍵科學(xué)問題,胡燏翀將通過研究,重點解決3項關(guān)鍵技術(shù):面對大規(guī)模并行計算系統(tǒng)節(jié)點故障的低開銷容錯技術(shù),降低處理節(jié)點故障給系統(tǒng)所帶來的性能負擔(dān);面對大規(guī)模并行計算系統(tǒng)低連通度網(wǎng)絡(luò)的高效傳輸技術(shù),提升低連通度網(wǎng)絡(luò)下的傳輸效率;基于大規(guī)模并行計算系統(tǒng)故障特征的容錯優(yōu)化加速技術(shù),進一步提升系統(tǒng)容錯性能。最后,基于相關(guān)成果,構(gòu)建起可驗證的并行計算系統(tǒng)函數(shù)庫、仿真軟件和原型系統(tǒng),轉(zhuǎn)化落地,解決實際問題。
基于優(yōu)秀的科研成果和突出的貢獻,近年來,胡燏翀先后榮獲:2018年獲湖北省科技進步一等獎;2021年獲國家重點研發(fā)計劃青年科學(xué)家項目;2022年入選國家“萬人計劃”青年拔尖人才等。他的個人事跡被央視新聞聯(lián)播、學(xué)習(xí)強國、央視新聞、湖北衛(wèi)視等多家媒體報道。截至目前,已經(jīng)獲得19項專利授權(quán)(8項第一),其技術(shù)應(yīng)用于??低?、華為、浪潮、阿里、中興、深信服等單位,大大降低了其產(chǎn)品存儲成本并提升了存儲性能。
數(shù)據(jù)存儲可靠性的科研之路任重道遠,隨著人工智能時代的到來,未來,數(shù)據(jù)存儲不僅要安全,還要響應(yīng)更快,與人的互動更高效。胡燏翀將立足國家需求出發(fā),繼續(xù)堅持創(chuàng)新、突破瓶頸,并致力于產(chǎn)學(xué)研結(jié)合,研發(fā)更多成果并實現(xiàn)轉(zhuǎn)化應(yīng)用,服務(wù)于民族企業(yè),為社會經(jīng)濟發(fā)展創(chuàng)造價值,為國家數(shù)據(jù)安全保駕護航。