劉丹
(重慶電子工程職業(yè)學(xué)院,重慶401331)
基于學(xué)習(xí)的TCP加速技術(shù)應(yīng)用于網(wǎng)絡(luò)文件傳輸?shù)臋C(jī)制與效率
劉丹
(重慶電子工程職業(yè)學(xué)院,重慶401331)
雖然TCP協(xié)議還存在問題,但是TCP加速技術(shù)更符合網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)囊?。基于學(xué)習(xí)的TCP加速技術(shù)的核心是信息重傳機(jī)制和擁塞處理機(jī)制,它能準(zhǔn)確識(shí)別網(wǎng)絡(luò)時(shí)延、丟包、擁塞的規(guī)律,及時(shí)重傳信息和控制傳輸速率,避免擁塞和浪費(fèi)帶寬資源?;趯W(xué)習(xí)的TCP加速技術(shù)不僅能夠提高數(shù)據(jù)傳輸速度,而且能保證大數(shù)據(jù)文件遠(yuǎn)距離傳輸?shù)男省?/p>
數(shù)據(jù)傳輸;效率;加速;準(zhǔn)確;機(jī)制
隨著網(wǎng)絡(luò)技術(shù)應(yīng)用范圍不斷擴(kuò)大和用戶數(shù)量逐漸增加,網(wǎng)絡(luò)應(yīng)用環(huán)境越來越復(fù)雜,網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)出現(xiàn)時(shí)延、丟包等現(xiàn)象越來越普遍,不僅降低了TCP的傳輸效率,而且也降低了帶寬資源的利用率。網(wǎng)絡(luò)狀況判斷不準(zhǔn)確、調(diào)整機(jī)制不合理是制約TCP加速的兩個(gè)重要因素?;趯W(xué)習(xí)的TCP加速技術(shù)借助智能學(xué)習(xí)手段,能準(zhǔn)確判斷網(wǎng)絡(luò)狀況,合理解決丟包、重傳與擁塞等問題,能提升TCP傳輸效率和帶寬利用率。
雖然TCP作為一種可靠的傳輸協(xié)議,得到廣泛運(yùn)用,但是由于TCP是為局域網(wǎng)開發(fā)的技術(shù),沒有充分考慮廣域網(wǎng)的應(yīng)用環(huán)境,導(dǎo)致TCP越來越不適應(yīng)當(dāng)前的網(wǎng)絡(luò)應(yīng)用環(huán)境[1]。具體表現(xiàn)在兩個(gè)方面:一是判斷和重傳機(jī)制不合理。傳統(tǒng)的TCP協(xié)議采取機(jī)械的判斷和重傳機(jī)制,在傳輸過程中,容易造成丟包、判斷延遲、誤判等問題。判斷機(jī)制以丟包為依據(jù),不僅容易加劇擁塞,而且擁塞恢復(fù)正常的時(shí)間較長;二是控制機(jī)制不合理。控制機(jī)制不合理,降低了網(wǎng)絡(luò)帶寬的有效利用率。以丟包作為判斷擁塞的依據(jù)、以及大窗口回退調(diào)整處理方式,導(dǎo)致TCP的吞吐量急速下滑,浪費(fèi)寬帶資源,降低遠(yuǎn)程數(shù)據(jù)傳輸效率,甚至使網(wǎng)絡(luò)無法使用。
針對(duì)TCP協(xié)議存在的問題,已經(jīng)發(fā)展了一系列TCP數(shù)據(jù)傳輸加速技術(shù)。根據(jù)加速方式的難易程度,把TCP數(shù)據(jù)傳輸加速技術(shù)劃分為三個(gè)技術(shù)[2]:一是并行傳輸技術(shù)。通過建立多個(gè)TCP連接,以并行的方式傳輸數(shù)據(jù),擴(kuò)大初始擁塞窗口,提升數(shù)據(jù)傳輸量。雖然這種加速技術(shù)可以減少帶寬浪費(fèi),提高傳輸效率,但是要受到網(wǎng)絡(luò)環(huán)境的影響,沒有從根本上解決TCP固有的問題;二是協(xié)議替換技術(shù)。在廣域網(wǎng)傳輸信道上,采用私有協(xié)議替換TCP協(xié)議,以克服網(wǎng)絡(luò)環(huán)境對(duì)私有協(xié)議傳輸?shù)挠绊?。雖然目前在主流加速技術(shù)中,普遍采用協(xié)議替換技術(shù),但是該技術(shù)存在私有協(xié)議信息容易被攔截的缺陷;三是協(xié)議優(yōu)化技術(shù)。通過開啟TCP擴(kuò)展功能,調(diào)節(jié)TCP傳輸窗口,改進(jìn)擁塞控制算法,既能克服TCP協(xié)議的固有缺陷,又能不改變TCP協(xié)議的交互過程。協(xié)議優(yōu)化技術(shù)使網(wǎng)絡(luò)適應(yīng)能力更強(qiáng),已經(jīng)成為TCP加速技術(shù)的發(fā)展趨勢(shì)。擁塞控制算法是TCP協(xié)議優(yōu)化的核心。協(xié)議優(yōu)化技術(shù)是依據(jù)時(shí)延變化判斷擁塞狀況,更符合網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)囊蟆?/p>
基于學(xué)習(xí)的TCP加速技術(shù),是通過構(gòu)建網(wǎng)絡(luò)狀態(tài)學(xué)習(xí)機(jī)制,記錄與TCP連接網(wǎng)絡(luò)的路徑特征,實(shí)時(shí)分析網(wǎng)絡(luò)變化情況,以發(fā)現(xiàn)丟包或擁塞的先兆,準(zhǔn)確判斷當(dāng)前的網(wǎng)絡(luò)狀態(tài),以確定合理的傳輸速率[4]。基于學(xué)習(xí)的TCP加速技術(shù)包含基于丟包判斷的重傳機(jī)制、以及基于擁塞判斷的處理機(jī)制。
在重復(fù)ACK+超時(shí)和判斷丟包的基礎(chǔ)上,采用TCP傳輸歷史智能學(xué)習(xí)算法,以丟包歷史信息特征作為參考,估計(jì)發(fā)出但尚未被確認(rèn)接收的數(shù)據(jù)包丟失概率。當(dāng)丟失概率值超過設(shè)定的閾值時(shí),傳輸?shù)臄?shù)據(jù)包信息丟失。這種方法能降低誤判TCP丟包的概率,能提高判斷丟包的準(zhǔn)確性,并在重傳機(jī)制的作用下,使數(shù)據(jù)傳輸恢復(fù)到正常狀態(tài),減少帶寬資源浪費(fèi)。
把網(wǎng)絡(luò)丟包和時(shí)延變化作為判斷鏈路擁塞的依據(jù),并通過智能傳輸歷史學(xué)習(xí)算法,對(duì)與TCP連接傳輸?shù)臍v史信息進(jìn)行統(tǒng)計(jì)分析,準(zhǔn)確識(shí)別丟包的原因,是因?yàn)閾砣麃G包,還是因?yàn)榉菗砣a(chǎn)生的隨機(jī)性丟包。在發(fā)生隨機(jī)性丟包時(shí),TCP發(fā)送窗口大小固定不變,以防止發(fā)送速率急劇下降,避免鏈路擁塞問題。在擁塞判斷的條件下,利用傳輸歷史智能學(xué)習(xí)算法,準(zhǔn)確判斷傳輸路徑的最大可用帶寬,以調(diào)整TCP的最大傳輸速率。在發(fā)生鏈路擁塞時(shí),結(jié)合發(fā)送窗口的歷史信息,選擇合適的回退窗口值。
目前,一方面,基于TCP協(xié)議的文件傳輸非常普遍;另一方面,跨網(wǎng)的大數(shù)據(jù)文件傳輸容易受到網(wǎng)絡(luò)環(huán)境影響,傳輸效率低。因此,雖然未來仍然要使用TCP協(xié)議傳輸數(shù)據(jù),但必須解決數(shù)據(jù)傳輸效率問題。首先,提高文件吞吐量、帶寬利用率、文件傳輸加速比。文件傳輸吞吐量是指單位時(shí)間內(nèi)成功傳輸?shù)臄?shù)據(jù)量,是衡量傳輸速率的指標(biāo);帶寬利用率是指文件傳輸吞吐量與物理帶寬的比值,用于衡量帶寬利用程度的指標(biāo);文件傳輸加速比是指在使用TCP加速技術(shù)前后兩個(gè)文件傳輸吞吐量的比值,用于衡量加速效果。利用基于學(xué)習(xí)的TCP加速器,能極大地提高傳輸速度,提高文件吞吐量、帶寬利用率、文件傳輸加速比等。其次,提高遠(yuǎn)距離、大數(shù)據(jù)文件的傳輸效率[3]。一般來說,遠(yuǎn)距離大數(shù)據(jù)文件傳輸?shù)臅r(shí)延為21—200ms,丟包率為5‰,全程物理帶寬瓶頸為100Mbps。使用基于學(xué)習(xí)的TCP加速技術(shù),能夠大大地提高傳輸吞吐量和帶寬利用率和傳輸加速比。例如,5GB的文件數(shù)據(jù)傳輸時(shí)間能夠從50分鐘減少到5分鐘,40GB的文件數(shù)據(jù)傳輸時(shí)間從7個(gè)多小時(shí)減少到45分鐘。
[1]謝希仁.計(jì)算機(jī)網(wǎng)絡(luò)(第五版)[M].北京:電子工業(yè)出版社,2008.
[2]彭娜.并行TCP在廣域網(wǎng)加速系統(tǒng)中的研究與實(shí)現(xiàn)[D].長沙:中南大學(xué),2009.
[3]張亞生,彭華,谷聚娟.衛(wèi)星TCP加速技術(shù)研究[J].無線電通信技術(shù),2010(5).
[4]文宏,向德生等.Fast TCP協(xié)議研究及性能分析[J].計(jì)算機(jī)工程與應(yīng)用,2006(11).
責(zé)任編輯 仇大勇
TP393
A
1674-5787(2016)06-0150-02
10.13887/j.cnki.jccee.2016(6).44
2016-09-25
劉丹(1982—),女,四川西充人,碩士,講師,研究方向:計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程。