多線程程序數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法研究綜述

2017-07-15 15:01禹振楊振蘇小紅王甜甜

智能計(jì)算機(jī)與應(yīng)用 2017年3期

禹振　楊振　蘇小紅　王甜甜

摘要：隨著軟件規(guī)模的日益增長(zhǎng)，多線程并發(fā)程序帶來的缺陷也很快蔓延開來。數(shù)據(jù)競(jìng)爭(zhēng)作為多線程并發(fā)程序中常見的問題，經(jīng)常會(huì)導(dǎo)致程序不能正常運(yùn)行，或更為嚴(yán)重地導(dǎo)致程序直接崩潰。數(shù)據(jù)競(jìng)爭(zhēng)產(chǎn)生的條件往往都比較隱蔽和苛刻，不僅需要特定的輸入，而且還需要特定的線程執(zhí)行交錯(cuò)。因此，數(shù)據(jù)競(jìng)爭(zhēng)很難被檢測(cè)出來。本文介紹了多線程數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證相關(guān)的研究現(xiàn)狀，并對(duì)已有的數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法在檢測(cè)能力以及檢測(cè)效率等方面做出比較、分析以及歸納。同時(shí)，對(duì)未來數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證相關(guān)的研究方向進(jìn)行了展望。

關(guān)鍵詞：多線程；數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)；數(shù)據(jù)競(jìng)爭(zhēng)驗(yàn)證

0引言

在這個(gè)多核硬件的時(shí)代，充分利用硬件帶來的優(yōu)勢(shì)，并發(fā)程序也大受歡迎并已進(jìn)入廣泛應(yīng)用中。時(shí)下，常見的Microsoft Windows或是Linux Ubuntu操作系統(tǒng)，或是Google Chrome網(wǎng)頁瀏覽器等均采用了多線程并發(fā)技術(shù)。比較流行的編程語言，如C/C++，Java和Python等也對(duì)并發(fā)程序有著良好的支持。

雖然多線程并發(fā)技術(shù)為人們提供了使用上的遍歷以及優(yōu)質(zhì)暢快的用戶體驗(yàn)和軟件交互，但是編寫多線程并發(fā)程序也是令許多開發(fā)者苦惱的事。在多線程并發(fā)程序中，由于對(duì)共享內(nèi)存空間訪問的隱蔽性以及并發(fā)線程執(zhí)行調(diào)度的隨機(jī)性，導(dǎo)致并發(fā)線程之間產(chǎn)生一些不確定的相互作用和影響。這些都給并發(fā)程序的分析帶來了現(xiàn)實(shí)嚴(yán)峻的挑戰(zhàn)，而且很容易導(dǎo)致多線程并發(fā)程序在設(shè)計(jì)上存在一些缺陷。這些缺陷往往較難調(diào)試和診斷，并且可能最終導(dǎo)致并發(fā)程序在運(yùn)行的過程中出現(xiàn)崩潰，從而造成嚴(yán)重的后果。

在并發(fā)程序的安全性缺陷中，主要包括：數(shù)據(jù)競(jìng)爭(zhēng)、原子性違背、順序違背和死鎖。具體地，數(shù)據(jù)競(jìng)爭(zhēng)是指對(duì)同一個(gè)共享內(nèi)存空間，存在若干并發(fā)訪問，并且至少有一個(gè)是寫訪問。原子性違背是指原來必須原子性執(zhí)行的指令序列，在并發(fā)交錯(cuò)的干擾下，其執(zhí)行的效果不與任何原子性指令序列的執(zhí)行效果相同，各個(gè)線程需保持的一致性遭到其他并發(fā)線程寫操作破壞。順序違背指的是一指令（組）沒有按照預(yù)期執(zhí)行，總是在另一（組）指令之前或是之后執(zhí)行。死鎖指的是某個(gè)線程集合中每一個(gè)線程都在等待該集合中的另一個(gè)線程釋放占有的互斥性資源，從而導(dǎo)致整體陷入循環(huán)等待狀態(tài)。研究分析可知，數(shù)據(jù)競(jìng)爭(zhēng)在上述常見的4種并發(fā)缺陷中占的比例較大，并且大部分是導(dǎo)致原子性違背和順序違背的根源。在圖1a）原子性違背實(shí)例中，L2和L3，以及L1和L3中對(duì)共享索引變量buf_index的訪問分別構(gòu)成數(shù)據(jù)競(jìng)爭(zhēng)：而在圖1b）順序違背實(shí)例中，L1和L2對(duì)共享變量mThread的訪問構(gòu)成數(shù)據(jù)競(jìng)爭(zhēng)。因此，如何準(zhǔn)確并且有效地檢測(cè)多線程并發(fā)程序中的數(shù)據(jù)競(jìng)爭(zhēng)缺陷即已成為頗具研究?jī)r(jià)值的重要課題。

目前已經(jīng)提出的數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法在不同程度上呈現(xiàn)有一定的不足。探討解析可得結(jié)論如下：

靜態(tài)檢測(cè)方法只需要分析程序源碼，但是缺少程序運(yùn)行時(shí)的信息，導(dǎo)致報(bào)告的數(shù)據(jù)競(jìng)爭(zhēng)大部分都是誤檢。動(dòng)態(tài)檢測(cè)方法監(jiān)視程序在執(zhí)行過程中的行為，收集必要的信息來判斷哪些訪問操作構(gòu)成數(shù)據(jù)競(jìng)爭(zhēng)，但是受限于線程執(zhí)行交錯(cuò)的不確定性以及收集到信息的不完整性，該方法依然會(huì)生成很多誤檢和漏檢。動(dòng)靜結(jié)合的方法雖然能夠彌補(bǔ)各自方法的一些缺陷，但是在源程序運(yùn)行過程中引入了大量的性能開銷，同時(shí)并沒有真正顯著提升數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)的精度。數(shù)據(jù)競(jìng)爭(zhēng)驗(yàn)證方法雖然能夠精準(zhǔn)地找到數(shù)據(jù)競(jìng)爭(zhēng)，但是該方法同時(shí)會(huì)造成大量的漏檢并且驗(yàn)證效率也比較低。

本文在綜合論述以往研究的基礎(chǔ)上，對(duì)已經(jīng)存在的數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法進(jìn)行了分析和比較，同時(shí)歸納提煉了這些方法的優(yōu)缺點(diǎn)。最后，討論給出了后續(xù)對(duì)于數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法在未來研究的重點(diǎn)展望。

1數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法的研究

迄今為止，已經(jīng)研究提出了很多數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證的方法，主要分為3類：靜態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法，動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法以及動(dòng)靜結(jié)合的數(shù)據(jù)競(jìng)爭(zhēng)驗(yàn)證方法。下面針對(duì)各類研究成果給出完整論述和設(shè)計(jì)解析。

1.1靜態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)

靜態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)主要是進(jìn)行鎖集分析，從而檢測(cè)數(shù)據(jù)競(jìng)爭(zhēng)。常用的靜態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)工具包括Warlock、RacerX、RELAY和Locksmith。其中，RacerX利用流敏感和過程間分析檢測(cè)數(shù)據(jù)競(jìng)爭(zhēng)和死鎖；Locksmith首先使用標(biāo)簽流約束和抽象控制流圖約束信息來進(jìn)行鎖集分析，然后使用標(biāo)簽流約束、抽象控制流圖約束和上下文敏感約束展開共享變量的分析，最后結(jié)合線性分析，檢測(cè)出數(shù)據(jù)競(jìng)爭(zhēng)；RELAY通過控制流圖和程序調(diào)用圖，采用自底向上的分析方式，首先進(jìn)行過程內(nèi)鎖集分析并緩存在函數(shù)標(biāo)簽中，然后開啟過程間鎖集分析，等到所有的線程相關(guān)的函數(shù)全部分析完畢，再判斷相關(guān)的共享變量是否產(chǎn)生數(shù)據(jù)競(jìng)爭(zhēng)。RELAY由于其擴(kuò)展性堪稱優(yōu)良，能夠應(yīng)用在百萬級(jí)別代碼量的程序上，因此，在實(shí)際使用過程中獲得了高度認(rèn)可與廣泛接受。

盡管靜態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)只需要分析程序源碼、監(jiān)測(cè)效率高并且基本不會(huì)有漏報(bào)，但由于其忽略了程序執(zhí)行過程中的一些happens-before關(guān)系，因此靜態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法得到的絕大部分都不是真正的數(shù)據(jù)競(jìng)爭(zhēng)。

1.2動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)

動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)算法主要分為基于lockset的算法、基于happens-before關(guān)系的算法以及兩者混合的hybrid算法三種。下面即順次概述各類方法的設(shè)計(jì)過程實(shí)現(xiàn)。

Savage等人提出基于lockset的動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法Eraser，該方法在程序執(zhí)行過程中維護(hù)每個(gè)線程當(dāng)前的鎖信息，同時(shí)更新共享變量持有的鎖信息，當(dāng)共享變量不再受到鎖保護(hù)的時(shí)候，報(bào)告數(shù)據(jù)競(jìng)爭(zhēng)。

Von和Elmas等在Eraser的基礎(chǔ)上對(duì)基于lockset算法的動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法進(jìn)行了精細(xì)和擴(kuò)展，使得能夠更加精確和有效地檢測(cè)對(duì)象級(jí)別的數(shù)據(jù)競(jìng)爭(zhēng)。

Netzer和Perkovic等基于Lamport的happens-before關(guān)系提出了使用邏輯時(shí)鐘來動(dòng)態(tài)地檢測(cè)數(shù)據(jù)競(jìng)爭(zhēng)。Happens-before關(guān)系是在多線程并發(fā)程序執(zhí)行的所有事件上的一種偏序關(guān)系。該關(guān)系要求同一個(gè)線程內(nèi)部按照時(shí)序邏輯順序執(zhí)行，而在線程間程序的執(zhí)行依賴于同步機(jī)制。一旦對(duì)一個(gè)共享內(nèi)存空間的訪問違背了happens-before關(guān)系，那么就會(huì)產(chǎn)生數(shù)據(jù)競(jìng)爭(zhēng)。

Pozniansky、Flanagan、Cai以及Ha等相繼提出了改進(jìn)后的基于happens-before關(guān)系的動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法。其中，Djit算法使用vector-clock的形式記錄線程和共享內(nèi)存空間訪問的邏輯時(shí)鐘，同時(shí)每一個(gè)時(shí)間幀中只記錄第一個(gè)對(duì)共享內(nèi)存空間的讀/寫訪問。FastTrack認(rèn)為在一個(gè)沒有數(shù)據(jù)競(jìng)爭(zhēng)故障的程序執(zhí)行過程中，對(duì)共享內(nèi)存空間的寫訪問是有序的，而只有多個(gè)線程對(duì)同一共享內(nèi)存空間進(jìn)行讀訪問才可能是并發(fā)進(jìn)行的。因此對(duì)于寫訪問可以采用輕量級(jí)的epoch形式的邏輯時(shí)鐘，而只有并發(fā)的讀訪問才會(huì)依然采用vector-clock形式的邏輯時(shí)鐘。Loft在FastTrack的基礎(chǔ)上提出一些場(chǎng)景來進(jìn)一步減少基于vector-clock的賦值和比較操作。iFr對(duì)FastTrack實(shí)施特別簡(jiǎn)化，不再需要遍歷vector-clock的每一項(xiàng)進(jìn)行分析，而只是關(guān)注left-most和right-most兩項(xiàng)，從而將讀寫訪問操作的數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)復(fù)雜度降低到了O（1）。

Poznianskv、Jannesari、Serebryan、Nethercote、Xie和Yu等分別提出了基于hvbrid的動(dòng)態(tài)數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)方法。MultiRace首先利用改進(jìn)的lockset算法找到可疑的數(shù)據(jù)競(jìng)爭(zhēng)，然后利用Diit+算法集中檢測(cè)可行的語句對(duì)是否真正是并發(fā)的。Helgrind+將線程順序執(zhí)行的操作序列約束在一個(gè)segment中，segment能夠反映線程和線程的邏輯時(shí)鐘。Helgrind+則先SHI進(jìn)行happens-before關(guān)系的分析找到所有潛在并發(fā)的segment，而后利用lockset算法驗(yàn)證共享內(nèi)存空間的訪問是否可由公共的鎖提供保護(hù)。ThreadSanitizer同樣使用segment來表示一個(gè)線程中連續(xù)執(zhí)行的內(nèi)存訪問事件（不包括同步事件）。Segment中第一個(gè)事件包含當(dāng)前segment中所有事件的上下文信息，同時(shí)維護(hù)2個(gè)鎖集合分別表示保護(hù)讀/寫持有的鎖集合LS和LS ThreadSanitizer設(shè)計(jì)配置了2個(gè)segment集合，SS和SS-分別表示并發(fā)的讀/寫segment集合。任何對(duì)共享內(nèi)存空間的訪問都會(huì)更新并迭代遍歷這2個(gè)segment集合，利用lockset算法實(shí)現(xiàn)數(shù)據(jù)競(jìng)爭(zhēng)。Acculock在開發(fā)中使用了epoch形式的邏輯時(shí)鐘進(jìn)行happens-before關(guān)系的分析，以此為基礎(chǔ)再利用Iockset算法給出驗(yàn)證。同時(shí)Acculock再次根據(jù)lockset的包含關(guān)系卓具實(shí)效地減少了冗余操作的分析。而且，MultiLock-HB又對(duì)Acculock算法中的固有缺陷切實(shí)引入了改進(jìn)，提升了檢測(cè)數(shù)據(jù)競(jìng)爭(zhēng)的能力。SimpleLock和SimpleLock+則是分別使用標(biāo)量變量lockcnt和布爾變量iszero來對(duì)lockset算法融合了優(yōu)化改進(jìn)，加快了可疑并發(fā)操作是否被公共鎖保護(hù)分析的過程。

智能計(jì)算機(jī)與應(yīng)用2017年3期

智能計(jì)算機(jī)與應(yīng)用的其它文章: 基于目的驅(qū)使—格子Boltzmann模型的高密度人群視頻穩(wěn)定性分析及風(fēng)險(xiǎn)預(yù)測(cè); 基于人臉區(qū)域特征相關(guān)性的視頻流人臉識(shí)別研究; 基于一種新的基團(tuán)編碼的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè); 基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉年齡分類; 基于HSV非均勻量化的CAMshift目標(biāo)跟蹤算法; 基于改進(jìn)模糊PID的導(dǎo)彈飛行軌跡誤差修正反饋控制

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

多線程程序數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)和驗(yàn)證方法研究綜述