国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

內(nèi)河船舶安全缺陷的要素關(guān)聯(lián)性

2016-10-12 05:39:10勇,強(qiáng)
中國航海 2016年3期
關(guān)鍵詞:項(xiàng)集安全檢查內(nèi)河

郝 勇, 黃 強(qiáng)

(1.武漢理工大學(xué),航運(yùn)學(xué)院, 武漢 430063; 2.國家水運(yùn)安全工程技術(shù)研究中心, 武漢 430063;3.湖北省內(nèi)河航運(yùn)技術(shù)重點(diǎn)實(shí)驗(yàn)室, 武漢 430063)

內(nèi)河船舶安全缺陷的要素關(guān)聯(lián)性

郝 勇1,2,3, 黃 強(qiáng)1,3

(1.武漢理工大學(xué),航運(yùn)學(xué)院, 武漢 430063; 2.國家水運(yùn)安全工程技術(shù)研究中心, 武漢 430063;3.湖北省內(nèi)河航運(yùn)技術(shù)重點(diǎn)實(shí)驗(yàn)室, 武漢 430063)

對內(nèi)河船舶安全缺陷之間隱含的關(guān)聯(lián)規(guī)則進(jìn)行研究,有助于準(zhǔn)確定位船舶缺陷,提高內(nèi)河船舶安全檢查水平及船公司安全自查質(zhì)量,保障水上交通安全。對此,基于長江海事局船舶安檢數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,并將其存入到數(shù)據(jù)庫中;采用Apriori算法開發(fā)關(guān)聯(lián)規(guī)則挖掘軟件進(jìn)行數(shù)據(jù)挖掘,并結(jié)合置信度對關(guān)聯(lián)規(guī)則進(jìn)行可靠性分析。結(jié)果表明,采用該方法可得到可靠的內(nèi)河船舶安全缺陷的關(guān)聯(lián)規(guī)則。

水路運(yùn)輸;內(nèi)河船舶;安全檢查;缺陷;關(guān)聯(lián)規(guī)則;數(shù)據(jù)挖掘;Apriori算法

Abstract: To discover the implicit association rules relating to the different safety defects of inland ship is useful to find the defects, therefore, to improve the safety inspection. A database based on the data of Inland Ship’s safety inspection from Changjiang Maritime Safety Administration and develops a software to mining safety defects association rules is developed with Apriori algorithm. The credibility of the association rules is examined with confidence degree check.

Keywords: waterway transportation; inland ship; safety inspection; defect; association rule; data mining; Apriori algorithm

船舶安全對保障水上人命和財(cái)產(chǎn)安全,防止船舶造成水域污染有著重要的意義。內(nèi)河船舶安全檢查作為保障船舶安全的重要手段越來越受重視,但目前內(nèi)河船舶安檢員工作繁重、業(yè)務(wù)能力參次不齊,安全檢查以抽查為主,難以準(zhǔn)確發(fā)現(xiàn)安全缺陷,亟需科學(xué)的方法提升安檢效率。目前海事管理機(jī)構(gòu)有大量船舶安全檢查缺陷數(shù)據(jù),若缺陷之間存在隱含的關(guān)聯(lián)性,則可通過該性質(zhì)快速找到更多的安全缺陷,進(jìn)而提高船舶安檢效率,監(jiān)督船舶的適航性;船公司也可利用該性質(zhì)提高安全自查的質(zhì)量。

在船舶安全檢查中,若發(fā)現(xiàn)某項(xiàng)缺陷時(shí)另一項(xiàng)缺陷在高于一定概率的情況下同時(shí)被發(fā)現(xiàn),則稱兩缺陷間的這種關(guān)聯(lián)性關(guān)系為船舶安全缺陷的關(guān)聯(lián)規(guī)則。目前已有大量針對港口國監(jiān)督(Port State Control,PSC)的船舶缺陷關(guān)聯(lián)規(guī)則的研究,HNNINEN等[1]使用貝葉斯網(wǎng)絡(luò)模型對芬蘭PSC檢查數(shù)據(jù)和事故進(jìn)行關(guān)聯(lián)規(guī)則研究,分析導(dǎo)致事故發(fā)生的缺陷指標(biāo)。然而,要得到一個(gè)好的貝葉斯網(wǎng)絡(luò)模型需比較復(fù)雜的訓(xùn)練,數(shù)據(jù)挖掘以其能從海量數(shù)據(jù)中高效地發(fā)現(xiàn)潛在信息而得到越來越廣泛的應(yīng)用。[2-3]中國港口國監(jiān)督數(shù)據(jù)管理中心[4]對PSC檢查缺陷及滯留缺陷等數(shù)據(jù)進(jìn)行詳細(xì)的統(tǒng)計(jì)分析,但不能發(fā)現(xiàn)缺陷間深層的隱含關(guān)系。戴耀存等[5]采用頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的方式對港口國監(jiān)督滯留缺陷進(jìn)行關(guān)聯(lián)規(guī)則研究,通過統(tǒng)計(jì)缺陷關(guān)聯(lián)規(guī)則數(shù)量得到導(dǎo)致船舶滯留的重要缺陷。

上述研究未涉及內(nèi)河船舶安全缺陷,且多側(cè)重于安全缺陷本身,未能就缺陷間的關(guān)系進(jìn)行關(guān)聯(lián)性研究。對此,基于長江海事局轄區(qū)內(nèi)河船舶安全檢查數(shù)據(jù),研究發(fā)現(xiàn)適用于內(nèi)河船舶安全缺陷的數(shù)據(jù)挖掘方法。該方法以內(nèi)河船舶安全檢查數(shù)據(jù)的挖掘過程為落腳點(diǎn),在此過程中解析數(shù)據(jù)內(nèi)涵,確定安全缺陷挖掘?qū)ο蠛蛿?shù)據(jù)形式;采用Apriori算法設(shè)計(jì)內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則挖掘軟件,進(jìn)行數(shù)據(jù)挖掘;對挖掘結(jié)果進(jìn)行定量評估,驗(yàn)證內(nèi)河船舶安全缺陷之間的關(guān)聯(lián)性,并加以探討和應(yīng)用。

1 內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則挖掘算法

采用數(shù)據(jù)挖掘中的量化型關(guān)聯(lián)規(guī)則挖掘形式,運(yùn)用Apriori算法[6]對經(jīng)過處理的船舶安全缺陷數(shù)據(jù)進(jìn)行挖掘。Apriori算法按目標(biāo)項(xiàng)集從小到大的順序?qū)ふ翌l繁項(xiàng)集。

假設(shè)樣本數(shù)據(jù)集D為內(nèi)河船舶安全缺陷項(xiàng)代碼記錄,每個(gè)項(xiàng)集表示一次安全檢查的缺陷代碼項(xiàng)集,其示例見表1。

表1 樣本數(shù)據(jù)集D示例

“事務(wù)”是指船舶安檢過程中所有缺陷項(xiàng)目的集合,每個(gè)事務(wù)都有一個(gè)唯一標(biāo)志編號,如表1中的每個(gè)事務(wù)為一個(gè)船舶安全缺陷代碼集合;事務(wù)數(shù)據(jù)庫D={No1,No2,…,Non}由一系列具有唯一標(biāo)志的事務(wù)組成;“項(xiàng)”是指事務(wù)數(shù)據(jù)庫的一個(gè)屬性字段,在該數(shù)據(jù)集中是指某個(gè)船舶安全缺陷代碼;“項(xiàng)集”是指包含若干個(gè)項(xiàng)的集合。

Apriori算法的第一次遍歷找出所有項(xiàng)的候選頻繁項(xiàng)集的集合C1,由最小支持度確定候選頻繁項(xiàng)集的集合L1;然后遍歷迭代,在第k次迭代中找到上次迭代的頻繁項(xiàng)集的集合Lk-1和本次迭代的候選項(xiàng)集的集合Ck,為Ck的每個(gè)項(xiàng)目集分配初始值為零的計(jì)數(shù)器以保存其支持度。掃描數(shù)據(jù)集D中的事務(wù),若Ck中的項(xiàng)目集在其中一個(gè)事務(wù)中出現(xiàn),則該項(xiàng)目集計(jì)數(shù)器數(shù)值加1;在數(shù)據(jù)集D掃描結(jié)束后可得到Ck中各項(xiàng)集的支持度,根據(jù)最小支持度可確定其頻繁項(xiàng)集,繼續(xù)迭代,直到不能生成新的頻繁項(xiàng)集為止。

Apriori算法具有算法簡單和數(shù)據(jù)量少時(shí)性能好的優(yōu)點(diǎn),但在項(xiàng)集關(guān)系復(fù)雜且數(shù)量相對較多時(shí)將增加數(shù)據(jù)的空間復(fù)雜度,進(jìn)而影響算法的效率。該研究的缺陷數(shù)據(jù)量相對較少且關(guān)系簡單,適宜采用該算法。

2 內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則挖掘方法

在數(shù)據(jù)挖掘過程中,采用適當(dāng)?shù)姆绞竭M(jìn)行數(shù)據(jù)處理和識別是數(shù)據(jù)挖掘的基礎(chǔ)及關(guān)鍵,但由于原始數(shù)據(jù)的特征和挖掘目標(biāo)不盡相同,需針對內(nèi)河船舶缺陷數(shù)據(jù)采用合適的數(shù)據(jù)挖掘方法。對此,首先將具體的船舶安檢缺陷項(xiàng)目數(shù)字化,然后進(jìn)行數(shù)據(jù)去噪和分類得到有價(jià)值的信息,最后根據(jù)需求反饋調(diào)整數(shù)據(jù)集形式,以得到適宜挖掘的數(shù)據(jù)。[7]用關(guān)系數(shù)據(jù)庫管理系統(tǒng)(Relational Database Management System,RDBMS)技術(shù)將數(shù)據(jù)集轉(zhuǎn)換成數(shù)據(jù)庫形式來存儲,并借助專門軟件挖掘關(guān)聯(lián)規(guī)則。整個(gè)數(shù)據(jù)挖掘過程以知識發(fā)現(xiàn)模式進(jìn)行。[8]

2.1數(shù)據(jù)準(zhǔn)備

2.1.1目標(biāo)數(shù)據(jù)集成和選擇

從原始數(shù)據(jù)中提取有效的目標(biāo)數(shù)據(jù)是進(jìn)行關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的基礎(chǔ)。首先從各分支海事局內(nèi)河船舶安全檢查數(shù)據(jù)中提取出原始船舶安全缺陷數(shù)據(jù)信息,進(jìn)行統(tǒng)計(jì),分析其宏觀規(guī)律;隨后以研究需求為驅(qū)動,從原始數(shù)據(jù)中提取出有用數(shù)據(jù)組,解決數(shù)據(jù)語義的模糊性問題,處理數(shù)據(jù)可能存在的缺失和噪聲,從而縮小數(shù)據(jù)處理范圍。[9]

該研究的數(shù)據(jù)來自于2010年長江海事局各分支局檢查的22艘船舶的安全檢查記錄。對其中的缺陷項(xiàng)進(jìn)行分類統(tǒng)計(jì),形成原始船舶安檢數(shù)據(jù)集,繪制成頻數(shù)分布圖(見圖1),其中橫軸為船舶安檢缺陷代碼,其間每個(gè)數(shù)字標(biāo)志表示一項(xiàng)缺陷大類代碼,每條柱狀圖表示缺陷大類中一個(gè)缺陷的頻數(shù)。

圖1 船舶安全檢查原始缺陷數(shù)據(jù)頻數(shù)分布圖

由圖1可知,由于安全缺陷項(xiàng)種類較多,缺陷出現(xiàn)的頻數(shù)都比較低,因此難以采用數(shù)據(jù)挖掘的方法尋找到高支持度的項(xiàng)集。對此,將船舶安檢缺陷按大類來分類。[10]例如,缺陷0120符合證明(Document of Compliance,DOC)副本和缺陷0130最低安全配員證書統(tǒng)一歸為0100船舶證書及有關(guān)文件大類中。內(nèi)河船舶安全檢查主要缺陷分類見表2。

表2 內(nèi)河船舶安全檢查主要缺陷分類

根據(jù)船舶安檢項(xiàng)目大類進(jìn)行分類之后,得到處理后船舶安全檢查缺陷數(shù)據(jù)頻數(shù)分布圖(見圖2)。

圖2 處理后船舶安全檢查缺陷數(shù)據(jù)頻數(shù)分布圖

由圖2可知,采用大類統(tǒng)計(jì)后,缺陷頻數(shù)都有提高,高頻缺陷都集中在0700和1400附近。數(shù)據(jù)經(jīng)過歸類處理,復(fù)雜程度降低,規(guī)律更加明顯,便于后期對數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘。但是,基于頻數(shù)統(tǒng)計(jì)得到的只是簡單的規(guī)律,難以在大量數(shù)據(jù)中找到隱含規(guī)律。

2.1.2目標(biāo)數(shù)據(jù)轉(zhuǎn)換

經(jīng)過上述分析,確定數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù),即缺陷大類。由于該研究的目標(biāo)是尋找高頻關(guān)聯(lián)缺陷項(xiàng)集,因此低頻項(xiàng)可當(dāng)作數(shù)據(jù)噪聲剔除。對長江海事局各分支海事局的船舶安檢數(shù)據(jù)進(jìn)行匯總,剔除低頻數(shù)據(jù)之后按照頻率排序,統(tǒng)計(jì)出10個(gè)高頻缺陷大類候選項(xiàng)(見表3)。為保證數(shù)據(jù)挖掘能得到最有用的結(jié)果,避免產(chǎn)生過多無用的候選集而影響數(shù)據(jù)挖掘算法的效率[11],對每艘船舶的安檢記錄中屬于這10個(gè)高頻缺陷大類的缺陷集合進(jìn)行統(tǒng)計(jì),得到的缺陷信息集合即為數(shù)據(jù)挖掘的原始樣本集。

表3 主要缺陷信息列表

若將大量船舶安全缺陷信息直接存儲到數(shù)據(jù)庫中進(jìn)行分析,則不僅在查詢設(shè)計(jì)上語句復(fù)雜、時(shí)間復(fù)雜度高,而且對計(jì)算性能有很高的要求。因此,需對缺陷信息進(jìn)行抽象轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換的目的是對數(shù)據(jù)進(jìn)行降維處理,找到真正有用的特征,減少數(shù)據(jù)挖掘時(shí)的變量個(gè)數(shù)。[12]基于該思想,定義船舶安檢過程中所有高頻缺陷大類的集合為事務(wù),將現(xiàn)實(shí)的船舶安檢缺陷事務(wù)抽象為數(shù)字形式的代碼集合,去除船名、船型等信息,以減少數(shù)據(jù)挖掘時(shí)要考慮的因素,并克服數(shù)據(jù)挖掘工具的局限性。[13]由此,將原始樣本集的船舶安檢缺陷信息進(jìn)一步抽象為0~9這10個(gè)數(shù)字的代碼集合,每個(gè)抽象代碼對應(yīng)一個(gè)船舶安檢大類代碼;在各個(gè)事務(wù)中消除重復(fù)的項(xiàng)形成缺陷項(xiàng)集,并賦予唯一的事務(wù)標(biāo)志數(shù)字,格式為{事務(wù)標(biāo)志(No);項(xiàng)集(ITEM)}(如{1;1,2,7,8,9}),將這樣的信息存至數(shù)據(jù)庫中。至此,將數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)挖掘所需的格式,完成數(shù)據(jù)挖掘前的數(shù)據(jù)準(zhǔn)備工作。

2.2數(shù)據(jù)挖掘

2.2.1內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則挖掘軟件

為更好地進(jìn)行數(shù)據(jù)存儲,數(shù)據(jù)庫采用RDBMS技術(shù),使用SQL Server進(jìn)行內(nèi)河船舶缺陷數(shù)據(jù)庫開發(fā)。由于SQL語言[14]難以實(shí)現(xiàn)靈活深入的數(shù)據(jù)分析表達(dá),因此開發(fā)內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則挖掘軟件,采用C#語言連接數(shù)據(jù)庫接口調(diào)用數(shù)據(jù),通過可視化界面簡化數(shù)據(jù)挖掘操作,并提供直觀的結(jié)果展示界面。程序運(yùn)行和結(jié)果演示見圖3。

圖3 數(shù)據(jù)挖掘程序運(yùn)行和結(jié)果演示

內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則挖掘軟件首先通過連接內(nèi)河船舶缺陷數(shù)據(jù)庫調(diào)用船舶缺陷數(shù)據(jù),利用Apriori算法找到數(shù)據(jù)中的所有缺陷項(xiàng)并將其形成候選缺陷項(xiàng)集合Ck;然后根據(jù)這些缺陷項(xiàng)在每艘船舶中出現(xiàn)的次數(shù),在計(jì)數(shù)器COUNT中進(jìn)行初次賦值,刪除集合中低于支持度的項(xiàng),形成頻繁項(xiàng)集Lk;最后通過迭代,找到在所有船舶中出現(xiàn)頻率高于支持度的缺陷項(xiàng)集,并在軟件界面中以頻繁項(xiàng)集展示。

2.2.2挖掘結(jié)果

由于該研究旨在對船舶缺陷項(xiàng)進(jìn)行關(guān)聯(lián)分析,以獲取其中隱含的關(guān)聯(lián)規(guī)則,因此需選擇項(xiàng)集的支持度最小值,以確定頻繁項(xiàng)集。支持度的定義如下。

假定X是一個(gè)項(xiàng)集,D是一個(gè)事務(wù)集合或事務(wù)數(shù)據(jù)庫,稱D中包含X的缺陷個(gè)數(shù)與D中總的缺陷個(gè)數(shù)之比為X在D中的支持度,記作Support(X)[7],即

(1)

取0.2~0.5內(nèi)的支持度進(jìn)行數(shù)據(jù)挖掘測試,得到支持度與頻繁項(xiàng)集統(tǒng)計(jì)圖(見圖4)。

圖4 支持度與頻繁項(xiàng)集統(tǒng)計(jì)圖

由圖4可知:在取支持度為0.3時(shí),頻繁項(xiàng)集個(gè)數(shù)為13,數(shù)量較多且支持度不高;在取支持度為0.5時(shí),只有一個(gè)頻繁項(xiàng)集,難以進(jìn)行分析比較;在取支持度為0.4時(shí),支持度較高且有多樣的關(guān)聯(lián)規(guī)則。因此,取支持度為0.4進(jìn)行數(shù)據(jù)挖掘。[15]統(tǒng)計(jì)支持度在0.4時(shí)挖掘到的結(jié)果(見表4)。

表4 頻繁項(xiàng)集

2.3結(jié)果分析

對于一個(gè)項(xiàng)集X,若其支持度不小于最小支持度,則稱X為頻繁項(xiàng)集,在得到船舶安檢缺陷的頻繁項(xiàng)集后,需將抽象的數(shù)據(jù)還原為客觀的船舶安全缺陷進(jìn)行解釋和評價(jià)。

表4中,只含有1項(xiàng)的項(xiàng)集為高頻缺陷項(xiàng);含有2個(gè)及2個(gè)以上項(xiàng)的項(xiàng)集為頻繁項(xiàng)集,為該研究的重點(diǎn)。項(xiàng)集{1,4}即消防設(shè)備和主動力及輔助設(shè)備,這2項(xiàng)缺陷的關(guān)聯(lián)規(guī)則的支持度最高,為0.62,表明其在一艘船舶的安檢過程中同時(shí)出現(xiàn)的概率高達(dá)62%??蓳?jù)此規(guī)劃下一步檢查目標(biāo),或作為判定船舶不符合初步檢查要求的依據(jù)等。

為進(jìn)一步研究這2項(xiàng)缺陷的規(guī)律,引入置信度進(jìn)行分析。置信度定義為:對形如X→Y的關(guān)聯(lián)規(guī)則,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)及后繼,其中X和Y都是項(xiàng)集,規(guī)則的置信度為事務(wù)集合D中既包含X也包含Y的事務(wù)個(gè)數(shù)與D中包含X的個(gè)數(shù)之比,記作Confidence(X→Y)[7],即

(2)

以項(xiàng)集{1,4}為例,根據(jù)置信度定義得:Confidence(1→4)=86.7%;Confidence(4→1)=68.4%。

由于關(guān)聯(lián)規(guī)則(1→4)有更高的置信度,因此可認(rèn)為規(guī)則(1→4)為項(xiàng)集{1,4}唯一的關(guān)聯(lián)規(guī)則,即在船舶安檢中若出現(xiàn)缺陷項(xiàng)1,則當(dāng)0700消防設(shè)備有缺陷時(shí),檢測1400主動力及輔助設(shè)備有缺陷的概率高達(dá)86.67%。由此,通過關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘可得出結(jié)論:當(dāng)消防設(shè)備出現(xiàn)缺陷時(shí),主動力及輔助設(shè)備也很可能出現(xiàn)缺陷。

統(tǒng)計(jì)支持度為0.4時(shí)各頻繁項(xiàng)集的置信度,結(jié)果見表5。

為保證關(guān)聯(lián)規(guī)則的有效性,取支持度為0.4,最小置信度為60%的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),將數(shù)據(jù)制作成關(guān)聯(lián)規(guī)則路徑圖(見圖5)。

表5 關(guān)聯(lián)規(guī)則置信度

圖5 關(guān)聯(lián)規(guī)則路徑圖

圖5中,置信度大于80%的關(guān)聯(lián)規(guī)則為(1→4),(9→4)和(8→4),即出現(xiàn)消防設(shè)備缺陷及ISM/NSM/安全制度或操作性檢查缺陷時(shí),都會有>80%的概率出現(xiàn)主動力及輔助設(shè)備缺陷。

當(dāng)置信度>60%時(shí),根據(jù)最大置信度進(jìn)行路徑選擇可得關(guān)聯(lián)規(guī)則(9→4→1)和(8→4→1),即在內(nèi)河船舶安全檢查時(shí),當(dāng)出現(xiàn)ISM/NSM/安全制度缺陷或操作性檢查缺陷時(shí),繼續(xù)檢查主動力和輔助設(shè)備,其會有83.3%的概率出現(xiàn)缺陷;再繼續(xù)檢查消防設(shè)備缺陷,其產(chǎn)生缺陷的概率達(dá)68.4%。

至此,通過關(guān)聯(lián)規(guī)則挖掘的方法找到可靠性較高的內(nèi)河船舶安全缺陷關(guān)聯(lián)規(guī)則,證明內(nèi)河船舶安全缺陷之間存在關(guān)聯(lián)性,可用于指導(dǎo)船舶安全檢查。

3 結(jié)束語

基于數(shù)據(jù)挖掘理論、內(nèi)河船舶安全檢查的實(shí)際情況和長江海事局的船舶安檢數(shù)據(jù),研究得到適用的內(nèi)河船舶關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法。對該方法進(jìn)行數(shù)據(jù)挖掘和分析,得到以下結(jié)論。

1) 內(nèi)河船舶的安全缺陷之間存在關(guān)聯(lián)性。例如,當(dāng)產(chǎn)生消防設(shè)備缺陷時(shí),主動力及輔助設(shè)備有較高的概率也同時(shí)產(chǎn)生缺陷。

2) 存在支持度較高的關(guān)聯(lián)規(guī)則,即該類規(guī)則下缺陷同時(shí)產(chǎn)生的概率較高,可重點(diǎn)檢查該類缺陷,避免隨機(jī)抽查安檢效率不高的問題。

3) 某些缺陷形成的關(guān)聯(lián)規(guī)則存在較高的置信度,在安檢過程中發(fā)現(xiàn)該類缺陷時(shí)可通過高置信度的關(guān)聯(lián)規(guī)則迅速找到其他缺陷。

由于目前內(nèi)河船舶安檢數(shù)據(jù)有限,因此該研究對船舶安檢大類進(jìn)行數(shù)據(jù)挖掘并建立關(guān)聯(lián)規(guī)則旨在研究適用于內(nèi)河船舶安全檢查的數(shù)據(jù)挖掘方法及驗(yàn)證船舶缺陷間是否存在關(guān)聯(lián)性。隨著數(shù)據(jù)逐漸豐富,可對細(xì)分的缺陷項(xiàng)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,或引入滯留、事故參數(shù),為船舶安全檢查工作提供更好的技術(shù)決策支持。

[2] 劉曉葳,朱建平.大數(shù)據(jù)內(nèi)涵的挖掘角度辨析[J].中國統(tǒng)計(jì),2013(4):59-61.

[3] 滕廣青,毛英爽.國外數(shù)據(jù)挖掘應(yīng)用研究與發(fā)展分析[J]. 統(tǒng)計(jì)研究,2005(12):68-70.

[4] 中國港口國監(jiān)督數(shù)據(jù)管理中心. 2012年中國港口國監(jiān)督數(shù)據(jù)分析年報(bào)[EB/OL]. [2013-05-10](2013-12-07).http://www.moc.gov.cn/zizhan/zhishuJG/haishiju/chuanbojiandu/201305/P020130523308494046 599.pdf.

[5] 戴耀存,陳興偉,陳雪峰.船舶港口國檢查的滯留原因分析[J].中國航海,2010,33(3):64-68.

[6] 梁靜國.決策支持系統(tǒng)與決策知識發(fā)現(xiàn)[M].哈爾濱:哈爾濱工程大學(xué)出版社,2007:207-215.

[7] 胡可云,田鳳占,黃厚寬. 數(shù)據(jù)挖掘理論與應(yīng)用[M].北京:北京交通大學(xué)出版社, 2008:4-12,103-106.

[8] FAYYAD U.From Data Mining to Knowledge Discovery in Databases[J]. AI Magazine, 1996,17(3):37-54.

[9] 熊平.基于雜度削減的連續(xù)屬性離散化方法[J].統(tǒng)計(jì)與決策,2012(5):35-37.

[10] 陳晶,金永興,袁建中,等. PSC數(shù)據(jù)中船齡與缺陷相關(guān)性的可視化挖掘[J]. 船舶工程,2013,35(5):109-111.

[11] SZCZUKA M, SOSNOWSKI L, KRASUSKI A, et al. Using Domain Knowledge in Initial Stages of KDD: Optimization of Compound Object Processing[J]. Fundamenta Informaticae,2014,129(4): 341-364.

[12] 史忠植.知識發(fā)現(xiàn)[M].2版.北京:清華大學(xué)出版社,2011:2-5.

[13] 黃常海,高德毅,胡甚平,等.基于Apriori算法的船舶交通事故關(guān)聯(lián)規(guī)則分析[J]. 上海海事大學(xué)學(xué)報(bào),2014,35(3):18-22.

[14] 覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.

[15] 劉正江,吳兆麟.基于船舶碰撞事故調(diào)查報(bào)告的人的因素?cái)?shù)據(jù)挖掘[J].中國航海,2004(2):1-6.

AssociationAmongSafetyDefectsforInlandShip

HAOYong1,2,3,HUANGQiang1,3

(1. School of Navigation, Wuhan University of Technology, Wuhan 430063, China;2. National Engineering Research Center for Water Transport Safety, Wuhan 430063, China;3. Hubei Key Laboratory of Inland Shipping Technology, Wuhan 430063, China)

U691+.6;U698

A

2016-04-15

郝 勇(1966—),男,湖北潛江人,副教授,博士,主要從事海事管理和水上交通工程教學(xué)與研究。E-mail:marinehao@126.com

1000-4653(2016)03-0077-05

猜你喜歡
項(xiàng)集安全檢查內(nèi)河
丹陽市開展汛前安全檢查 筑牢汛期安全防線
“執(zhí)法+審計(jì)+專家”宜興市探索審計(jì)式安全檢查新模式
如何提高內(nèi)河船舶應(yīng)急部署執(zhí)行有效性
水上消防(2019年3期)2019-08-20 05:46:06
安全檢查表法在轎廂意外移動風(fēng)險(xiǎn)控制中的應(yīng)用
從機(jī)場的安全檢查談起……
內(nèi)河集散船艙口角隅甲板應(yīng)力分析
船海工程(2015年4期)2016-01-05 15:53:28
關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
卷宗(2014年5期)2014-07-15 07:47:08
內(nèi)河搜救風(fēng)險(xiǎn)評估模型
中國航海(2014年1期)2014-05-09 07:54:27
基于模糊規(guī)則庫和證據(jù)推理的內(nèi)河通航風(fēng)險(xiǎn)評價(jià)
中國航海(2014年1期)2014-05-09 07:54:23
一種頻繁核心項(xiàng)集的快速挖掘算法
广平县| 老河口市| 舞钢市| 波密县| 安岳县| 梁山县| 东辽县| 出国| 兰考县| 兴安盟| 固始县| 广南县| 呼图壁县| 上栗县| 宜宾市| 张掖市| 临西县| 镇宁| 昆明市| 龙门县| 全南县| 鹤岗市| 安图县| 麦盖提县| 阿拉善左旗| 武夷山市| 虞城县| 灯塔市| 华坪县| 明水县| 昌宁县| 玉田县| 蓬安县| 北票市| 南丹县| 清苑县| 依安县| 射阳县| 宁都县| 吉水县| 通州区|