国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于兩步聚類算法的船舶交通事故分析

2022-10-21 02:26高鴻飛上海海事大學(xué)上海201306
中國海事 2022年9期
關(guān)鍵詞:聚類種類交通事故

文 高鴻飛(上海海事大學(xué),上海 201306)

一、引言

海上交通安全具有重要意義,而船舶交通事故時有發(fā)生,造成人身傷亡,船舶、貨物、港口等損壞,以及海洋環(huán)境污染。為預(yù)防和控制事故的發(fā)生,國家水上交通安全管理機(jī)關(guān)制定了一系列相關(guān)的公約、規(guī)則、法律、法規(guī)及其他規(guī)范性文件,然而仍未能有效控制事故發(fā)生,重大事故仍然存在。

國內(nèi)外學(xué)者運用了多種方法對船舶交通事故進(jìn)行分析。張逸飛等[1]利用自回歸綜合移動平均模型與反饋神經(jīng)網(wǎng)絡(luò)的組合預(yù)測方法(ARIMA-BP)構(gòu)建船舶交通事故預(yù)測模型,探究船舶交通事故隨年份變化的規(guī)律;葉子陽等[2]利用貝葉斯網(wǎng)絡(luò)分析內(nèi)河船舶交通事故,探究不同事故類型與各方面影響因素之間的關(guān)系;張鋒等[3]提出了一種關(guān)聯(lián)規(guī)則模型,挖掘船舶事故間的強(qiáng)關(guān)聯(lián)規(guī)則并分析事故原因;于佳佳等[4]分別運用系統(tǒng)聚類分析法、離差平方和聚類準(zhǔn)則分析影響碰撞事故的因素,提出了船舶碰撞后果分析模型,得出了碰撞時排水量、碰撞角度、碰撞速度、碰撞位置對碰撞損失結(jié)果影響最為顯著的結(jié)論;鄔惠國等[5]利用模糊聚類的算法,建立碰撞危險度的分類模型,使危險度變得更加直觀。然而,上述研究缺少對事故變量相關(guān)性的研究,通過引入兩步聚類算法,以近六年的船舶交通事故為樣本,建立聚類模型,挖掘事故種類與事故原因的相關(guān)性以及事故種類、傷亡數(shù)、損失等級的相關(guān)性。

二、數(shù)據(jù)采集及統(tǒng)計分析

事故原始數(shù)據(jù)來源于我國海事局管轄水域的船舶交通事故數(shù)據(jù)。以近六年的事故數(shù)據(jù)為基礎(chǔ)進(jìn)行分析,統(tǒng)計范圍為2013年3月20日至2019年12月30日,對所有事故逐次進(jìn)行統(tǒng)計。由于事故具體信息較多,主要選取事故時間、事故種類、死亡數(shù)、事故等級、具體原因等屬性作為數(shù)據(jù)挖掘的對象。最終保留739條數(shù)據(jù)作為聚類分析的原始數(shù)據(jù),詳見表1。

表1 數(shù)據(jù)庫(部分)

續(xù)表

(一)事故種類分析

船舶交通事故是指船舶發(fā)生碰撞、擱淺、觸礁、觸損、浪損、風(fēng)災(zāi)、火災(zāi)及其他造成財產(chǎn)和營業(yè)損失或人身傷亡的交通事故[3]。因此,收集數(shù)據(jù)時將事故種類分為碰撞、風(fēng)災(zāi)、火災(zāi)/爆炸、擱淺、觸礁、觸碰、自沉,其余歸為其他。對事故種類進(jìn)行統(tǒng)計分析得出,碰撞事故401起(54.2%);自沉事故106起(4.3%);風(fēng)災(zāi)30起(4.05%);火災(zāi)/爆炸27起(3.65%);觸碰事故23起(3.11%);觸礁事故20起(2.7%);擱淺事故11起(1.48%);其他類事故121起(16.3%),詳見表2。

表2 事故種類統(tǒng)計

(二)事故船舶類型分析

事故涉及船舶種類繁多,主要分為以下10類,多用途船、干雜貨船、工程船、集裝箱船、客船、散貨船、砂石運輸船舶、油船和危險品船、漁船、其他船舶。事故多發(fā)主要是干雜貨船、散貨船、漁船和砂石運輸船舶,分別為223、180、61、48起,占比分別為30%、24%、8%、6%,詳見表3。

表3 事故船舶類型統(tǒng)計

(三)事故發(fā)生時間段分析

以4個小時為時間間隔,統(tǒng)計各時段內(nèi)發(fā)生的事故數(shù)。由表4可知,16點至次日凌晨4點為事故多發(fā)時段。其中16點至20點、20點至0點和0點至4點發(fā)生事故分別為139、131、160起,總事故數(shù)的占比分別為18.8%、17.7%、21.6%,詳見表4。

表4 事故發(fā)生時間統(tǒng)計

三、兩步聚類算法

(一)算法描述

聚類算法是聚類分析的核心,聚類分析是根據(jù)劃分對象的某些類似的特點,將抽象集合或是物理集合劃分為多個不同的類別[6]。通過使用數(shù)據(jù)挖掘軟件(IBM SPSS MODELER 15.0)進(jìn)行分析,MODELER中的聚類方法有快速聚類/K均值聚類(K-means)、兩步聚類和自組織特征映射的網(wǎng)絡(luò)(Kohonen)。由于兩步聚類具有自動確定聚類數(shù)、診斷樣本的離群點和噪聲數(shù)據(jù)且能同時處理數(shù)值型變量和分類型變量的特點,進(jìn)而運用兩步聚類實現(xiàn)數(shù)據(jù)分析。

兩步聚類是一種改進(jìn)的利用層次方法的平衡迭代規(guī)約和聚類(BIRCH,Balanced Iterative Reducing and Clustering using Hierarchies)算法[7]。顧名思義,兩步聚類通過2個步驟進(jìn)行數(shù)據(jù)分析——預(yù)聚類和聚類。預(yù)聚類步驟通過BIRCH算法構(gòu)建和修改聚類特征樹(Clustering Feature Tree)實現(xiàn)數(shù)據(jù)的初始?xì)w類[8]。聚類步驟通過對數(shù)似然函數(shù)對預(yù)聚類步驟的結(jié)果進(jìn)行再聚類,從而得到合適的聚類集合[9]。

(二)聚類過程

由于變量較多,為了提高聚類分析結(jié)果的準(zhǔn)確性,運用兩個聚類模型進(jìn)行數(shù)據(jù)分析,運用事故具體原因、事故種類的聚類模型,以及事故種類、傷亡數(shù)、損失等級的聚類模型。

1. 事故種類與事故具體原因的相關(guān)性

以“航行操作過失”“船舶條件”“潛在缺陷”“自然災(zāi)害”“事故種類”作為輸入變量。各聚類大小見圖1,最終聚成5類:聚類1包含122個樣本(16.5%);聚類2包含103個樣本(13.9%);聚類3包含197個樣本(26.7%);聚類4包含37個樣本(5.0%);聚類5包含280個樣本(37.9%)。由圖2可知輪廓系數(shù)為0.6,聚類質(zhì)量好。

圖1 聚類大?。P?)

圖2 聚類質(zhì)量(模型1)

圖3為聚類的總體分布。航行操作過失、船舶條件、潛在缺陷、自然災(zāi)害分別代表事故主要原因的四個方面:人為因素、船舶因素、貨物因素、自然因素。碰撞事故多由船員在航行中的過失操作引起,自沉事故由兩方面因素(船舶條件和潛在缺陷)引起,自然災(zāi)害則會給船舶帶來風(fēng)災(zāi)。

圖3 聚類總體分布(模型1)

2. 事故種類與傷亡數(shù)、損失等級的相關(guān)性

以“損失等級”“種類”“死亡數(shù)”“自然災(zāi)害”“事故種類”作為輸入變量,各聚類大小見圖4,最終聚成5類:聚類1包含211個樣本(28.6%);聚類2包含180個樣本(24.4%);聚類3包含117個樣本(15.8%);聚類4包含106個樣本(14.3%);聚類5包含125個樣本(16.9%)。由圖5可知輪廓系數(shù)為0.5,聚類質(zhì)量好。

圖4 聚類大?。P?)

圖5 聚類質(zhì)量(模型2)

由圖6可知各種事故所帶來的事故后果。自沉事故帶來的后果最為嚴(yán)重,損失等級為全損,死亡數(shù)達(dá)到2.82人。碰撞事故的損失等級較低,通過聚類被分為兩類:聚類1碰撞事故死亡數(shù)較高,達(dá)到了1.04人,損失等級輕微;聚類2碰撞事故死亡數(shù)較低,僅為0.26人,有一般損失。風(fēng)災(zāi)事故損失等級一般,死亡數(shù)為0.42人。

圖6 聚類總體分布(模型2)

四、船舶交通事故防范對策

(一)落實船東與企業(yè)安全管理責(zé)任。改善航行值班制度,加強(qiáng)夜晚特別是凌晨0點至4點的航行值班。杜絕超載運輸?shù)冗`法作業(yè)行為,定期安排船舶進(jìn)廠維護(hù)保養(yǎng),以維持良好的技術(shù)狀態(tài)。

(二)培養(yǎng)船員良好的操作規(guī)范。一方面提高船員駕駛技術(shù),另一方面形成優(yōu)秀的駕駛習(xí)慣,以減少船員在航行中的操作過失,避免船舶碰撞事故的發(fā)生,減少船舶交通事故數(shù)量。

(三)提高船員的安全意識。自沉事故帶來的后果往往是災(zāi)難性的,船員應(yīng)擅于在日常工作中發(fā)現(xiàn)安全隱患與船舶缺陷以防止自沉事故。

五、結(jié)語

通過提出運用兩步聚類算法對船舶交通事故進(jìn)行數(shù)據(jù)挖掘,構(gòu)建事故種類同事故具體原因,事故種類同傷亡數(shù)、損失等級的聚類模型,能夠有效準(zhǔn)確地挖掘出事故變量的相關(guān)性,呈現(xiàn)出事故的共性要素,為海事部門制定防范措施提供參考依據(jù)。但對于致因四個方面(人、機(jī)、船舶、環(huán)境),每一方面僅選取了重要性最高的變量作為輸入,而事故致因變量繁多,后期可以增加事故具體原因的變量,以提高聚類結(jié)果的準(zhǔn)確性。

猜你喜歡
聚類種類交通事故
基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
預(yù)防交通事故
基于模糊聚類和支持向量回歸的成績預(yù)測
基于稀疏表示的寵物狗種類識別
基于稀疏表示的寵物狗種類識別
電影
基于密度的自適應(yīng)搜索增量聚類法
消防車有哪些種類
多功能破冰鏟
愉快的購物
内江市| 武穴市| 凯里市| 桑日县| 清流县| 鄂尔多斯市| 汕尾市| 临泉县| 玛沁县| 淮安市| 文登市| 垫江县| 新巴尔虎右旗| 孝义市| 阜阳市| 定远县| 来安县| 苍山县| 天等县| 封开县| 宁明县| 东安县| 武夷山市| 连云港市| 辽中县| 疏勒县| 屏山县| 普陀区| 咸阳市| 通许县| 伊通| 巴东县| 阿巴嘎旗| 皋兰县| 孟津县| 尉犁县| 宿州市| 洞口县| 浏阳市| 三明市| 林州市|