国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向車聯(lián)網(wǎng)數(shù)據(jù)的相關(guān)性分析方法

2020-10-20 06:48董俊龍關(guān)利海郝成龍
關(guān)鍵詞:車聯(lián)網(wǎng)相關(guān)性分析大數(shù)據(jù)

董俊龍 關(guān)利海 郝成龍

摘 要:車聯(lián)網(wǎng)數(shù)據(jù)包括車輛數(shù)據(jù)、駕駛員數(shù)據(jù)、出行數(shù)據(jù)以及環(huán)境數(shù)據(jù)。分析、挖掘車聯(lián)網(wǎng)數(shù)據(jù)之間的相關(guān)性,發(fā)現(xiàn)數(shù)據(jù)潛在規(guī)律,可以更好的指導業(yè)務(wù)策劃以及產(chǎn)品決策。本文歸納總結(jié)了相關(guān)性分析常用方法,并闡述每種方法的適用范圍、優(yōu)缺點以及如何應(yīng)用于車聯(lián)網(wǎng)數(shù)據(jù)。

關(guān)鍵詞:車聯(lián)網(wǎng);大數(shù)據(jù);相關(guān)性分析

1 前言

相關(guān)分析(Analysis of Correlation)是數(shù)據(jù)分析常用的分析方法之一。通過對不同特征或數(shù)據(jù)間的關(guān)系進行分析,發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)性,并通過這種強關(guān)聯(lián)關(guān)系,可以對未來趨勢進行預測。相關(guān)分析的方法很多,圖表描繪可以直觀發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,如正相關(guān),負相關(guān)或不相關(guān)。數(shù)值計算的方法可以對數(shù)據(jù)間關(guān)系的強弱進行度量,如完全相關(guān),不完全相關(guān)等。模型擬合的方法可以將數(shù)據(jù)間的關(guān)系轉(zhuǎn)化為數(shù)學模型,并通過模型對未來的趨勢進行預測。關(guān)聯(lián)規(guī)則挖掘的方法可以挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。本文結(jié)合車聯(lián)網(wǎng)數(shù)據(jù),著重介紹幾種數(shù)據(jù)相關(guān)性分析的基本方法。

2 車聯(lián)網(wǎng)數(shù)據(jù)類型

車聯(lián)網(wǎng)數(shù)據(jù)舉例說明,如表1所示:

3 相關(guān)性分析方法

3.1 數(shù)據(jù)可視化

通過數(shù)據(jù)可視化的方法分析數(shù)據(jù)之間的相關(guān)性,如散點圖、折線圖等,適合定性分析,可直觀的表達數(shù)據(jù)之間聯(lián)系、模式或趨勢。優(yōu)點是對相關(guān)關(guān)系的展現(xiàn)清晰,缺點是無法對相關(guān)關(guān)系進行準確的度量,缺乏說服力。比如,展現(xiàn)車速與轉(zhuǎn)速之間的關(guān)系,可以通過散點圖直接表現(xiàn)。

3.2 協(xié)方差

協(xié)方差用來衡量兩個變量的總體誤差,如果兩個變量的變化趨勢一致,協(xié)方差為正,說明兩個變量正相關(guān)。如果兩個變量的變化趨勢相反,協(xié)方差為負,說明兩個變量負相關(guān)。如果兩個變量相互獨立,那么協(xié)方差就是0,說明兩個變量不相關(guān)。協(xié)方差用于定性分析,描述兩組數(shù)據(jù)之間關(guān)系的方向性。優(yōu)點在于可用數(shù)值表示相關(guān)性,缺點是無法對相關(guān)程度進行度量。

3.3 相關(guān)系數(shù)

相關(guān)系數(shù)(Correlation coefficient)是反應(yīng)變量之間關(guān)系密切程度的統(tǒng)計指標,相關(guān)系數(shù)的取值區(qū)間在1到-1之間。1表示兩個變量完全線性相關(guān),-1表示兩個變量完全負相關(guān),0表示兩個變量不相關(guān)。相關(guān)系數(shù)包括pearson、spearman、kendall三種計算方法,優(yōu)點在于可以定量分析,描述數(shù)據(jù)之間的單調(diào)關(guān)系,可通過數(shù)值對變量的相關(guān)性及強弱進行度量,缺點是無法利用這種關(guān)系對數(shù)據(jù)未來趨勢進行預測。如分析駕駛員體征數(shù)據(jù)與駕駛數(shù)據(jù)之間的關(guān)系。

3.4 卡方獨立性檢驗

獨立性檢驗,又稱卡方檢驗是統(tǒng)計學的一種檢驗方式,與適合性檢驗同屬于X2檢驗,它是根據(jù)次數(shù)資料判斷兩類因子彼此相關(guān)或相互獨立的假設(shè)檢驗??ǚ姜毩⑿詸z驗,兩個類別變量的獨立性檢驗回歸分析,優(yōu)點可通過數(shù)值對變量的相關(guān)性進行度量,缺點是無法利用這種關(guān)系對數(shù)據(jù)進行預測??ǚ綑z驗僅適用于分類型數(shù)據(jù),如性別、天氣、開關(guān)狀態(tài)等。

3.5 回歸分析

回歸分析(regression analysis)是確定兩組或兩組以上變量間關(guān)系的統(tǒng)計方法。回歸分析按照變量的數(shù)量分為一元回歸和多元回歸,它可以用于研究數(shù)據(jù)之間具體模型關(guān)系?;貧w分析優(yōu)點是對變量間的關(guān)系用數(shù)學表達式確定,可進行數(shù)據(jù)預測。適用范圍:需要確定自變量和因變量??蓱?yīng)用于如車輛故障診斷預測、駕駛行為風險預測等。

3.6 關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則(Association Rules)是數(shù)據(jù)挖掘中較為常用的方法,它是從大量數(shù)據(jù)中挖掘頻繁項集之間的有趣聯(lián)系或相關(guān)關(guān)系。關(guān)聯(lián)規(guī)則的任務(wù)就是為了發(fā)現(xiàn)數(shù)據(jù)集中不同數(shù)據(jù)項之間的關(guān)系,如數(shù)據(jù)項對另一數(shù)據(jù)項的影響。如分析駕駛員情緒對駕駛行為的影響。

4 總結(jié)

本文總結(jié)了數(shù)據(jù)之間相關(guān)性計算方法,并以車聯(lián)網(wǎng)數(shù)據(jù)為例,說明每種方法的優(yōu)缺點以及適用范圍。相關(guān)性分析是進行機器學習、數(shù)據(jù)挖掘工作之前,前期數(shù)據(jù)探索的有效方法之一,在實際數(shù)據(jù)分析時,需要根據(jù)數(shù)據(jù)類型進行合理選擇。

參考文獻:

[1]賈俊平.統(tǒng)計學[M].中國人民大學出版社:北京,2018.

猜你喜歡
車聯(lián)網(wǎng)相關(guān)性分析大數(shù)據(jù)
整合廣播資源,凝聚聲音優(yōu)勢
上市公司財務(wù)指標與股票價格的相關(guān)性實證分析
淘寶星店成長中的粉絲力量
中國城市化與經(jīng)濟發(fā)展水平關(guān)系研究
汽車生產(chǎn)企業(yè)發(fā)展車聯(lián)網(wǎng)的優(yōu)勢與劣勢
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
中國車聯(lián)網(wǎng)產(chǎn)業(yè)鏈與商業(yè)模式研究
黄山市| 榆中县| 长海县| 锡林郭勒盟| 齐河县| 汾西县| 筠连县| 绥棱县| 嘉黎县| 武鸣县| 丘北县| 新营市| 光泽县| 开江县| 陆良县| 屏东市| 凤翔县| 潞西市| 嘉禾县| 团风县| 夏邑县| 霍林郭勒市| 公主岭市| 齐齐哈尔市| 宜都市| 大名县| 洱源县| 通许县| 娱乐| 徐闻县| 锡林浩特市| 武乡县| 南漳县| 宝坻区| 同江市| 色达县| 镇安县| 三河市| 密云县| 保定市| 临泽县|