国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)技術(shù)的消費(fèi)者購車性價(jià)比認(rèn)知影響因素分析

2019-06-11 09:51林倞夷孟健龐有俊
時(shí)代汽車 2019年5期
關(guān)鍵詞:機(jī)器學(xué)習(xí)

林倞夷 孟健 龐有俊

摘 要:本文對(duì)消費(fèi)者購車評(píng)價(jià)數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)建模與訓(xùn)練,實(shí)現(xiàn)消費(fèi)者購車性價(jià)比實(shí)際認(rèn)知指標(biāo)的預(yù)測(cè)和影響因素優(yōu)先級(jí)評(píng)估。從而指導(dǎo)整車制造企業(yè)通過平衡價(jià)格、汽車各項(xiàng)性能指標(biāo)的方式提高消費(fèi)者對(duì)新車的性價(jià)比認(rèn)知指標(biāo),提高新車銷量。

關(guān)鍵詞:機(jī)器學(xué)習(xí);消費(fèi)者性價(jià)比認(rèn)知;分類預(yù)測(cè);汽車性能因素分析;消費(fèi)者研究

1 引言

2012年后,我國汽車消費(fèi)者市場(chǎng)逐漸回歸理性,面對(duì)日益激烈競(jìng)爭(zhēng)和消費(fèi)者更加個(gè)性化需求,給汽車產(chǎn)業(yè)帶來了新的挑戰(zhàn)。運(yùn)用科學(xué)的調(diào)研方法和研究手段,深入了解消費(fèi)者需求,制定精準(zhǔn)的產(chǎn)品策略和價(jià)格策略,成為越來越多整車制造企業(yè)關(guān)注重點(diǎn)。本文重點(diǎn)研究如何運(yùn)用機(jī)器學(xué)習(xí)方法,將消費(fèi)者對(duì)汽車性價(jià)比認(rèn)知指標(biāo)進(jìn)行分類預(yù)測(cè),從而指導(dǎo)、建議更多企業(yè)在產(chǎn)品規(guī)劃、定義、價(jià)格制定階段,通過定量平衡價(jià)格、優(yōu)化各汽車性能要素的方法,提升消費(fèi)者對(duì)汽車的性價(jià)比實(shí)際認(rèn)知,增加汽車銷量。

2 關(guān)于消費(fèi)者性價(jià)比認(rèn)知指標(biāo)

購車性價(jià)比,是一個(gè)性能與價(jià)格之間的比例關(guān)系,這個(gè)指標(biāo)可以通過科學(xué)的量化和計(jì)算獲得,侯仁勇(2007)曾經(jīng)提出過我國家用轎車的評(píng)價(jià)比模型,他認(rèn)為性價(jià)比的主要性能指標(biāo)包括:質(zhì)量穩(wěn)定性、價(jià)格合理性、安全性、乘坐舒適性、耗油量、售后服務(wù)、外形美觀、操作方便等。

然而在經(jīng)濟(jì)學(xué)中,很多問題的特征都是多元的,當(dāng)我們使用模型去計(jì)算時(shí),可能呈現(xiàn)非線性表達(dá),而線性模型可能難以滿足現(xiàn)實(shí)世界的復(fù)雜性要求。

消費(fèi)者對(duì)汽車性價(jià)比的實(shí)際認(rèn)知指標(biāo),來源于消費(fèi)者調(diào)研數(shù)據(jù),與經(jīng)過科學(xué)計(jì)算公式計(jì)算而來用于指導(dǎo)消費(fèi)者的性價(jià)比公式而言,消費(fèi)者還會(huì)受自身心理以及價(jià)值評(píng)判標(biāo)準(zhǔn)影響。

3 消費(fèi)者性價(jià)比認(rèn)知與汽車銷量的關(guān)系

為了探討消費(fèi)者性價(jià)比認(rèn)知指標(biāo)的價(jià)值,本文選取了10-20萬區(qū)間的汽車品牌,這些車型數(shù)據(jù)分別包括朗逸、寶來、速騰、凌渡、思域、卡羅拉、軒逸、??怂?、雷凌、馬自達(dá)、高爾夫、Polo,數(shù)據(jù)來源包括網(wǎng)上評(píng)價(jià)信息和線下問卷調(diào)研信息匯總。分別對(duì)不同品牌的車型的銷售量進(jìn)行分析,我們發(fā)現(xiàn)銷量與消費(fèi)者對(duì)汽車性價(jià)比實(shí)際認(rèn)知值成正相關(guān)。這讓我相信提升汽車在消費(fèi)者心中的性價(jià)比指數(shù),對(duì)于銷量提升有著正向積極的促進(jìn)作用,見圖1。

而消費(fèi)者口碑價(jià)比指數(shù),通常難以被測(cè)算,大多通過消費(fèi)者調(diào)研來獲得,這往往需要大量的人力成本和時(shí)間周期。我們也可以通過將消費(fèi)者性價(jià)比指數(shù)與其他因素建立相關(guān)機(jī)器學(xué)習(xí)模型,從而進(jìn)行預(yù)測(cè)。

4 機(jī)器學(xué)習(xí)技術(shù)在汽車類產(chǎn)品消費(fèi)者研究工作中的應(yīng)用和作用

機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科進(jìn)行建模,使用實(shí)際場(chǎng)景下數(shù)據(jù)進(jìn)行訓(xùn)練,相比于富有經(jīng)驗(yàn)的人類分析結(jié)果,更容易幫助人們發(fā)現(xiàn)隱藏在事物中的特征和規(guī)律,也不容易受到人類主觀因素影響,對(duì)于消費(fèi)者調(diào)研研究工作,具有很高的參考和應(yīng)用價(jià)值,其作用在于:

(1)在開展消費(fèi)者調(diào)研之前進(jìn)行預(yù)測(cè),便于定義調(diào)研范圍;(2)幫助研究人員預(yù)處理數(shù)量龐大的調(diào)研數(shù)據(jù),發(fā)現(xiàn)隱含在海量調(diào)研數(shù)據(jù)中的價(jià)值,便于進(jìn)一步分析研究;(3)調(diào)研后對(duì)調(diào)研結(jié)果進(jìn)行分析,發(fā)現(xiàn)異常調(diào)研數(shù)據(jù),并進(jìn)一步挖掘調(diào)研數(shù)據(jù)價(jià)值;(4)在周期較短、缺乏足夠調(diào)研條件的情況下,可以進(jìn)行粗略的輔助判斷。

目前機(jī)器學(xué)習(xí)技術(shù)已經(jīng)被廣泛應(yīng)用于處理網(wǎng)絡(luò)用戶評(píng)論和反饋數(shù)據(jù),蘇翔(2015)基于機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)購物網(wǎng)站用戶反饋信息聚類,便于工作人員快速捕捉重要的反饋信息。沈敏(2015)針對(duì)大數(shù)據(jù)環(huán)境下高校圖書館檢索系統(tǒng)的信息超載問題,提出一種機(jī)器學(xué)習(xí)方法,為用戶提供個(gè)性化的偏好檢索服務(wù)。

5 本文研究方法實(shí)現(xiàn)

為了預(yù)測(cè)消費(fèi)者對(duì)各款車型的性價(jià)比評(píng)價(jià)指標(biāo),選取相關(guān)因素進(jìn)行分析,這些因素包括:價(jià)格、空間、動(dòng)力、操控、油耗、舒適、外觀、內(nèi)飾,而這些數(shù)據(jù)指標(biāo)的獲取均來自消費(fèi)者評(píng)價(jià)調(diào)研。我們假設(shè)富有經(jīng)驗(yàn)的汽車研發(fā)人員也具備評(píng)價(jià)這些因素的能力,這樣當(dāng)我們完成預(yù)測(cè)模型后,可以幫助研發(fā)人員預(yù)判消費(fèi)者對(duì)于汽車的性價(jià)比實(shí)際認(rèn)知值,幫助他們針對(duì)下一步的調(diào)研研究工作縮小調(diào)研范圍。

5.1 數(shù)據(jù)選擇

A、獲取了100組來自于用戶口碑評(píng)價(jià)數(shù)據(jù),這些數(shù)據(jù)的汽車款型銷量分布在10-20萬這個(gè)區(qū)間,這樣同一批訓(xùn)練樣本中不會(huì)出現(xiàn)品牌價(jià)值差異很大的車型。

B、為了保證評(píng)價(jià)指數(shù)能夠真實(shí)客觀反映消費(fèi)者認(rèn)知(不受個(gè)別消費(fèi)者特殊情況影響),選取每種汽車款型評(píng)價(jià)數(shù)總次數(shù)大于50次的數(shù)據(jù),取其均值。(實(shí)驗(yàn)過程反應(yīng)出低于50人次的評(píng)價(jià)容易形成臟數(shù)據(jù)干擾模型)

C、這些車型包括品牌: 朗逸、寶來、速騰、凌渡、思域、卡羅拉、軒逸、??怂?、雷凌、馬自達(dá)、高爾夫、Polo。這樣對(duì)于不同品牌汽車款型的數(shù)據(jù)選取,也便于我們通過模型訓(xùn)練出的效果判斷在同一價(jià)格區(qū)間內(nèi),品牌是否對(duì)消費(fèi)者口碑性價(jià)比指標(biāo)產(chǎn)生影響。

D、數(shù)據(jù)類型上,選擇進(jìn)行消費(fèi)者口碑性價(jià)比指標(biāo)預(yù)測(cè)的因素及其取值范圍如表1:

價(jià)格取值范圍:10-20萬;

空間、動(dòng)力、操控、油耗、舒適、外觀、內(nèi)飾:1-5,精確到小數(shù)點(diǎn)后2位;

口碑性價(jià)比:1-5,精確到小數(shù)點(diǎn)后2位;

其中,價(jià)格我們選擇市場(chǎng)指導(dǎo)價(jià),這和整車制造企業(yè)制定價(jià)格策略時(shí)的價(jià)格相吻合;

5.2 數(shù)據(jù)預(yù)處理準(zhǔn)備

A、正負(fù)樣本分配:保證正負(fù)樣本比例為1:1,就目前獲取的口碑性價(jià)比數(shù)據(jù)而言,大多集中在3-4.9之間,現(xiàn)在取4.4-5為正樣本,其余為負(fù)樣本進(jìn)行而二分類。如果遇到樣本出現(xiàn)更多類別,可在完成第一次而分類訓(xùn)練后,對(duì)負(fù)樣本繼續(xù)進(jìn)行正負(fù)樣本劃分;

B、數(shù)據(jù)分組:將這100組數(shù)據(jù)分成8:2的比例,其中80%用于訓(xùn)練模型,隨機(jī)選取的20%用于測(cè)試模型輸出的準(zhǔn)確度。

5.3 數(shù)據(jù)降維處理

我們使用Matlab進(jìn)行數(shù)據(jù)處理和模型建立與訓(xùn)練。Matlab是一種用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境。

將處理好的數(shù)據(jù)存入Excel,然后使用Matlab軟件導(dǎo)入進(jìn)行數(shù)據(jù)的處理和機(jī)器學(xué)習(xí)建模與訓(xùn)練。使用主成分分析方法(PCA),對(duì)多維數(shù)據(jù)進(jìn)行降維度,取前兩維特征向量(K=2)。

獲得PCA后的8維特征,每個(gè)維度影響度排序如下:

3.8196, 0.2983, 0.1353, 0.0861, 0.0746, 0.0406, 0.0286, 0.0406, 0.0286, 0.0172

其中,前兩維特征,占所有特征貢獻(xiàn)值的90.1%。我們?nèi)〗稻S后的前兩維數(shù)組,基本上可以體現(xiàn)數(shù)據(jù)的絕大部分特征。這樣降低數(shù)據(jù)計(jì)算速度同時(shí),也使我們的模型更加簡單,利于可視化分析。

5.4 數(shù)據(jù)建模與訓(xùn)練

將數(shù)據(jù)進(jìn)行主成分分析后針對(duì)前兩個(gè)特征進(jìn)行SVM分類預(yù)測(cè),使用Matlab的SVM工具箱可直接獲得分類結(jié)果,在這里我們使用核函數(shù)進(jìn)行非線性分類,kernel_Function取高斯徑向核函數(shù)(rbf),其公式如下:

訓(xùn)練前后后的數(shù)據(jù)可視化情況如上圖所示,正負(fù)樣本被特征空間存在的超曲平面分開。

5.5 模型的測(cè)試

訓(xùn)練集上準(zhǔn)確率達(dá)90.80%,在測(cè)試集合上準(zhǔn)確率達(dá)87.5%。

5.6 利用訓(xùn)練完成的模型,嘗試對(duì)各項(xiàng)影響因素進(jìn)行分析

不同因素對(duì)性價(jià)比的影響不同,我們分別減少某個(gè)因素之后,重復(fù)SVM模型建立過程,觀察預(yù)測(cè)分類模型準(zhǔn)率度變化,從而分析各因素對(duì)特征值的貢獻(xiàn)度,進(jìn)而用于評(píng)價(jià)各個(gè)因素對(duì)于汽車性價(jià)比因素影響的重要程度,我們發(fā)現(xiàn)如下情況:

分別去除各個(gè)影響因素后再次以相同方法建立模型,發(fā)現(xiàn)模型輸出預(yù)測(cè)結(jié)果都有不同程度出現(xiàn)準(zhǔn)確率下降的情況,其準(zhǔn)確度和下降情況如下列表2所示;

(1)針對(duì)這個(gè)結(jié)果我們總結(jié)出如下規(guī)律:

(2)我們發(fā)現(xiàn)該模型對(duì)其他價(jià)格區(qū)間的數(shù)據(jù)不起作用;

(3)10-20萬價(jià)格區(qū)間的汽車款型里,去掉價(jià)格因素,模型準(zhǔn)確率也明顯降低 ;

(4)在性能因素中,動(dòng)力對(duì)口碑性價(jià)比影響最大,其次分別是內(nèi)飾、操控、空間、友好、舒適性,而外觀對(duì)該模型的影響基本上很小。

關(guān)于選取汽車價(jià)格段分析:

(1)上述模型選用了不同品牌(自主、合資)的數(shù)據(jù)進(jìn)行建模,在評(píng)價(jià)數(shù)據(jù)量足夠大情況下,出現(xiàn)了較好的分類能力,證明在同一價(jià)格區(qū)間,大多數(shù)品牌對(duì)性價(jià)比的影響力不高。

(2)而對(duì)于上述結(jié)論出現(xiàn)了一些意外情況,我們發(fā)現(xiàn)分類中容易出錯(cuò)的車型比較多集中在大眾這個(gè)品牌(經(jīng)常實(shí)際性價(jià)比評(píng)價(jià)指標(biāo)比分類的要高),有可能這個(gè)價(jià)位區(qū)間的這個(gè)品牌對(duì)消費(fèi)者性價(jià)比考察產(chǎn)生了一些心理影響。

(3)使用價(jià)格區(qū)間高于10-20的汽車口碑指標(biāo)輸入該分類預(yù)測(cè)模型,預(yù)測(cè)的準(zhǔn)確率明顯降低,這說明品牌價(jià)值因素對(duì)消費(fèi)者認(rèn)同的性價(jià)比指標(biāo)是有很大影響的。

5 結(jié)語

借助機(jī)器學(xué)習(xí)方法,我們可以應(yīng)用消費(fèi)者調(diào)研數(shù)據(jù)訓(xùn)練預(yù)測(cè)模型,指導(dǎo)整車研發(fā)過程,平衡價(jià)格和汽車性能指標(biāo),以提升消費(fèi)者對(duì)汽車的性價(jià)比實(shí)際認(rèn)知。同時(shí),通過訓(xùn)練完成的模型,我們同樣可以進(jìn)行影響因素分析,判斷哪些是我們決策指標(biāo)的關(guān)鍵影響因素,這有助于幫助我們發(fā)掘數(shù)據(jù)中隱藏的規(guī)律,對(duì)我們的調(diào)研研究和產(chǎn)品策略進(jìn)行指導(dǎo)。

參考文獻(xiàn):

[1]侯仁勇,蘇艷麗.我國轎車性價(jià)比評(píng)價(jià)模型[J].價(jià)值工程,2007,(1):77-78.

[2]蘇翔.基于機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)購物網(wǎng)站用戶反饋信息聚類[J].信息與電腦(理論板),2015,(15),42-44.

[3]沈敏,楊新涯,王楷.基于機(jī)器學(xué)習(xí)的高校圖書館用戶偏好檢索系統(tǒng)研究[J].圖書情報(bào)工作,2015,(11),143-148.

猜你喜歡
機(jī)器學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計(jì)算模型
基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
南通市| 兴业县| 克什克腾旗| 封开县| 新干县| 密云县| 株洲县| 乌苏市| 通州区| 湖州市| 康定县| 奎屯市| 抚松县| 株洲市| 光山县| 石屏县| 余庆县| 旺苍县| 钦州市| 内江市| 永州市| 鹤壁市| 当阳市| 崇礼县| 靖边县| 保靖县| 石首市| 颍上县| 北川| 望江县| 曲松县| 太湖县| 宁乡县| 青神县| 临西县| 伊川县| 潼关县| 玛纳斯县| 灵丘县| 深水埗区| 富川|