国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進型Stackelberg博弈的自動駕駛測試數(shù)據(jù)定價模型

2023-12-09 03:28:52涂輝招劉建泉遇澤洋郭新宇張韜略孫立軍
關(guān)鍵詞:利潤率測試數(shù)據(jù)信息量

涂輝招, 劉建泉, 遇澤洋, 李 浩, 郭新宇, 張韜略, 孫立軍

(1. 同濟大學(xué) 道路與交通工程教育部重點實驗室,上海 201804;2. 同濟大學(xué) 法學(xué)院,上海 200092)

我國“十四五”規(guī)劃綱要指出,要加快數(shù)字化發(fā)展,促進數(shù)據(jù)交易流通,推動數(shù)字經(jīng)濟和實體經(jīng)濟深度融合,推進數(shù)字產(chǎn)業(yè)化?!皵?shù)據(jù)二十條”[1]強調(diào),要“支持探索多樣化、符合數(shù)據(jù)要素特性的定價模式和價格形成機制,推動用于數(shù)字化發(fā)展的公共數(shù)據(jù)按政府指導(dǎo)定價有償使用”。自動駕駛測試過程中產(chǎn)生的海量數(shù)據(jù),蘊含高額潛在價值,但目前數(shù)據(jù)的交易流通進展卻十分緩慢[2]。其主要原因之一是數(shù)據(jù)價值難以被估值[3],亟需建立一套有效的數(shù)據(jù)定價方法,激發(fā)數(shù)據(jù)價值。數(shù)據(jù)定價方法是把數(shù)據(jù)作為資產(chǎn)并對資產(chǎn)進行定價的行為[4]。

數(shù)據(jù)是信息的載體,其使用過程帶來的預(yù)期收益直接取決于數(shù)據(jù)中包含的信息量,因此數(shù)據(jù)信息量是數(shù)據(jù)價值評估的核心指標(biāo)[5-6]。信息熵可以表征數(shù)據(jù)集包含的信息量[7-8],是數(shù)據(jù)信息測量方法中最基本的概念。數(shù)據(jù)定價模型主要包括基于訂閱[9-10]、基于查詢[11-14]、基于數(shù)據(jù)質(zhì)量[15-16]、基于拍賣[17-20]、基于博弈論[21-23]等模型?;谟嗛喌臄?shù)據(jù)定價方法,根據(jù)特定企業(yè)之間達成的訂閱協(xié)議,數(shù)據(jù)消費者通過支付訂閱費,獲取指定時間段內(nèi)和訂閱范圍內(nèi)的數(shù)據(jù),適用于數(shù)據(jù)交易主體較少、數(shù)據(jù)消費者需求單一且長期穩(wěn)定的情況?;诓樵兊臄?shù)據(jù)定價模型依托SQL(structured query language)關(guān)系型數(shù)據(jù)庫,數(shù)據(jù)生產(chǎn)者預(yù)先設(shè)置基本查詢視圖的數(shù)據(jù)價格,數(shù)據(jù)消費者按需進行數(shù)據(jù)查詢并購買,查詢結(jié)果由基本查詢視圖組合而成,但查詢過程復(fù)雜度較高,且預(yù)先設(shè)置的視圖難以完全覆蓋自動駕駛測試過程中實時產(chǎn)生的大量數(shù)據(jù),可操作性較低[24]?;跀?shù)據(jù)質(zhì)量[15-16]的定價模型,通常利用效用函數(shù)等手段從數(shù)據(jù)質(zhì)量和數(shù)據(jù)容量兩方面來衡量數(shù)據(jù)價值?;谂馁u的數(shù)據(jù)定價模型[17-20]更多強調(diào)不同數(shù)據(jù)消費者之間的競價過程。這4類模型難以對數(shù)據(jù)本身的真實價值進行深度挖掘[4]。Stackelberg 博弈模型是基于博弈論的經(jīng)典定價模型,考慮了交易過程中決策的先后次序及數(shù)據(jù)本身對于數(shù)據(jù)消費者的使用價值,因此更能真實地描述交易決策過程及數(shù)據(jù)價值發(fā)現(xiàn)過程[15,25]。

但現(xiàn)有數(shù)據(jù)定價模型尚存在不足之處。首先,基于信息熵的數(shù)據(jù)信息量評估多以機器學(xué)習(xí)離散數(shù)據(jù)集為主,且數(shù)據(jù)集中通常僅包含直接信息特征[26]。自動駕駛測試數(shù)據(jù)集同時包含離散和連續(xù)變量,并且包含時間戳、經(jīng)緯度等非重復(fù)且無法直接使用的間接信息特征。若采用傳統(tǒng)信息熵方法評估,其計算結(jié)果與數(shù)據(jù)集尺度具有直接的函數(shù)關(guān)系,而與速度、駕駛模式等核心特征的分布無關(guān)。這就導(dǎo)致信息量評價結(jié)果難以體現(xiàn)自動駕駛特點,且與實際使用效果關(guān)聯(lián)性較弱,缺乏合理性。其次,因為數(shù)據(jù)作為關(guān)乎國家安全的重要資源,現(xiàn)有基于Stackelberg博弈的數(shù)據(jù)定價模型中,大多設(shè)置多個數(shù)據(jù)生產(chǎn)者和消費者,但僅考慮一個壟斷的數(shù)據(jù)平臺,他們在決策過程中均追求自身效用的最大化[22,25]。但這樣的模型假設(shè)會使得數(shù)據(jù)平臺憑借其壟斷地位,攫取過多數(shù)據(jù)生產(chǎn)者和消費者的利益,從而抑制數(shù)據(jù)市場的活力。此外,該模型缺乏對于數(shù)據(jù)信息量和數(shù)據(jù)交易博弈過程的全面考慮,未引入數(shù)據(jù)信息量評估數(shù)據(jù)價值,導(dǎo)致數(shù)據(jù)消費者效用缺乏合理性,且數(shù)據(jù)交易量不具有實際的物理單位,可操作性較低。

本文提出了考慮信息量和平臺利潤率約束的改進型Stackelberg 博弈自動駕駛測試數(shù)據(jù)定價模型,包含數(shù)據(jù)信息量評估以及數(shù)據(jù)定價兩部分。在數(shù)據(jù)信息量評估環(huán)節(jié),提出了基于特征工程的駕駛模式加權(quán)信息熵方法,對傳統(tǒng)信息熵方法進行了適應(yīng)性調(diào)整,包括特征的挖掘和過濾、連續(xù)變量離散化、駕駛模式加權(quán)等步驟。然后將評估所得信息量作為數(shù)據(jù)交易量的度量單位和數(shù)據(jù)價值評估的重要指標(biāo),進行數(shù)據(jù)的交易定價。在數(shù)據(jù)定價環(huán)節(jié),構(gòu)建了考慮信息量和平臺利潤率約束的改進型Stackelberg博弈數(shù)據(jù)定價模型。最后,基于上海市自動駕駛實際測試數(shù)據(jù)開展典型案例分析和模型驗證。

1 定價模型

1.1 模型框架

圖1 給出了基于改進型Stackelberg 博弈的數(shù)據(jù)定價模型整體框架。框架主要分為數(shù)據(jù)信息量評估、數(shù)據(jù)定價兩個步驟。第一步數(shù)據(jù)信息量評估,主要采用基于特征工程的駕駛模式加權(quán)信息熵,包括:①基于特征工程挖掘潛在直接信息特征;②連續(xù)變量離散化,即過濾間接信息特征,并對每個連續(xù)變量信息等距分箱,以差分信息熵和分箱后離散信息熵最接近的原則確定最優(yōu)分箱數(shù);③計算自動駕駛駕駛模式加權(quán)信息熵。第二步數(shù)據(jù)定價,主要是考慮信息量和平臺利潤率約束的改進型Stackelberg博弈數(shù)據(jù)定價模型,其中數(shù)據(jù)交易量的度量單位是第一步所確定的數(shù)據(jù)信息量。

圖1 基于改進型Stackelberg博弈的自動駕駛測試數(shù)據(jù)定價模型框架Fig. 1 Structure of autonomous vehicles testing data pricing model based on evolved Stackelberg game

1.2 基于特征工程的駕駛模式加權(quán)信息熵

1.2.1 傳統(tǒng)信息熵

傳統(tǒng)信息熵主要分為離散數(shù)據(jù)集信息熵、連續(xù)變量信息熵兩類。

(1)離散數(shù)據(jù)集信息熵:對于有n條記錄的離散數(shù)據(jù)集D,將每行記錄視為一個向量,這些向量共有m個不同的取值{vi|i=1,…,m},每個取值的概率為p(vi),則數(shù)據(jù)集的信息熵Hd(D)定義為

式中:b為對數(shù)的基,當(dāng)取值為2時,信息熵的度量單位為bit,后文默認(rèn)取值為2。

(2)連續(xù)變量差分信息熵:對于有n條記錄的變量V,共有m個不同的取值{vi|i=1,…,m},其概率密度函數(shù)為f(vi),則該變量的信息熵Hc(V)定義為

自動駕駛測試數(shù)據(jù)集中的時間戳不會重復(fù),因此在有n條記錄的自動駕駛測試數(shù)據(jù)集D中,將每行記錄視為一個向量,這些向量有n個不同的取值,每個取值的概率為1n,代入式(1)中,可得到基于傳統(tǒng)信息熵方法針對自動駕駛測試數(shù)據(jù)集的計算結(jié)果,即

從式(3)可以看出,計算所得信息熵和數(shù)據(jù)集尺度有直接的函數(shù)關(guān)系,和速度、加速度等表征自動駕駛特點的關(guān)鍵變量的分布無關(guān)。

1.2.2 駕駛模式加權(quán)信息熵

1.2.2.1 名詞定義

直接信息特征:數(shù)據(jù)集中可被直接使用創(chuàng)造價值的特征,如自動駕駛測試數(shù)據(jù)集中速度、加速度、駕駛模式等。

間接信息特征:數(shù)據(jù)集中無法被直接使用,需要經(jīng)過數(shù)據(jù)挖掘獲取潛在的直接信息特征,才能被使用創(chuàng)造價值的特征,如自動駕駛測試數(shù)據(jù)集中的時間戳、經(jīng)緯度等特征。

潛在直接信息特征:基于間接信息特性挖掘得到,可以直接被使用創(chuàng)造價值的特征,例如自動駕駛測試數(shù)據(jù)集中,基于時間戳挖掘得到的高峰/非高峰標(biāo)簽,以及基于經(jīng)緯度挖掘得到的測試環(huán)境風(fēng)險度等。

1.2.2.2 整體流程

(1)特征工程:首先進行潛在直接信息特征挖掘,梳理自動駕駛測試數(shù)據(jù)集中時間戳、經(jīng)緯度等非直接信息特征,并根據(jù)數(shù)據(jù)使用者的需求,挖掘補充潛在直接信息特征,如高峰/非高峰標(biāo)簽、測試環(huán)境風(fēng)險度等;然后進行特征篩選,僅考慮直接信息特征、潛在直接信息特征進行后續(xù)的信息熵計算。

(2)連續(xù)變量離散化:對于每個連續(xù)變量,基于式(2)計算其差分信息熵Hc,然后進行等距分箱,并基于式(1)計算分箱后的信息熵Hd,以分箱后Hd和Hc最接近的原則確定最優(yōu)分箱數(shù),把連續(xù)、離散變量混合數(shù)據(jù)集轉(zhuǎn)化為離散數(shù)據(jù)集。

(3)基于駕駛模式加權(quán)信息熵計算方法,對分箱后的離散數(shù)據(jù)集進行信息熵計算。

1.2.2.3 駕駛模式加權(quán)信息熵

對于自動駕駛測試數(shù)據(jù),其自動駕駛、人工駕駛模式下數(shù)據(jù)的價值有明顯的差異,因此本文將駕駛模式權(quán)重wi引入到式(1)中,提出駕駛模式加權(quán)信息熵Hw(D)。

對于有n條記錄的離散數(shù)據(jù)集D,將每行記錄視為一個向量,這些向量共有m個不同的取值{vi|i=1,…,m},每個取值的概率為p(vi),對應(yīng)的駕駛模式為di,則數(shù)據(jù)集的駕駛模式加權(quán)信息熵Hw(D)定義為

式中:w(di)為駕駛模式權(quán)重,自動、人工駕駛模式下的權(quán)重根據(jù)數(shù)據(jù)消費者的需求確定。

1.3 考慮信息量和平臺利潤率約束的改進型Stackelberg博弈數(shù)據(jù)定價模型

1.3.1 模型假設(shè)

(1)交易參與方:數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)平臺、數(shù)據(jù)消費者。其中數(shù)據(jù)生產(chǎn)者負(fù)責(zé)采集、存儲測試數(shù)據(jù),將原始數(shù)據(jù)出售給數(shù)據(jù)平臺;數(shù)據(jù)平臺根據(jù)數(shù)據(jù)消費者的需求進行數(shù)據(jù)加工,將加工后的數(shù)據(jù)出售給數(shù)據(jù)消費者;數(shù)據(jù)消費者從數(shù)據(jù)平臺購買數(shù)據(jù),并使用數(shù)據(jù)創(chuàng)造價值??紤]自動駕駛測試數(shù)據(jù)交易市場中僅存在一個壟斷的數(shù)據(jù)交易平臺的情形[22,27]。

(2)交易流程:①數(shù)據(jù)生產(chǎn)者進行原始定價;②數(shù)據(jù)平臺確定分銷價格;③對于給定的分銷價格,結(jié)合自身的數(shù)據(jù)需求量,數(shù)據(jù)消費者確定其數(shù)據(jù)購買量(即信息量大?。虎軘?shù)據(jù)平臺從數(shù)據(jù)生產(chǎn)者購買相應(yīng)信息量的數(shù)據(jù),加工后出售給數(shù)據(jù)消費者。

(3)決策邏輯:數(shù)據(jù)所有者、數(shù)據(jù)平臺、數(shù)據(jù)消費者均追求自身效用的最大化,其中數(shù)據(jù)平臺受制于平臺型經(jīng)濟的監(jiān)管,其最大利潤率會受到限制。

(4)數(shù)據(jù)量交易單位:數(shù)據(jù)信息量,使用基于特征工程的駕駛模式加權(quán)信息熵方法進行確定。

1.3.2 模型構(gòu)建

1.3.2.1 數(shù)據(jù)生產(chǎn)者

式(5)~(7)中:U1為數(shù)據(jù)生產(chǎn)者的效用;x為自動駕駛測試數(shù)據(jù)集的信息量;po為自動駕駛測試數(shù)據(jù)的原始定價;cc為采集、存儲、傳輸每bit 信息量的數(shù)據(jù)所花費的全部成本。

定義信息采集效率1/cc,可通過降低人工駕駛時長占比、豐富測試場景等方式提高信息采集效率,從而降低cc。數(shù)據(jù)生產(chǎn)者利潤率R1為其利潤除以數(shù)據(jù)的采集、存儲、傳輸成本,計算方法如下:

1.3.2.2 數(shù)據(jù)平臺的效用模型

式(9)~(12)中:U2為數(shù)據(jù)平臺的效用;pd為加工后數(shù)據(jù)的分銷價格;cp為數(shù)據(jù)平臺加工、傳輸1 bit信息量數(shù)據(jù)的全部成本;β為數(shù)據(jù)平臺的最大利潤率水平。

數(shù)據(jù)平臺利潤率R2為其利潤除以數(shù)據(jù)的加工、傳輸成本,計算方法如下:

結(jié)合式(12)和式(13),可得到R2≤β,即數(shù)據(jù)平臺的利潤率受到閾值β的約束。

1.3.2.3 數(shù)據(jù)消費者的效用模型

式(14)、(15)中:U3為數(shù)據(jù)消費者的效用;k為數(shù)據(jù)價值挖掘能力,和行業(yè)整體數(shù)據(jù)挖掘能力相關(guān),不區(qū)分具體的數(shù)據(jù)消費者;ξ為數(shù)據(jù)價值系數(shù),和數(shù)據(jù)質(zhì)量、測試場景豐富度等數(shù)據(jù)集自身屬性相關(guān);d為數(shù)據(jù)消費者對數(shù)據(jù)信息量的需求量級,當(dāng)量級為bit時取值為1,量級為byte時取值為8,量級為KB時取值為8×1 024,以此類推。

數(shù)據(jù)消費者利潤率R3為其利潤除以數(shù)據(jù)的購買成本,計算方法如下:

1.3.3 模型求解

采用后向歸納法求解上述3 層Stackelberg 博弈模型的平衡點[22]。首先分析數(shù)據(jù)消費者的決策模型,求解使得U3(x,pd)最大的數(shù)據(jù)購買量x。求U3(x,pd)對于x的偏導(dǎo),即

當(dāng)U3(x,pd)的二階導(dǎo)小于0 時,x*是全局最優(yōu)解,因此驗證U3(x,pd)對于x的二階導(dǎo)的正負(fù)性,即

將x*代入U3(x,pd),可以得到

限制數(shù)據(jù)平臺的利潤率為β,則令U2(x*,pd,po)=βcpx,可以得到

求解式(11)可得,數(shù)據(jù)平臺的最優(yōu)定價為

將、x*代入式(5),可以得到

當(dāng)U1(x*,po)的二階導(dǎo)小于0 時,是全局最優(yōu)解,因此對U1(x*,po)二階導(dǎo)的正負(fù)性進行驗證,即

顯然小于0,因此可判斷是使U1(x*,po)達到最大值的全局最優(yōu)解。

因此可以得到上述Stackelberg博弈模型的平衡點如下:

2 典型案例分析

2.1 加權(quán)信息熵

2.1.1 自動駕駛測試數(shù)據(jù)來源

選取上海市2021 年1—3 月某自動駕駛車輛測試數(shù)據(jù),數(shù)據(jù)量約5.1萬條,其中自動駕駛模式數(shù)據(jù)約4.1 萬條,數(shù)據(jù)字段包括車輛編號、經(jīng)緯度、時間戳、速度、加速度、駕駛模式(自動駕駛/人工駕駛)等,時間顆粒度為1 s。

2.1.2 機器學(xué)習(xí)訓(xùn)練

為了在案例分析中驗證數(shù)據(jù)信息量評估結(jié)果的有效性,對案例數(shù)據(jù)集進行了機器學(xué)習(xí)的訓(xùn)練。核心假設(shè)是根據(jù)大量機器學(xué)習(xí)經(jīng)驗,輸入分類器的有效信息越多,分類器的分類準(zhǔn)確率就越高[7]。如果基于特征工程的駕駛模式加權(quán)信息熵可以衡量數(shù)據(jù)集的有效信息量,那么駕駛模式加權(quán)信息熵與分類器對該數(shù)據(jù)集的準(zhǔn)確率成正比。因此,本文從自動駕駛測試數(shù)據(jù)集中取出不同比例的數(shù)據(jù)行構(gòu)建子數(shù)據(jù)集,使用子數(shù)據(jù)集訓(xùn)練4種常見的分類器,計算準(zhǔn)確率的平均值,將所提出的基于特征工程的駕駛模式加權(quán)信息熵、傳統(tǒng)信息熵和分類器準(zhǔn)確率的平均值進行對比,從而驗證模型的有效性。

分類器選?。哼x取機器學(xué)習(xí)中常用的決策樹(DT)、Logistic回歸(LR)、隨機森林(RF)、支持向量機(SVM)在不同數(shù)據(jù)比例的子數(shù)據(jù)集進行有監(jiān)督訓(xùn)練。

訓(xùn)練目標(biāo):自動駕駛測試數(shù)據(jù)的核心價值是體現(xiàn)自動駕駛的特征,在盡可能接近駕駛能力邊界的條件下,暴露關(guān)鍵的測試問題,服務(wù)于風(fēng)險的預(yù)測和管理,因此本文選取現(xiàn)階段研究中最常見的脫離預(yù)測[28],以及駕駛模式識別[29],作為分類器的訓(xùn)練目標(biāo)。

準(zhǔn)確率驗證方法:十折交叉驗證法,即用10 次結(jié)果準(zhǔn)確率的平均值作為對算法準(zhǔn)確率的估計。

2.1.3 自動駕駛測試數(shù)據(jù)集信息量

潛在直接特征挖掘:基于時間戳補充高峰/非高峰特征,基于經(jīng)緯度補充道路環(huán)境風(fēng)險度特征。

駕駛模式權(quán)重:將自動駕駛模式權(quán)重設(shè)置為1,人工駕駛模式權(quán)重設(shè)置為0。

圖2a 和2b 分別是脫離預(yù)測和駕駛模式識別的準(zhǔn)確率訓(xùn)練結(jié)果,圖2c是基于特征工程的駕駛模式加權(quán)信息熵和傳統(tǒng)信息熵計算結(jié)果??梢钥闯?,傳統(tǒng)信息熵隨著數(shù)據(jù)集尺度的增加單調(diào)遞增,而基于特征工程的駕駛模式加權(quán)信息熵和上述兩個分類器準(zhǔn)確率的變化趨勢更為接近,可以更合理地表征自動駕駛測試數(shù)據(jù)集的信息量。

圖2 常用分類器準(zhǔn)確率及對應(yīng)信息熵Fig. 2 Accuracy of commonly used classifiers and corresponding information entropy

2.2 考慮平臺利潤約束的Stackelberg 博弈數(shù)據(jù)定價模型

2.2.1 對比模型

基礎(chǔ)Stackelberg 博弈數(shù)據(jù)定價模型,不考慮數(shù)據(jù)消費者需求量,且不限制數(shù)據(jù)平臺利潤率[22]。

2.2.2 參數(shù)設(shè)置

基于合作車企的自動駕駛測試的實際測試情況估算,設(shè)置cc=100 元·bit-1。cp在cc的基礎(chǔ)上乘以折減系數(shù)估算,約為cc的1/10,cp=10 元·bit-1?;诋?dāng)前互聯(lián)網(wǎng)平臺型企業(yè)的利潤率水平,設(shè)定β=50%。k和ξ是模型的擬合參數(shù),需要基于自動駕駛測試數(shù)據(jù)的實際交易信息進行擬合確定。本文初步設(shè)置k=300(假設(shè)數(shù)據(jù)消費者針對1 bit信息量的數(shù)據(jù),可獲取采集成本3倍的效用),ξ=1(假設(shè)數(shù)據(jù)無額外價值系數(shù))。本文通過分析參數(shù)變化對數(shù)據(jù)交易量、系統(tǒng)總效用、三方利潤率的影響,展示改進型Stackelberg博弈數(shù)據(jù)定價模型的合理性。后續(xù)可隨著自動駕駛測試數(shù)據(jù)實際信息的開展進一步校準(zhǔn)。

2.2.3 數(shù)據(jù)消費者數(shù)據(jù)需求量級的影響

數(shù)據(jù)消費者的信息需求量級為byte、KB、MB、GB、TB 的情況,即d=[8, 8×210,8×220,8×230,8×240]。

從圖3 可以看出,基礎(chǔ)Stackelberg 博弈數(shù)據(jù)定價模型(圖3b)無法反應(yīng)數(shù)據(jù)消費者需求量級的影響,且交易數(shù)據(jù)量沒有明確的物理單位,在實際操作中存在困難;而基于改進型Stackelberg 博弈的數(shù)據(jù)定價模型(圖3a)可以較好地反應(yīng)二者關(guān)系,且根據(jù)2.1節(jié)的分析,自動駕駛測試數(shù)據(jù)信息量和數(shù)據(jù)使用效果直接相關(guān),且有明確的信息存儲度量單位,在數(shù)據(jù)交易過程中更具有合理性和可行性。

圖3 數(shù)據(jù)消費者數(shù)據(jù)需求量級對數(shù)據(jù)交易量的影響Fig. 3 Impact of data consumer demand on data transaction volume

后文的分析中包含了兩個模型下數(shù)據(jù)交易量的對比,但基礎(chǔ)Stackelberg 模型的數(shù)據(jù)交易量沒有明確物理單位,兩個模型不具有直接可比性,因此為了使對比更加直觀,后文將基礎(chǔ)Stackelberg 博弈數(shù)據(jù)定價模型中數(shù)據(jù)交易量的物理單位和基于改進型Stackelberg博弈的數(shù)據(jù)定價模型保持一致。

2.2.4 數(shù)據(jù)消費者數(shù)據(jù)價值挖掘能力的影響

分析數(shù)據(jù)消費者數(shù)據(jù)價值挖掘能力k提升的影響。設(shè)置k=[300, 325, 350, 375, 400,425,450,475, 500]。將數(shù)據(jù)消費者的數(shù)據(jù)需求量級d設(shè)置為1,其他參數(shù)保持不變。

圖4a顯示了數(shù)據(jù)消費者的數(shù)據(jù)價值挖掘能力對數(shù)據(jù)交易量的影響,可以看出,限制數(shù)據(jù)平臺利潤率后,可以明顯提升市場中的數(shù)據(jù)交易量,從而大大激發(fā)數(shù)據(jù)市場活力;圖4b顯示了數(shù)據(jù)價值挖掘能力對系統(tǒng)總效用的影響,可以看出,限制數(shù)據(jù)平臺利潤率后,雖然數(shù)據(jù)平臺的效用會受到一定程度上的限制,但因為數(shù)據(jù)交易量上升,系統(tǒng)總效用有明顯的提升,表明基于改進型Stackelberg博弈的數(shù)據(jù)定價模型可以使數(shù)據(jù)生產(chǎn)者、消費者獲取更多利益,從而鼓勵數(shù)據(jù)的生產(chǎn)和交易。

圖4 數(shù)據(jù)價值挖掘能力對數(shù)據(jù)交易量、系統(tǒng)總效用的影響Fig. 4 Impact of data value mining ability on data transaction volume and total system utility

圖5顯示了基于改進型Stackelberg 博弈(圖5a)和基礎(chǔ)Stackelberg博弈(圖5b)的兩個數(shù)據(jù)定價模型下數(shù)據(jù)消費者的數(shù)據(jù)價值挖掘能力提升對交易三方利潤率的影響,可以看出,基礎(chǔ)Stackelberg博弈數(shù)據(jù)定價模型下,數(shù)據(jù)平臺擁有過高的利潤率水平,在數(shù)據(jù)消費者提升數(shù)據(jù)價值挖掘能力的過程中,數(shù)據(jù)生產(chǎn)者和平臺的利潤率沒有明顯的提升,而數(shù)據(jù)平臺的利潤率提升迅速?;诟倪M型Stackelberg博弈的數(shù)據(jù)定價模型中,三者的利潤率水平更為均衡,隨著數(shù)據(jù)消費者數(shù)據(jù)價值挖掘能力的提升,數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)消費者的利潤率均有所提升,從而鼓勵數(shù)據(jù)消費者提升其數(shù)據(jù)價值挖掘能力。

圖5 數(shù)據(jù)價值挖掘能力對交易三方利潤率的影響Fig. 5 Impact of data value mining ability on data transaction volume and total system utility

2.2.5 數(shù)據(jù)生產(chǎn)者信息采集效率的影響

分析數(shù)據(jù)生產(chǎn)者提升信息采集效率1cc的影響,設(shè)置1cc=[1/100,1/90,1/80,1/70,1/60,1/50,1/40,1/30,1/20,1/10] bit·元-1,對應(yīng)信息采集效率由低到高。將數(shù)據(jù)消費者的數(shù)據(jù)需求量級d設(shè)置為1,其他參數(shù)保持不變。

圖6a 顯示了信息采集效率對數(shù)據(jù)交易量的影響,可以看出,基于改進型Stackelberg博弈的數(shù)據(jù)定價模型下,數(shù)據(jù)交易信息量隨著信息采集效率的提高呈現(xiàn)指數(shù)級增長的趨勢,而基礎(chǔ)模型下增速卻十分緩慢,同樣論證改進型Stackelberg 博弈的數(shù)據(jù)定價模型可以激發(fā)數(shù)據(jù)市場活力。圖6b 顯示了信息采集效率對系統(tǒng)總效用的影響,可以看出,約束數(shù)據(jù)平臺利潤率后,整體系統(tǒng)的效用有明顯的增加,從而可構(gòu)建更有利的數(shù)據(jù)交易市場。

圖6 信息采集效率對數(shù)據(jù)交易量、系統(tǒng)總效用的影響Fig. 6 Impact of information collection efficiency on data transaction volume and total system utility

圖7顯示了基于改進型Stackelberg 博弈(圖7a)和基礎(chǔ)Stackelberg博弈(圖7b)的兩個數(shù)據(jù)定價模型數(shù)據(jù)生產(chǎn)者信息采集效率提升對交易三方利潤率的影響,可以看出,兩個模型都能實現(xiàn)數(shù)據(jù)生產(chǎn)者在提升其信息采集效率的過程中獲利。但是基礎(chǔ)Stackelberg 博弈數(shù)據(jù)定價模型下,數(shù)據(jù)平臺的利潤率過高,而數(shù)據(jù)消費者的利潤率過低,并且在數(shù)據(jù)生產(chǎn)者提升信息采集效率的過程中,數(shù)據(jù)平臺的利潤率提升明顯,數(shù)據(jù)消費者的利潤率卻保持不變?;诟倪M型Stackelberg 博弈的數(shù)據(jù)定價模型下,交易三方的利潤率更加均衡,且數(shù)據(jù)消費者同樣可以在信息采集效率的提升過程中獲取更高的利潤率。

圖7 信息采集效率對交易三方利潤率的影響Fig. 7 Impact of information collection efficiency on profit rate of three parties in the transaction

3 結(jié)論

(1)提出了考慮信息量和平臺利潤約束的改進型Stackelberg 博弈自動駕駛測試數(shù)據(jù)定價模型,包含數(shù)據(jù)信息量評估和數(shù)據(jù)定價兩部分。

(2)在數(shù)據(jù)信息量評估方面,針對自動駕駛測試數(shù)據(jù)兼具離散與連續(xù)變量,且包含時間戳和經(jīng)緯度等間接信息特征的特點,在傳統(tǒng)信息熵方法的基礎(chǔ)上進行了特征挖掘篩選、連續(xù)變量離散化、駕駛模式加權(quán)等適應(yīng)性調(diào)整,提出了基于特征工程的駕駛模式加權(quán)信息熵方法,用于評估自動駕駛測試數(shù)據(jù)的信息量,并在實際測試數(shù)據(jù)集上進行了驗證。結(jié)果表明,相比傳統(tǒng)信息熵方法,基于特征工程的駕駛模式加權(quán)信息熵方法評估結(jié)果和常用分類器準(zhǔn)確率均值的變化趨勢更為接近,可更有效地表征自動駕駛測試數(shù)據(jù)的信息量。

(3)在數(shù)據(jù)定價方面,將數(shù)據(jù)信息量作為數(shù)據(jù)交易量的度量單位,提出了考慮信息量和平臺利潤率約束的改進型Stackelberg 博弈數(shù)據(jù)定價模型,并進行了實際數(shù)據(jù)驅(qū)動的驗證分析。結(jié)果表明,該模型可以更合理分配3 個參與方的利潤率,并明顯提升數(shù)據(jù)交易量以及系統(tǒng)的總效用,讓數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)平臺分別在提升自身有效信息采集效率、數(shù)據(jù)價值挖掘能力的過程中獲取更多的利益,從而增強自動駕駛測試數(shù)據(jù)數(shù)據(jù)交易市場的活力,鼓勵數(shù)據(jù)的生產(chǎn)和消費。此外,數(shù)據(jù)平臺的利潤率約束可為相關(guān)平臺治理型政策制定提供抓手。

作者貢獻聲明:

涂輝招:研究框架,研究方法,論文撰寫 。

劉建泉:定價模型構(gòu)建。

遇澤洋:研究設(shè)計,研究方法,數(shù)據(jù)分析,論文撰寫。

李 浩:定價模型構(gòu)建,數(shù)據(jù)分析。

郭新宇:數(shù)據(jù)分析,論文撰寫。

張韜略:研究框架。

孫立軍:研究設(shè)計。

猜你喜歡
利潤率測試數(shù)據(jù)信息量
測試數(shù)據(jù)管理系統(tǒng)設(shè)計與實現(xiàn)
基于信息理論的交通信息量度量
2017年1-7月塑料制品行業(yè)主營業(yè)務(wù)收入利潤率5.82%
全國地方國有企業(yè)凈資產(chǎn)利潤率
破解“利潤率下降規(guī)律之謎
基于自適應(yīng)粒子群優(yōu)化算法的測試數(shù)據(jù)擴增方法
如何增加地方電視臺時政新聞的信息量
新聞傳播(2016年11期)2016-07-10 12:04:01
全國地方國有企業(yè)凈資產(chǎn)利潤率
空間co-location挖掘模式在學(xué)生體能測試數(shù)據(jù)中的應(yīng)用
體育科技(2016年2期)2016-02-28 17:06:21
基于多尺度互信息量的數(shù)字視頻幀篡改檢測
計算機工程(2015年4期)2015-07-05 08:29:20
台江县| 泽州县| 梁山县| 大名县| 武山县| 陕西省| 滨州市| 海门市| 武威市| 泉州市| 三江| 宣威市| 东宁县| 博野县| 乐业县| 湟中县| 秦皇岛市| 平原县| 蓬溪县| 水城县| 邵阳市| 永丰县| 娄底市| 湖北省| 鄢陵县| 寿宁县| 治县。| 浑源县| 申扎县| 郴州市| 苍南县| 安多县| 许昌市| 南城县| 德钦县| 双鸭山市| 朝阳县| 瑞金市| 武冈市| 湘潭市| 万州区|