朱 瑋, 楊嘉智
(同濟大學 建筑與城市規(guī)劃學院,上海 20092)
敘述性偏好法(stated preference, SP)是指通過實驗設計(design of experiment),讓被試者面對虛擬對象表達其偏好的一種調查和研究方法.相對于直接觀察人們實際選擇行為的顯示性偏好法(revealed preference, RP)而言,SP具有變量變異性可控、相關性可控、被試行為可控、可加入實際中尚不存在的新變量或新產品等優(yōu)勢,有利于得到更加符合理論的數(shù)據和模型[1],因此成為諸多研究和應用領域的常用方法.
應用SP法的一個關鍵步驟就是實驗設計.通常研究者首先設定影響決策和選擇的要素,并設定每個要素的水平;再組合不同要素的水平來生成選項,將若干選項組合成選擇題供被試者選擇;最后多采用離散選擇模型方法(discrete choice models)[2-3],通過解讀模型估計的參數(shù)來推斷偏好.因此,參數(shù)估計的可靠性和準確性至關重要.可靠性是指估計參數(shù)的離散程度,離散程度越小說明在重復試驗中越不可能出現(xiàn)與估計值相差較大的參數(shù)值;準確性是指估計參數(shù)與真實參數(shù)的接近程度,越接近說明模型越能反映人們的真實偏好.兩者往往隨樣本量的增加而提高.
但受成本限制,實際的調查實施總希望用盡量少的樣本來得到足夠可靠和準確的模型結果,稱其為有效樣本量.這需要采用一定的實驗設計策略,常用的設計策略包括正交設計(orthogonal design)、效率設計(efficient design)[4-5]等,不同策略下的有效樣本量可能不同.除此之外,影響有效樣本量的還有要素的數(shù)量、水平的數(shù)量以及偏好本身的特征等因素.
目前關于SP實驗設計樣本量的研究主要集中在醫(yī)學及商業(yè)決策等領域.運用較廣的傳統(tǒng)模型有Orme提出的經驗法則(rule of thumb Ⅰ)[6],指出樣本量(被試人數(shù))取決于選擇題的數(shù)量、構成選擇的要素數(shù)量,以及所有要素中出現(xiàn)的最大水平數(shù)量,它們之間的關系可以用簡單的數(shù)學公式表示.之后Orme進一步指出在一般實驗中,被調查人數(shù)至少在300人以上,結果才可能具有說服力(rule of thumb Ⅱ)[7].但兩個經驗法則都缺少充分的證明.另一個傳統(tǒng)模型來自簡單隨機抽樣理論(SRS theory)[1],其樣本量估算基于選擇概率的真實值和估計值、每個被試者需要完成的任務數(shù)量,由公式可計算出有效被試者人數(shù);不足的是,如果沒有源于實際的調查背景便不能獲得選擇概率的真實值.文獻[4-5]在簡單隨機抽樣理論的基礎上,提出了以協(xié)方差矩陣衡量實驗設計效率的方法,以及利用參數(shù)檢驗得到最小樣本量的實驗設計策略(S-efficient design).
既有研究主要存在3點不足:①僅關注模型的可靠性,欠考慮模型的準確性.得到低標準誤、統(tǒng)計顯著的參數(shù)通常比得到接近真實值的參數(shù)容易,既有研究一般止步于此.在實證研究中,真實參數(shù)是未知的,成為準確性驗證的主要障礙;②在有效樣本量的影響要素中,未考慮偏好本身的特征.該特征具體來說就是偏好參數(shù)的尺度.根據離散選擇模型的原理,大尺度的參數(shù)相較小尺度的參數(shù)更能減少隨機誤差的干擾,從而令選擇結果的傾向更加明確,對偏好的估計相應更容易,因此所需的樣本量理論上應更少;③有效樣本量估計方法的可操作性、普適性低,一般需要針對特定問題預設參數(shù)值[4],因此受預設過程本身可靠性的影響大,實施過程也比較復雜.
本文旨在彌補以上缺陷,得到一個更加容易操作的SP實驗有效樣本估計方法框架.具體來說,希望通過實施這一框架,得到一個(或幾個,針對不同的設計策略)操作模型,應用該模型,便可以通過預設實驗中要素的數(shù)量、水平的數(shù)量、偏好參數(shù)的尺度以及參數(shù)的目標準確度,來預估實驗所需的有效樣本量.
SP實驗設計的一般過程為:①確定實驗對象,根據其屬性設定影響決策和選擇的要素;②設定每個要素的水平;③采用選定的實驗設計策略對不同要素的水平進行組合,生成選項,將若干選項組合成選擇題供被試者選擇.
SP實驗的選擇行為數(shù)據通常用離散選擇模型來解釋,其中最基本的是多項邏輯特模型(multinomial logit model),其假定人們在選擇時,面對選項i=1,…,I,選擇概率pi為
(1)
(2)
可見,該準確性與模型擬合參數(shù)的標準誤成反比,與真實參數(shù)的容差成正比,如圖1所示.從理論上可以推斷,提高容差可以提高參數(shù)準確性,相應需要的有效樣本量就會減少;相反,小容差就需要大樣本.因此,容差尺度要適當,但又因具體應用問題而不同:參數(shù)誤差造成的后果在多大程度上是可接受的,需具體情況具體確定.筆者將容差設定為0.1,即允許估計參數(shù)相對于真實參數(shù)有最多正負10%的偏移.
(3)
圖1 參數(shù)準確性定義
SP選擇實驗中,影響模型參數(shù)準確性的因素可能包括:① 樣本量(xN).進入模型擬合的選擇數(shù)量越多、選擇結果越豐富,就能為模型提供越多的信息量,使得參數(shù)估計越準確;② 設計要素(解釋變量)數(shù)量(xV)和要素水平數(shù)量(xL).這兩個因素決定實驗設計的復雜程度,要素和水平數(shù)量越多則生成選擇方案的數(shù)量越多;相比于復雜度較低的實驗設計,需要較大的樣本量和較豐富的選擇結果來得到相同準確性的參數(shù)估計;③ 模型參數(shù)的尺度(xS).參數(shù)尺度決定了可見效用相對于誤差的作用強度,尺度越大則選擇結果越確定,規(guī)律性越強,越容易得到準確的參數(shù)估計;④ 實驗設計策略(xD).不同的實驗設計策略(如正交設計、效率設計、隨機設計)產生不同的選擇方案,對應不同程度的信息豐富性和有偏性,從而影響參數(shù)估計的準確性.例如,正交設計可以產生具有代表性、均好性、數(shù)量較少的選擇方案,但其自變量的信息量不隨樣本量的增加而變化;而隨機設計在樣本量較少時,自變量的分布很可能有偏,但隨著樣本量增加,有偏性會減弱,信息豐富性會增加.
以上影響因素與參數(shù)準確性的假設關系總結如表1所示.
表1 變量的含義及其與參數(shù)準確性的假設關系
Tab.1 Variables and hypothetical relationship with parameter accuracy
變量影響因素含義與參數(shù)準確性的假設關系xN樣本量正相關(+)xV設計要素的數(shù)量負相關(-)xL設計要素水平的數(shù)量負相關(-)xS模型參數(shù)的尺度正相關(+)xD實驗設計策略對應的選擇方案豐富度正相關(+)
由于設計策略不易量化,因此在特定實驗設計策略xD下,建構其余4個影響因素與參數(shù)準確性的關系模型,而設計策略的影響可通過比較不同設計策略對應模型的參數(shù)來獲得.參數(shù)準確性的取值范圍為0~1,通過預研究基本掌握了參數(shù)準確性在3個設計策略下(詳見2.1)與樣本量的關系,以要素數(shù)量、水平數(shù)量皆為3、模型參數(shù)尺度選擇中類時為例(圖2),圖中曲線接近標準邏輯斯蒂函數(shù)的上半部分(圖3).
圖2 參數(shù)準確性與樣本量變化的關系(要素數(shù)量=3,水平數(shù)量=3,模型參數(shù)尺度=中類)
Fig.2 Parameter accuracy versus sample size
圖3 邏輯斯蒂函數(shù)
標準邏輯斯蒂函數(shù)為
(4)
(5)
得
(6)
鑒于準確性的影響因素都要通過樣本量起作用,例如當樣本量為0,準確性也應為0;同時考慮到模型應較易于操作.因此,將自變量間的關系定義為如下乘積形式:
(7)
式中:βk為各影響因素xk的權重,可用線性回歸模型求解.根據公式(7),當給定實驗設計策略、參數(shù)準確性、實驗設計要素數(shù)量、要素水平數(shù)量以及參數(shù)尺度,即可求得實驗所需的有效樣本量.
本研究中的有效樣本量是指得到足夠模型參數(shù)準確性所需的最小樣本量.應用以上的框架對SP實驗的有效樣本量進行實證研究.總體思路是,將以上5個參數(shù)準確性影響因素作為設計要素進行實驗設計,得到不同的檢驗方案;根據每個方案,用模擬的方法生成虛擬決策數(shù)據,進行選擇模型擬合,得到模型參數(shù),并計算參數(shù)準確性.根據式(7)得到準確性的回歸模型,考查影響因素與準確性的實證關系,以及不同條件下有效樣本量的變化規(guī)律.
對5個影響因素的等級設定如下:
(1) 設計要素的數(shù)量(xV),為2~10個.
(2) 要素水平的數(shù)量(xL),為2~4個.
(3) 模型參數(shù)的尺度(xS),即為預設的真實參數(shù),為大、中、小3個等級.大尺度參數(shù)值為0、2、4、8,中尺度參數(shù)值為0、1、2、4,小尺度參數(shù)值為0、0.5、1、2.
采用R語言的DoE.base包,對以上3個因素經過正交設計,得到27個檢驗方案,其中典型方案如表2所示.
(4) 樣本量(xN),根據每個檢驗方案以及對應選擇方案規(guī)模,并根據式(1),模擬2選1選擇的若干樣本.在每種策略下模擬了500、800、1 500、3 000、6 000、12 000、20 000、30 000次選擇.
(5) 實驗設計策略(xD),選取了3種實驗設計策略分別進行檢驗.一是將要素的數(shù)量擴大選項數(shù)兩倍后做正交設計(偏移成對正交設計,shifted-pairs orthogonal design[8-9]),直接生成選擇方案,以下簡稱“成對組合策略”;二是運用正交設計生成單個選項后,從中隨機抽取兩個選項組合成選擇方案,以下簡稱“隨機組合策略”;三是所有選項的要素值均隨機生成,以下簡稱“完全隨機策略”.一般來說,成對組合策略生成的選擇方案最少,在小樣本下的代表性和均勻性最好;完全隨機策略的方案豐富性最高,利于降低參數(shù)偏差,但需要大樣本才能得以體現(xiàn);隨機組合策略的特性居于以上兩者之間.
表2 檢驗方案示例
分別在以上3種設計策略下實施檢驗方案,用R語言中的mlogit包擬合選擇模型(式(1)),得到模型估計參數(shù),根據式(2)、(3)計算該方案、該樣本的模型參數(shù)準確性;接著用準確性模型對所有檢驗方案的所有樣本加以回歸分析,可得到3個對應設計策略的模型.根據式(7),對準確性模型加以調整,主要是因為模型參數(shù)尺度因素(xS)在本實證中不易量化,進而采取啞變量的形式(0/1),分別由xS1(小尺度)、xS2(中尺度)和xS3(大尺度)來表示;對應參數(shù)為βS1、βS2、βS3.式(7)相應調整為
(8)
在準確性模型擬合前,篩選準確性在0.70~0.95的樣本予以保留,目的一是對準確性較高的樣本建模更具針對性和實用性,二是去除異常情況.模型擬合結果見表3.
3種策略下模型參數(shù)的符號和關系均符合假設:參數(shù)尺度與準確性正相關;設計要素的數(shù)量和要素水平的數(shù)量均與準確性負相關,且要素水平的作用更強;樣本數(shù)量與準確性正相關.模型中未加入常數(shù)項,因為常數(shù)項與xSc的作用重疊.將通過模型(式(8))估計的樣本量與實際的樣本量進行比較(圖4).相比前兩種策略,完全隨機策略圖像上的點分布更聚集,估計樣本量與實際樣本量更為接近,對兩者的線性回歸亦可同樣證明.
表3 準確性模型結果
注:***、**、*和·的統(tǒng)計顯著性水平分別為0.001、0.01、0.05、0.1.
a 成對組合策略
b 隨機組合策略
c 完全隨機策略
為了更加清晰地呈現(xiàn)有效樣本量與其影響因素的關系,并便于對這3種設計策略進行比較,對以上模型進行可視化處理,如圖5所示.圖中,縱坐標表示27種要素與水平的組合,自下而上根據要素和水平的數(shù)量排列,越往上,選擇的復雜性越高;橫坐標表示在之前條件設定下估算的有效樣本量.它們顯示的規(guī)律是:① 要素數(shù)量和水平數(shù)量越多,需要的有效樣本量越大,且要素水平數(shù)量的影響比要素數(shù)量的影響大得多.② 參數(shù)尺度越小,需要的有效樣本量越大,且呈非線性增長,即從中尺度到小尺度參數(shù)需要增加的有效樣本量比從大尺度到中尺度需要增加的有效樣本量多得多.③ 參數(shù)準確性越高,需要的有效樣本量越大,也呈非線性增長,即同等程度的準確性提高,在較高準確性下要比較低準確性下需要更多的有效樣本量.④ 兩種隨機設計策略所需的有效樣本量明顯少于成對設計策略的樣本量.例如,在最高的準確性、最小的參數(shù)尺度、最高的復雜性下,隨機策略的有效樣本量不超過40 000次選擇,而成對設計策略需要超過60 000次選擇.在參數(shù)準確性較低或在復雜度較低的條件下,成對設計策略需要的樣本量與隨機策略接近甚至更少.⑤ 比較這兩種隨機策略,完全隨機策略在大多數(shù)條件下需要較少的有效樣本量;僅在最高準確性、最小參數(shù)尺度、較高復雜性下,有效樣本量略多于隨機組合策略所需有效樣本量.
a 成對組合策略
b 隨機組合策略
c 完全隨機策略
既有SP實驗設計研究主要關注估計可信度高的參數(shù),卻忽略了對參數(shù)準確性的要求.對此,本文提出了一個以獲得準確參數(shù)估計為目標,估計SP實驗設計所需有效樣本量的模型框架.研究的主要結論為:
(1) 提出了一個易于操作、更加全面的SP實驗有效樣本量估計方法框架,最終可通過一個線性模型來估計實驗所需的樣本量.該模型中的因變量為參數(shù)的準確性,解釋變量包括要素的數(shù)量、要素水平的數(shù)量、參數(shù)的尺度、樣本量以及實驗設計策略.當預設包括準確性在內的其他變量,即可應用此模型求得有效樣本量.
(2) 應用該框架開展了一個模擬檢驗,發(fā)現(xiàn)所有這些解釋變量都對參數(shù)的準確性產生顯著的影響,從中得到對SP實驗設計的一些實踐原則.第一,要素水平的數(shù)量比要素的數(shù)量更顯著地影響樣本量,因此實驗應盡量控制要素水平數(shù);第二,在估計樣本量前,可通過預實驗或文獻查閱對參數(shù)尺度有所預估;第三,在高參數(shù)準確性的要求下,隨機實驗策略基本上要優(yōu)于成對設計策略,僅在低參數(shù)準確性、大尺度參數(shù)等寬松的條件下,成對設計策略才體現(xiàn)出優(yōu)勢.
以上框架適用于基于SP選擇實驗的研究,幫助研究者評價實驗設計,選擇恰當?shù)膶嶒炘O計策略,預估樣本量和實施難度.相信通過以上模擬檢驗得到的實驗設計要素與有效樣本量之間的關系在其他一般實驗情景中仍是有效的,不過具體的關聯(lián)程度應該會隨著研究問題的不同而有所不同,因此仍需要具體問題具體研究.在這個過程中,比較難的步驟就是界定真實參數(shù)的尺度,因其對有效樣本量規(guī)模有較大影響.通過預實驗或文獻查閱對參數(shù)尺度有較為準確的預估是需認真對待的環(huán)節(jié).本研究也僅考查了影響有效樣本量的部分因素,在此框架下,值得研究的要素還包括其他設計策略(如效率設計)和選項數(shù)量.此外,要素影響有效樣本量的機制、模型是否還有其他更加貼切的形式,也值得深入探索,畢竟本研究模型還原實際樣本量的準確度不高,其中有隨機過程的影響.