楊杰
摘要:研究多元統(tǒng)計(jì)分析的理論,利用主成分分析和聚類分析的方法對(duì)區(qū)域經(jīng)濟(jì)指標(biāo)體系進(jìn)行分析和綜合,找出實(shí)質(zhì)體的數(shù)量特征和內(nèi)在統(tǒng)計(jì)規(guī)律性。通過實(shí)際的歷史數(shù)據(jù)進(jìn)行演算,證實(shí)與當(dāng)時(shí)的客觀實(shí)際情況相吻合,為決策部門衡量本地區(qū)的經(jīng)濟(jì)發(fā)展,制定科學(xué)決策提供了有利的支持。
關(guān)鍵詞:多元統(tǒng)計(jì)分析;主成分分析;聚類分析
科學(xué)研究是一個(gè)反復(fù)學(xué)習(xí)的過程,無論是研究自然現(xiàn)象還是社會(huì)現(xiàn)象,人們往往以解釋某種現(xiàn)象或者預(yù)測(cè)某種變化趨勢(shì)作為目標(biāo),然后通過收集數(shù)據(jù)并分析數(shù)據(jù)對(duì)這些目標(biāo)進(jìn)行檢驗(yàn),通常還會(huì)對(duì)所研究的現(xiàn)象提出一個(gè)改進(jìn)的解釋.在這個(gè)過程個(gè),常常需要同時(shí)觀測(cè)多個(gè)指標(biāo),例如,要衡量一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展?fàn)顩r,需要觀測(cè)的指標(biāo)有:總產(chǎn)值、利潤、效益、勞動(dòng)生產(chǎn)率、萬元產(chǎn)值能耗、固定資產(chǎn)、流動(dòng)資金周轉(zhuǎn)率、物價(jià)、信貸、稅收等等;在醫(yī)學(xué)診斷中,要判斷某人是否患病,也需要做多項(xiàng)指標(biāo)的體檢,如:血壓、脈搏跳動(dòng)次數(shù)、白血球、體溫等等.保這樣需要處理多個(gè)變量的觀測(cè)數(shù)據(jù)的情況,如何進(jìn)行有效的分析和研究呢?如果用一元統(tǒng)計(jì)方法,則必須把多個(gè)變量分開分析,一次處理一個(gè)變量,這樣做有時(shí)候也許比較方便有效,但由于這種方法忽視了諸多變量間可能存在的相關(guān)性。因此,一般會(huì)丟失很多信息,另一種方法就是多元統(tǒng)計(jì)方法,它同時(shí)對(duì)多個(gè)變量的觀測(cè)數(shù)據(jù)進(jìn)行分析,這樣的分析對(duì)諳各變量之間的關(guān)系、相依性和相對(duì)重要性都能提供有用信息。
一、多元統(tǒng)計(jì)分析研究的主要內(nèi)容
在當(dāng)前科技和經(jīng)濟(jì)迅速發(fā)展的今天,在國民經(jīng)濟(jì)許多領(lǐng)域中,特別是對(duì)社會(huì)現(xiàn)象的分析,只停留在定性分析的基礎(chǔ)上是不夠的,為提高科學(xué)性、可靠性,通常需要定性和定量的分析。如果說一元統(tǒng)計(jì)方法是研究一個(gè)隨機(jī)變量統(tǒng)計(jì)科學(xué)的規(guī)律,那么多元統(tǒng)計(jì)分析方法是研究多個(gè)隨機(jī)變量之間相互依賴關(guān)系以及內(nèi)在統(tǒng)計(jì)規(guī)律性的一門統(tǒng)計(jì)學(xué)科。同時(shí),利用多遠(yuǎn)統(tǒng)計(jì)分析中不同的方法可以對(duì)研究對(duì)象進(jìn)行分析和簡化。多元統(tǒng)計(jì)分析包括的主要內(nèi)容有:聚類分析、判別分析、主成分分析、因子分析對(duì)應(yīng)分析、典型相關(guān)分析等。
二、多元統(tǒng)計(jì)分析方法在企業(yè)中的應(yīng)用
在這里,重點(diǎn)研究聚類分析、判別分析、主成分分析、因子分析方法及其在企業(yè)中的應(yīng)用。
1.聚類分析。隨著生產(chǎn)技術(shù)和科學(xué)的發(fā)展,人類的認(rèn)識(shí)不斷加深,分類越來越細(xì),要求也越來越高,光憑經(jīng)驗(yàn)和專業(yè)知識(shí)是不能確切分類的,往往需要定量和定性的分析結(jié)合起來去分類,于是數(shù)學(xué)工具逐漸被引進(jìn)分類學(xué)中,形成了數(shù)值分類學(xué)。后來隨著多元分析的引進(jìn),聚類分析逐漸從數(shù)值分類學(xué)中脫離出來形成一個(gè)相對(duì)獨(dú)立的分支。
在企業(yè)銷售領(lǐng)域,銷售商需要考慮對(duì)不同生產(chǎn)企業(yè)生產(chǎn)的同名稱商品的分類問題。例如,某商場(chǎng)對(duì)銷售20種啤酒進(jìn)行分類,以便對(duì)不同的類別的啤酒采用不同的銷售策略,變量包括啤酒名稱、熱量卡路里、鈉含量、酒精含量、價(jià)格。根據(jù)以上指標(biāo),利用聚類分析可以實(shí)現(xiàn)把同一類型的啤酒企業(yè)歸到同一類別。再如商業(yè)企業(yè)制定商品銷售價(jià)格時(shí),需要對(duì)某個(gè)大城市的物價(jià)指數(shù)進(jìn)行考察,而物價(jià)指數(shù)很多,有農(nóng)用生產(chǎn)物價(jià)指數(shù)、服務(wù)項(xiàng)目物價(jià)指數(shù)、食品消費(fèi)物價(jià)指數(shù)、零售價(jià)格指數(shù)等,因而要先對(duì)這些價(jià)格指數(shù)利用聚類分析方法進(jìn)行分析。
2.判別分析。在生產(chǎn)、科研和日常生活中經(jīng)常需要根據(jù)觀測(cè)到的數(shù)據(jù)資料,對(duì)所研究的對(duì)象進(jìn)行分類。判別分析是判斷樣品所屬類型的一種多元統(tǒng)計(jì)分析方法,其目的是對(duì)已知分類的數(shù)據(jù)建立由數(shù)值指標(biāo)構(gòu)成的分類規(guī)則,然后把這樣的規(guī)則應(yīng)用到未知分類的樣本中去分類。
在聚類分析中,某商場(chǎng)對(duì)銷售的20種啤酒進(jìn)行分類,假定分類結(jié)構(gòu)為一級(jí)品、二級(jí)品和三級(jí)品,現(xiàn)在判斷新商標(biāo)的啤酒屬于哪個(gè)級(jí)別的產(chǎn)品就需要用判別分析。
3.主成分分析是一種常用的多元統(tǒng)計(jì)分析方法,相對(duì)于其他統(tǒng)計(jì)學(xué)方法,更強(qiáng)調(diào)用數(shù)據(jù)本身來指導(dǎo)分析過程,而不是依賴事先給定的某些假設(shè)。主要目的是希望用較少的變量解釋原始資料中的大部份變異,期望能將許多相關(guān)性很高的變量轉(zhuǎn)化成彼此互相獨(dú)立的變量,從中選取較原始變量個(gè)數(shù)少且能解釋大部份資料中變異的幾個(gè)新變量(降低原始變量的維數(shù)),也就是所謂的主成分,而這幾個(gè)主成分也就成為用來解釋資料的綜合性指標(biāo)。
在商業(yè)經(jīng)濟(jì)中用主成分析科研將一些復(fù)雜的數(shù)據(jù)指標(biāo)綜合成幾個(gè)商業(yè)指數(shù)形式,如物價(jià)指數(shù)、生活費(fèi)用指數(shù)、商業(yè)活動(dòng)指數(shù)等。在市場(chǎng)研究中,常常需要分析顧客的偏好和當(dāng)前市場(chǎng)的產(chǎn)品與顧客之間的差別,從而提供給生產(chǎn)企業(yè)新產(chǎn)品開發(fā)方向的信息。顧客偏好分析時(shí)常常用到主成分分析。例如,某汽車銷售商在商業(yè)競(jìng)爭對(duì)手中選擇了銷售的17種車型,訪問了25顧客,要求他們根據(jù)自己的偏好對(duì)17種車型打分,打分范圍0-9.9,9.9分表示最高程度的偏好。
4.因子分析。因子摁下的形成和發(fā)展有相當(dāng)成的歷史,最早用以研究解決心理學(xué)和教育學(xué)方面的問題,由于計(jì)算量大,又缺少高速計(jì)算的設(shè)備,使因子分析的應(yīng)用和發(fā)展受到了很大的限制,甚至停滯了很長時(shí)間。后來,由于計(jì)算機(jī)技術(shù)的發(fā)展,才使因子分析的理論研究和計(jì)算問題有了很大的進(jìn)展。例如,某銷售企業(yè)對(duì)100名招聘人員的銷售策略知識(shí)和能力進(jìn)行測(cè)試,出了50道題的試卷,其內(nèi)容包括的面較廣,但總的來說,通過應(yīng)用因子分析方法可以歸納為六個(gè)方面;語言表達(dá)能力、邏輯思維能力、判斷事物的敏銳和果斷程度、思想品德、興趣愛好、生活常識(shí)等,我們將每一個(gè)方面成為因子。顯然,這里所說的因子不同于回歸分析中的因素,因?yàn)榍罢呤潜容^抽象的一種概念,而后者極有明確的實(shí)際意義。因子分析在市場(chǎng)調(diào)查分析中也有廣泛的應(yīng)用。