伍業(yè)鋒
(暨南大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)學(xué)系,廣州510632)
任何學(xué)科在研究問(wèn)題、觀察世界方面都有著自己獨(dú)特的思維方式和視角。而統(tǒng)計(jì)學(xué)認(rèn)知世界基本的視角和思維起點(diǎn)應(yīng)該是總體。雖然經(jīng)典的統(tǒng)計(jì)教科書(shū)和各種專業(yè)文獻(xiàn)都把總體作為一個(gè)首要概念,做過(guò)許多界定,但對(duì)總體在整個(gè)統(tǒng)計(jì)學(xué)的思維過(guò)程中的核心和關(guān)鍵地位闡述仍不夠充分,甚至還存在著許多錯(cuò)漏和誤區(qū)。
例如英國(guó)大不列顛百科全書(shū)和國(guó)內(nèi)外許多流行的教科書(shū)將統(tǒng)計(jì)學(xué)界定為“一門(mén)研究如何收集、整理、分析和解釋數(shù)據(jù)的科學(xué)”。此定義強(qiáng)調(diào)了統(tǒng)計(jì)學(xué)的方法論(工具)性質(zhì)、量化特征和統(tǒng)計(jì)工作的流程表現(xiàn),廣為人們所接受。然而,該定義卻略顯寬泛,并沒(méi)有給出統(tǒng)計(jì)學(xué)有別于其他學(xué)科的核心特征,因?yàn)椴荒軗?jù)此認(rèn)為任何研究收集、整理、分析、解釋數(shù)據(jù)的科學(xué)都是統(tǒng)計(jì)學(xué)。實(shí)際上,幾乎所有的學(xué)科如物理、化學(xué)、心理學(xué)等自然和社會(huì)科學(xué)都在搜集、整理、分析和解釋其自身領(lǐng)域的數(shù)據(jù)方面積累了特殊的方法,這些方法中有些跟統(tǒng)計(jì)學(xué)有關(guān),但更多的卻不是統(tǒng)計(jì)學(xué)所能囊括和替代的,更不能說(shuō)這些學(xué)科是統(tǒng)計(jì)學(xué)。實(shí)際上,嚴(yán)格來(lái)講,當(dāng)今的統(tǒng)計(jì)學(xué)是以分析、認(rèn)識(shí)和解釋研究總體的數(shù)量表現(xiàn)、數(shù)量變動(dòng)和數(shù)量規(guī)律為目的,因而收集、整理數(shù)據(jù)的過(guò)程均應(yīng)以統(tǒng)計(jì)上的分析、認(rèn)識(shí)和解釋為依據(jù)。如檔案管理學(xué)、會(huì)計(jì)學(xué)、數(shù)據(jù)庫(kù)管理都面臨著大量的數(shù)據(jù)收集和整理過(guò)程,但是這些數(shù)據(jù)收集整理的目的并不僅僅是為統(tǒng)計(jì)分析做準(zhǔn)備的,所以這些學(xué)科也不能被稱為統(tǒng)計(jì)學(xué)。
另一方面,統(tǒng)計(jì)學(xué)的英文名稱是“statistics”。而基于漢語(yǔ)的習(xí)慣,經(jīng)典的中文統(tǒng)計(jì)學(xué)教材和文獻(xiàn),幾乎都將“統(tǒng)計(jì)”一詞給予了三個(gè)方面的解釋:統(tǒng)計(jì)工作、統(tǒng)計(jì)資料和統(tǒng)計(jì)學(xué),有些場(chǎng)合還做動(dòng)詞使用??墒侵形拿Q為什么要將該學(xué)科稱呼為“統(tǒng)計(jì)”或“統(tǒng)計(jì)學(xué)”而不是其他,幾乎沒(méi)有詳盡解釋。本文認(rèn)為因?yàn)樵撁Q正好體現(xiàn)了統(tǒng)計(jì)學(xué)的本質(zhì)特點(diǎn):“統(tǒng)而計(jì)之”,恰恰是統(tǒng)計(jì)學(xué)觀察世界“以分門(mén)別類為線索,從總體全局去把握”的思維方式的概括。事實(shí)上,從《辭?!返淖至x解釋來(lái)看,“統(tǒng)”有“從全局出發(fā)、全面”之意,這就是“總體”表達(dá)的全局觀和整體觀;而“計(jì)”帶有“結(jié)算、算清、算法”等方面的含義,進(jìn)一步可以解釋和引申為“計(jì)算、計(jì)量、測(cè)量、測(cè)算、把握”等等,突出體現(xiàn)在對(duì)事物、現(xiàn)象從整體上進(jìn)行數(shù)量方面的計(jì)算、測(cè)量、測(cè)算和把握,強(qiáng)調(diào)對(duì)事物現(xiàn)象的量的特征的把握和認(rèn)識(shí)。而其他的涉及數(shù)據(jù)收集、整理、分析和解釋的學(xué)科,卻不一定從總體出發(fā),也不一定特別關(guān)注數(shù)量方面的表現(xiàn)、特征和規(guī)律。
由此可見(jiàn),“統(tǒng)”字及其具體體現(xiàn)——“總體”——是統(tǒng)計(jì)學(xué)區(qū)別于其他類似學(xué)科的根本之處。那么總體究竟是何含義、有何特征、作何分類、統(tǒng)計(jì)上如何把握和認(rèn)識(shí)總體,很多文獻(xiàn)都有闡述和介紹,但是幾乎都有值得商榷的地方,或不夠全面、或不夠深入、或存在誤區(qū),甚至因?yàn)榭傮w概念的不統(tǒng)一而導(dǎo)致了社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)同數(shù)理統(tǒng)計(jì)學(xué)之間巨大分歧。本文將對(duì)這些問(wèn)題進(jìn)行詳細(xì)闡述,以期為統(tǒng)計(jì)學(xué)基本概念的統(tǒng)一和普適性做一些嘗試和努力。
統(tǒng)計(jì)總體是指統(tǒng)計(jì)研究的對(duì)象的全體,是由研究目的所指向的具有某種或某些共同特征的事物所組成的集合體,也可以稱之為統(tǒng)計(jì)母體。統(tǒng)計(jì)總體的設(shè)定是以問(wèn)題為導(dǎo)向的,是根據(jù)研究目的來(lái)設(shè)定的,因而既有其客觀性,又有一定的主觀性。一旦某個(gè)統(tǒng)計(jì)問(wèn)題被提出來(lái),首先要弄清楚該問(wèn)題要研究的總體是什么。
根據(jù)研究目的人為設(shè)定的或客觀存在的構(gòu)成總體的相對(duì)獨(dú)立的同質(zhì)單位稱為總體單位(Population unit)。如果這些總體單位是獨(dú)立可計(jì)數(shù)的客觀實(shí)體且不可進(jìn)一步細(xì)分,則可稱之為個(gè)體(Individual);若總體單位不存在實(shí)體,或無(wú)獨(dú)立固定形狀的實(shí)體且進(jìn)一步細(xì)分仍有意義,則嚴(yán)格來(lái)講只能稱之為總體單位,不能稱為個(gè)體。例如要評(píng)估一個(gè)池塘的水質(zhì)狀況,此時(shí)研究的總體是整個(gè)池塘的水體,然而構(gòu)成這個(gè)總體的實(shí)體是流質(zhì)的,沒(méi)有固定的形狀,不可以計(jì)數(shù),沒(méi)有獨(dú)立的個(gè)體。但此時(shí)可以根據(jù)研究水質(zhì)的目的,人為定義構(gòu)成總體的單位。例如以一個(gè)容積為10ml量杯來(lái)取水作為樣品,這樣每一量杯水就是相對(duì)同質(zhì)均勻獨(dú)立的總體單位,這個(gè)池塘的水體可以想象成一定數(shù)量的10ml量杯裝滿池塘相對(duì)位置的水然后按照這些水的原有位置堆放在一起。很顯然,此時(shí)總體單位是根據(jù)研究目的人為確定的,帶有一定的主觀性,比如可以是容積為10ml的量杯,也可以是容積為20ml的量杯,而且同容積的量杯其形狀也可能不一樣,如此對(duì)應(yīng)的構(gòu)成水體的總體單位就不一樣,但是無(wú)論如何,最終都要保證(至少要假定)每一量杯的水自身是均勻同質(zhì)(針對(duì)研究的特征)的,這樣才是構(gòu)成總體的一個(gè)總體單位。這種情形通常在總體是流質(zhì)性(如液體、氣體)或者粉末性的時(shí)候出現(xiàn)。例如要研究某廠家生產(chǎn)的水泥的品質(zhì),或要考察某家面粉生產(chǎn)企業(yè)的面粉質(zhì)量時(shí),面臨的總體都是粉末性總體,也沒(méi)有相對(duì)獨(dú)立的個(gè)體,必須利用相應(yīng)的容器人為定義總體單位。
值得注意的是,有些時(shí)候粉末性或流質(zhì)性總體并不是散裝的,而是已經(jīng)有相應(yīng)的容器包裝存放在一起。例如要檢驗(yàn)一個(gè)倉(cāng)庫(kù)的面粉的質(zhì)量,這些面粉是以口袋包裝好之后堆放在倉(cāng)庫(kù)當(dāng)中。很顯然,此時(shí)總體也無(wú)法區(qū)分出形狀固定、相對(duì)獨(dú)立可以計(jì)數(shù)的面粉個(gè)體。但是不是那些已經(jīng)包裝好的每袋面粉就是構(gòu)成總體的總體單位呢?不一定。如果因研究需要取樣檢驗(yàn)時(shí)擬直接抽取的是一袋袋面粉,并將每袋面粉看作是均勻同質(zhì)的,則可以將每袋面粉作為總體單位;但如果在抽取面粉樣品時(shí),是從其中某幾袋(或每袋)面粉中抽取一定體積(可以用勺、碗、量杯等容器)的面粉,則相應(yīng)約定容器容積的面粉才是構(gòu)成總體的總體單位,而原有的袋裝面粉稱為構(gòu)成總體的抽樣單元,也可以稱為構(gòu)成總體的子總體。
總體單位和個(gè)體這兩個(gè)概念在具體的實(shí)際總體尚有上述區(qū)別,而在后文論及的抽象總體當(dāng)中,則更需要將構(gòu)成總體的基本元素稱為總體單位。也即,個(gè)體只是總體單位的一種形式,總體單位的概念涵蓋個(gè)體。目前絕大部分中文統(tǒng)計(jì)文獻(xiàn)都將總體單位與個(gè)體通用,這是不規(guī)范的,因?yàn)檫@種通用導(dǎo)致有關(guān)無(wú)限總體和有限總體分類的矛盾。
此外,對(duì)確定的研究目的而言,總體和總體單位的角色是固定的,不可以互換。但是,當(dāng)研究目的改變的時(shí)候,一個(gè)研究目的下的總體,可能是另一個(gè)研究目的下的總體單位。例如,甲問(wèn)題要研究的總體是2010年A大學(xué)的大三統(tǒng)計(jì)學(xué)專業(yè)的本科班全體學(xué)生,此時(shí)A校統(tǒng)計(jì)學(xué)專業(yè)大三本科生班的每位學(xué)生就是總體單位;而乙問(wèn)題要研究的總體是2010年A大學(xué)的全體本科生班級(jí),此時(shí)A學(xué)校的大三統(tǒng)計(jì)學(xué)專業(yè)的本科生班級(jí)(由該班全體學(xué)生構(gòu)成)就成了一個(gè)總體單位了。所以,總體單位既可以是個(gè)體,也可以是包含其他個(gè)體的集合,在一定條件下可以轉(zhuǎn)換成為另一個(gè)研究目的下的總體。
綜上所述,血清脂蛋白相關(guān)磷脂酶A2水平升高、血清D-二聚體水平升高、血清高密度脂蛋白水平降低、高血壓病史是急性缺血性腦卒中的獨(dú)立影響因素。脂蛋白相關(guān)磷脂酶A2、D-二聚體水平、高血壓史與急性缺血性腦卒中呈明顯正相關(guān);高密度脂蛋白水平與急性缺血性腦卒中發(fā)生呈負(fù)相關(guān)。
1.2.1 有限總體和無(wú)限總體
一般地,按照總體所包含的總體單位的數(shù)目是否有限可以將之分為有限總體和無(wú)限總體。有限總體是指由數(shù)目有限的總體單位構(gòu)成的總體,總體單位的數(shù)目又稱為總體總量、總體規(guī)?;蚩傮w容量,通常記為N。例如全體中國(guó)人,北京市的全部工業(yè)企業(yè),某個(gè)池塘的水體①如果按照大部分中文文獻(xiàn)所表述的“包含個(gè)體數(shù)目有限可數(shù)的總體是有限總體,其他都是無(wú)限總體”的話,則某個(gè)池塘的水體應(yīng)該是無(wú)限總體,但這顯然與事實(shí)和常識(shí)不符,因?yàn)樵摮靥恋乃畯娜莘e到重量都是有限的。因此,本文從“總體單位有限”的角度,就可以將池塘解釋為有限總體。等等。而無(wú)限總體是指構(gòu)成總體的總體單位的數(shù)目是無(wú)限的,這類總體通常是那些不斷產(chǎn)生新總體單位的情形,即不斷成長(zhǎng)變化的總體,通常引入了時(shí)間因素或者思維抽象成分。例如某種條件下生產(chǎn)的產(chǎn)品總體,只要生產(chǎn)繼續(xù),這個(gè)總體就在不停地有新的單位加入;又如某種導(dǎo)彈的射程總體,只要可行,可以把這種類型的導(dǎo)彈發(fā)射無(wú)數(shù)次,得到無(wú)數(shù)個(gè)射程讀數(shù)。一般而言,真正意義上的無(wú)限總體往往是存在于人們的思維抽象(假定)當(dāng)中的抽象總體,現(xiàn)實(shí)世界的具體總體通常是有限的,只是總體規(guī)模N未必已知或未必可知而已。
1.2.2 具體總體和抽象總體。
總體按照其存在形態(tài)不同可以分為具體總體和抽象總體兩類。具體總體是由現(xiàn)實(shí)中存在的具體物體所組成的總體,如前述的池塘水體、全體中國(guó)人等,這是統(tǒng)計(jì)應(yīng)用研究通常面臨的總體,目前的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)主要研究的就是具體總體。抽象總體又稱為設(shè)想總體,是由各個(gè)具體事物的概念抽象所組成的總體,如前述的某種導(dǎo)彈的射程總體,人的身高總體,此時(shí)組成總體的單位或元素不再是具體的導(dǎo)彈或個(gè)人,而是導(dǎo)彈的射程、人的身高等特征屬性值,具體可能表現(xiàn)為數(shù)值和數(shù)據(jù),是一種概念和符號(hào)抽象,從而也將總體也抽象成概念符號(hào)。這種抽象在統(tǒng)計(jì)學(xué)的發(fā)展上有著重要意義,它使得統(tǒng)計(jì)數(shù)據(jù)的處理和方法研究走向形式化、符號(hào)化和一般化,從而與數(shù)學(xué)聯(lián)系起來(lái)變成科學(xué)嚴(yán)謹(jǐn)?shù)膶W(xué)科。數(shù)理統(tǒng)計(jì)學(xué)研究的總體多是抽象總體。具體總體和抽象總體的劃分,解決了社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)中“總體”概念的銜接與分野問(wèn)題,也充分展示了統(tǒng)計(jì)學(xué)的兩個(gè)分支學(xué)科之間的互補(bǔ)關(guān)系,為“大統(tǒng)計(jì)”學(xué)科體系的構(gòu)建建立了重要的橋梁。
1.2.3 總體和子總體。
有時(shí)候,因?yàn)榭傮w單位的客觀組合形態(tài),或者出于研究的需要,按照某些特征屬性,將具有相同屬性的部分總體單位歸成一類或一組,這些部分總體單位構(gòu)成的集合體就稱為這個(gè)總體下的子總體。例如全體中國(guó)人就可以分成很多個(gè)子總體,如全體中國(guó)男人,全體中國(guó)女人,全體中國(guó)兒童等等。當(dāng)總體很復(fù)雜而總體單位差異具有集聚性的時(shí)候,劃分子總體對(duì)于科學(xué)認(rèn)識(shí)總體是有很有用的。
樣本是指從總體抽取的一部分總體單位構(gòu)成的集合,樣本中所包含的總體單位的數(shù)目稱為樣本量或樣本規(guī)模(Samplesize),通常記為n。樣本規(guī)模n可以大到與總體規(guī)模N相同(此時(shí)樣本就是總體了),也可以小到只包含一個(gè)總體單位,但通常是處于1到N之間。
因此,通過(guò)樣本來(lái)研究總體有時(shí)候是無(wú)奈之舉,有時(shí)候則是主動(dòng)選擇,而關(guān)鍵的問(wèn)題在于:通過(guò)樣本來(lái)認(rèn)識(shí)總體,是否會(huì)存在偏差,有多高的準(zhǔn)確性?
通過(guò)總體的一部分(樣本)來(lái)研究認(rèn)識(shí)總體,以對(duì)部分的認(rèn)識(shí)來(lái)推測(cè)甚至代替對(duì)總體的認(rèn)識(shí),肯定會(huì)存在偏差。然而,我們對(duì)世界的認(rèn)識(shí)從來(lái)是存在偏差的,問(wèn)題的關(guān)鍵是人們能否認(rèn)識(shí)到這種偏差,能夠接受多大程度的偏差,以及偏差是否可控。統(tǒng)計(jì)學(xué)的核心問(wèn)題之一研究就是如何從總體中抽取樣本,使得受關(guān)注的總體特征可以通過(guò)樣本特征在可以容忍的可控偏差范圍內(nèi)表現(xiàn)出來(lái),即如何保證樣本在所關(guān)注的特征方面對(duì)總體特征具有較高的代表性。
如前所述,總體是統(tǒng)計(jì)研究世界的基本視角,而其對(duì)總體單位的關(guān)注,最終目的是要研究這些總體單位構(gòu)成的總體有著什么樣的數(shù)量表現(xiàn)、數(shù)量變化和數(shù)量規(guī)律,這些通稱為統(tǒng)計(jì)總體的數(shù)量特征,或總體的統(tǒng)計(jì)特征或總體特征。很顯然,這種總體特征是總體單位匯聚在一起構(gòu)成的集合特征。例如總體單位某方面的特性在總體當(dāng)中的平均水平、最大值、最小值、比例等等(如研究某時(shí)刻全體中國(guó)人平均身高、平均體重就是當(dāng)時(shí)全體中國(guó)人這個(gè)總體固有的總體特征)。很顯然,一旦總體確定,那么總體的這些集合特征的具體數(shù)值就完全確定,也即這些數(shù)值特征是確定的總體所固有的,統(tǒng)計(jì)上給總體的這些數(shù)值賦予了一個(gè)專門(mén)名稱——參數(shù)(Parameter)。參數(shù)就是總體固有的總體特征的數(shù)值表現(xiàn),通常是研究者想要知道的。
與總體相對(duì)應(yīng),樣本也是部分總體單位的集合,因此也會(huì)有相應(yīng)的集合特征,統(tǒng)計(jì)上把這種特征稱為樣本特征。需要注意的是,從一個(gè)容量為N的總體中抽取容量為n的樣本,根據(jù)抽取方法的不同會(huì)有很多種不同的樣本,這樣樣本當(dāng)中總體單位特征的集合特征的具體表現(xiàn)就會(huì)因?yàn)闃颖镜牟煌兴町?,也就是樣本特征具體的數(shù)值會(huì)因樣本的不同而不同,這樣樣本特征就成了一個(gè)可以變化的量,統(tǒng)計(jì)上稱之為統(tǒng)計(jì)量(Statistic),而統(tǒng)計(jì)量在某個(gè)樣本上的具體數(shù)值則稱為統(tǒng)計(jì)量的值,這些值往往由研究者根據(jù)具體樣本計(jì)算出來(lái)。例如,研究者隨機(jī)抽取了100名中國(guó)人,然后一一測(cè)量到他們的身高值,據(jù)此計(jì)算這100名中國(guó)人的平均身高是1.70米,此時(shí),100名中國(guó)人的平均身高就是此抽樣條件下的統(tǒng)計(jì)量,而1.70米就是這個(gè)統(tǒng)計(jì)量基于這100名中國(guó)人所構(gòu)成的具體樣本的取值,即統(tǒng)計(jì)量的值。
總之,無(wú)論是總體特征還是樣本特征,都是集合性的數(shù)量特征,前者隨著總體的確定有著固定的取值,但往往未知;后者隨著樣本的不同而取不同的值,但可以根據(jù)對(duì)具體樣本的考察得到相應(yīng)的數(shù)值。統(tǒng)計(jì)上就是利用可以變動(dòng)的已知的樣本特征的值來(lái)推測(cè)固定的卻未知的總體特征的值,而且設(shè)法讓樣本特征值與總體特征值的差距能處于可以容忍的范圍,這就是統(tǒng)計(jì)由樣本已知統(tǒng)計(jì)量的值推斷總體未知參數(shù)的核心過(guò)程。
目前,幾乎所有的統(tǒng)計(jì)學(xué)教科書(shū)都直接給出參數(shù)和統(tǒng)計(jì)量的概念,卻沒(méi)有將“總體特征”和“樣本特征”作為基本概念給予深入闡述和說(shuō)明,這顯然不利于理解這些基本概念。
目前,很多文獻(xiàn)將指標(biāo)界定為只是表征總體數(shù)量特征的名稱,這是不完整也是不符合事實(shí)的。實(shí)際上,統(tǒng)計(jì)理論和實(shí)踐中,指標(biāo)不僅僅可以表征總體特征,而且可以表征樣本特征,可以認(rèn)為它是表征集合特征的名稱。
要弄清指標(biāo)的含義,首先得從總體單位的特征及其屬性的描述——標(biāo)志——開(kāi)始。
標(biāo)志,也稱標(biāo)識(shí),是總體單位特征名稱的統(tǒng)稱。對(duì)總體單位,人們總是設(shè)法從各個(gè)角度來(lái)觀察、感知、測(cè)量它的特征和性質(zhì),才能更好地認(rèn)識(shí)它、掌握它。例如某某班的一名同學(xué),要認(rèn)知這位同學(xué),可能要從這個(gè)同學(xué)的姓名、性別、身高、體重、血型、星座、膚色、發(fā)型、出生地、性格等等各個(gè)方面來(lái)進(jìn)行展開(kāi)。顯然,姓名、性別、身高等等這些特征名稱是人們方便交流而定義出來(lái)的約定概念,有著各自特定的內(nèi)涵,而統(tǒng)領(lǐng)這些特征名稱的高一級(jí)的概念就是標(biāo)志,即姓名、身高等等所有有關(guān)總體單位特征的名稱,都是標(biāo)志。
由此可見(jiàn),標(biāo)志是描述總體單位特征名稱的統(tǒng)稱,而指標(biāo)是描述總體或樣本統(tǒng)計(jì)特征的名稱的統(tǒng)稱。但是這種劃分是相對(duì)的。如前所述,當(dāng)總體在一定條件下轉(zhuǎn)換成另一個(gè)總體的總體單位的時(shí)候,此時(shí)描述該總體的指標(biāo)也就成了另一總體下的總體單位的標(biāo)志了。而且,總體中每一個(gè)總體單位,均可以看作是該總體下容量為1的特殊樣本,如此描述總體單位特征性質(zhì)的標(biāo)志就可以看作這個(gè)特殊樣本的“指標(biāo)”了。因此,指標(biāo)和標(biāo)志在一定條件下可以相互轉(zhuǎn)換,基于此,可以進(jìn)一步把表述總體(樣本)特征和總體單位特征的名稱統(tǒng)稱為指標(biāo),或統(tǒng)計(jì)指標(biāo),這也是統(tǒng)計(jì)實(shí)踐應(yīng)用中常常使用“統(tǒng)計(jì)指標(biāo)”而很少用“統(tǒng)計(jì)標(biāo)志”這個(gè)術(shù)語(yǔ)的原因。
一般而言,統(tǒng)計(jì)指標(biāo)通常包括以下幾個(gè)方面的構(gòu)成要素:指標(biāo)名稱;指標(biāo)取值(或?qū)傩灾担┓秶?;?jì)量單位(不一定存在)。
為了利用數(shù)學(xué)語(yǔ)言將統(tǒng)計(jì)學(xué)形式化,需要將統(tǒng)計(jì)指標(biāo)符號(hào)化、抽象化,并與數(shù)學(xué)語(yǔ)言銜接,這就在統(tǒng)計(jì)學(xué)中引入了變量的概念。它既可以指代具體的統(tǒng)計(jì)指標(biāo)(具體變量),又可以是對(duì)具體統(tǒng)計(jì)指標(biāo)的理論抽象(抽象變量)。和指標(biāo)一樣,任何一個(gè)意義明確的具體變量至少要包含三個(gè)要素:變量名、變量取值范圍(值域)、計(jì)量單位。而抽象變量則直接用符號(hào)指代變量名,不需要界定特定內(nèi)涵,只需要以取值范圍(值域)來(lái)界定其外延即可,更不需要計(jì)量單位了。在數(shù)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)當(dāng)中,通常面臨的就是抽象總體和抽象變量。
實(shí)際上,對(duì)特定總體、樣本和總體單位特征的具體表現(xiàn)和度量,最終在統(tǒng)計(jì)上就記錄為“指標(biāo)(變量)+指標(biāo)(變量)取值(或?qū)傩员憩F(xiàn))[+計(jì)量單位]”,這就構(gòu)成了統(tǒng)計(jì)數(shù)據(jù)。如果針對(duì)一個(gè)總體(樣本)或總體單位就是一條數(shù)據(jù),如果是針對(duì)一批總體單位,就是一組或一批數(shù)據(jù)。由此可見(jiàn),完整意義的統(tǒng)計(jì)數(shù)據(jù)必須有著如上構(gòu)要素和特定內(nèi)涵,它是統(tǒng)計(jì)來(lái)研究認(rèn)識(shí)和把握總體的基本信息載體和“原材料”,其真實(shí)準(zhǔn)確性、及時(shí)有效性和匹配合適性,是統(tǒng)計(jì)能夠正確認(rèn)識(shí)總體乃至世界的基本前提。
綜上所述,可以看到,統(tǒng)計(jì)對(duì)世界的認(rèn)識(shí)和觀察是從總體的界定開(kāi)始的,而下屬概念個(gè)體、總體單位,是構(gòu)成總體的基本元素,對(duì)它們的考察均要放在某個(gè)總體的背景下來(lái)考慮。由于對(duì)總體所包含的所有總體單位進(jìn)行全面考察存在著種種現(xiàn)實(shí)障礙,因此統(tǒng)計(jì)常常要通過(guò)對(duì)總體的一部分——樣本——進(jìn)行觀察,來(lái)推測(cè)總體的情況。進(jìn)一步,任何對(duì)總體、樣本、總體單位的認(rèn)識(shí)和研究都不可能面面俱到,必然根據(jù)研究目的將焦點(diǎn)集中在總體、樣本、總體單位的某些方面的特征,于是統(tǒng)計(jì)就將總體特征、樣本特征、總體單位特征分別用參數(shù)、統(tǒng)計(jì)量、指標(biāo)、標(biāo)志等概念來(lái)具體表述,對(duì)于具體的現(xiàn)實(shí)總體,這些概念可以統(tǒng)一表述為指標(biāo),而對(duì)于抽象總體,這些概念往往統(tǒng)一表述為變量。特定總體(或樣本或總體單位)特定指標(biāo)或變量的取值(或?qū)傩员憩F(xiàn))加上可能存在的計(jì)量單位,就構(gòu)成了統(tǒng)計(jì)研究總體(樣本)特征的信息載體和“原材料”——統(tǒng)計(jì)數(shù)據(jù)。由此可見(jiàn),以研究總體的數(shù)量規(guī)律和數(shù)量特征為核心,從對(duì)總體、總體單位的界定開(kāi)始,到研究維度(指標(biāo)、變量)的設(shè)定,再到獲得真實(shí)、及時(shí)和合適的統(tǒng)計(jì)數(shù)據(jù),最后利用合適的方法來(lái)分析、推斷和展現(xiàn)總體的數(shù)量規(guī)律和特征,正是統(tǒng)計(jì)學(xué)真正區(qū)別于其他學(xué)科的根本所在。所以,總體是統(tǒng)計(jì)觀察世界的獨(dú)特視角。
[1]辭海(縮印本)[M].上海:上海辭書(shū)出版社,1989.
[2]陳希孺.統(tǒng)計(jì)學(xué)概貌[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,1989.
[3]陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡(jiǎn)史[M].長(zhǎng)沙:湖南教育出版社,2005.
[4]李金昌,程開(kāi)明.經(jīng)濟(jì)學(xué)研究的統(tǒng)計(jì)思想探討[J].商業(yè)經(jīng)濟(jì)與管理,2008,(8).
[5]徐國(guó)祥,王德發(fā).新中國(guó)統(tǒng)計(jì)思想史[M].上海:上海財(cái)經(jīng)大學(xué)出版社,1999.
[6]李金昌,蘇為華.統(tǒng)計(jì)學(xué)(修訂版)[M].北京:機(jī)械工業(yè)出版社,2009.
[7]謝啟南,韓兆洲主編.統(tǒng)計(jì)學(xué)原理(第六版)[M].廣州:暨南大學(xué)出版社,2006.
[8]賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)(第三版)[M].北京:中國(guó)人民大學(xué)出版社,2007.
[9]徐國(guó)祥.統(tǒng)計(jì)學(xué)[M].上海:世紀(jì)出版集團(tuán)上海人民出版,2007.
[10]杜子芳.抽樣技術(shù)及其應(yīng)用[M].北京:清華大學(xué)出版社,2005.
[11]郭松云.關(guān)于統(tǒng)計(jì)學(xué)中幾個(gè)基本概念界定的探討[J].統(tǒng)計(jì)與決策,2007,(6).
[12]王尚武.論統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念[J].統(tǒng)計(jì)與決策,1997,(1).