涂子沛
如果要追溯歷史,美國的人口普查部門和美國的建國可謂是相生相伴,但這個最早的統(tǒng)計部門在它成立100 多年后,依然是一個臨時機構(gòu)。
其實,從19 世紀50 年代的肯尼迪開始,每一屆辦公室主任都想把臨時的普查辦公室升級為一個常設(shè)機構(gòu)。民間的統(tǒng)計團體也長期在國會游說,包括沃克,他在離開普查系統(tǒng)之后,還擔任美國統(tǒng)計協(xié)會的主席,他也主張,普查范圍應(yīng)該不斷擴大、升級為永久性機構(gòu),這樣有助于保持工作的連續(xù)性。
但歷屆國會均拒絕了升級,總統(tǒng)不支持的理由也很明確,普查工作每10年才一次,公務(wù)員隊伍應(yīng)該盡量精簡。
1899年3月,為了籌備世紀之交的新普查,梅里亞姆被任命為普查辦公室主任。梅里亞姆是一名資深政客,曾擔任明尼蘇達州州長,但卻毫無統(tǒng)計工作經(jīng)驗,這一任命曾引起普查系統(tǒng)的強烈批評和反對。
但歷史常常和人類開玩笑:正是在這位外行的領(lǐng)導(dǎo)下,普查人實現(xiàn)了半個多世紀的夢想,普查辦公室成功升級為常設(shè)機構(gòu)!
姑娘的力量
這位外行走的也是“偏門”。要說原因,和霍爾瑞斯發(fā)明的自動打孔機有關(guān)。
那時候,在數(shù)據(jù)分析開始之前,必須把幾千萬張問卷先轉(zhuǎn)變?yōu)榇蛄丝椎目ㄆ?。因為霍爾瑞斯發(fā)明的自動打孔機,打孔工作已經(jīng)成為女性的專利。梅里亞姆因此雇用了幾千名卡片打孔員,清一色都是年輕的姑娘。她們每天打扮得花枝招展,像云彩一樣,在聯(lián)邦政府的辦公大樓里穿梭,成為一道亮麗的風景線。
除了年輕,姑娘們還有一個共同的特點——都想留在首都華盛頓結(jié)婚生子。梅里亞姆在國會、政府頻繁組織聯(lián)誼活動,于是,姑娘們和議員、公務(wù)員們打成了一片。在她們的強力攻勢下,國會議員在不知不覺中被爭取了過來。美國的人口學(xué)之父、著名的威爾科斯教授在談到這段往事時說:“在處理和國會的關(guān)系上,梅里亞姆十分聰明,這些姑娘令人眼花繚亂。普查局之所以能成為永久性的常設(shè)機構(gòu),和統(tǒng)計科學(xué)沒有‘半毛錢關(guān)系,僅僅是因為有人想把姑娘們留在華盛頓?!?/p>
姑娘們“攻陷”了國會,但任何一個法案的通過,還需要總統(tǒng)點頭。恰恰這時候的總統(tǒng)西奧多·羅斯福也非常重視數(shù)據(jù),而且就在議員們消受了艷福、改變了立場的時候,發(fā)生了一件小事,讓羅斯??吹搅诵?shù)據(jù)的大力量。
棉花也瘋狂
1793 年軋棉機的發(fā)明,激活了正在萎縮的奴隸制,棉花種植業(yè)從此興起,并成為美國的重要經(jīng)濟支柱,這種情況一直延續(xù)到20世紀。1899年,美國共產(chǎn)棉花900萬擔,其中3/4 用于出口。但接下來的幾年,英國的紡織業(yè)不景氣,導(dǎo)致棉花價格大幅波動,不少棉農(nóng)破產(chǎn)。羅斯??偨y(tǒng)因此急需數(shù)據(jù),他要求統(tǒng)計一年當中各個時段的棉花產(chǎn)量,以便根據(jù)價格變化進行調(diào)控。
每一年的棉花產(chǎn)量,農(nóng)業(yè)部都會統(tǒng)計,來年的產(chǎn)量他們也會預(yù)測,但這次羅斯??偨y(tǒng)要的,是一年內(nèi)各個時段的實時數(shù)據(jù)。農(nóng)業(yè)部左拼右湊,還是束手無策,拿不出可靠的數(shù)據(jù)。
這時候,普查辦公室一個部門主管諾思靈機一動。他提出,在剛剛完成的工業(yè)普查中,已經(jīng)掌握了全國各地軋棉機的分布和數(shù)量,每一朵棉花都要通過軋棉機去籽。因此,通過軋棉機的軋棉記錄,我們就可以準確地計算不同時間節(jié)點上的棉花產(chǎn)量。諾思用了一年的時間,在全國3萬臺軋棉機上建立了統(tǒng)計報告制度,每月統(tǒng)計兩次,從而獲得了棉花產(chǎn)量的準確數(shù)據(jù)。這個數(shù)據(jù)精細到半個月,羅斯??偨y(tǒng)大感欣慰,于是同意普查辦公室升級為永久性的常設(shè)機構(gòu)。
1902年3月,在經(jīng)歷了100多年的波折起伏之后,美國聯(lián)邦政府終于在內(nèi)務(wù)部成立了普查局。一年后,普查局和勞工統(tǒng)計局一起并入商務(wù)勞工部(DCL)。因為棉花統(tǒng)計的功勞,諾思晉升為普查局局長。
人口普查局和勞工統(tǒng)計局堪稱美國統(tǒng)計工作的中樞和主干,美國政府后來的很多統(tǒng)計部門,例如交通統(tǒng)計部、能源統(tǒng)計部、衛(wèi)生統(tǒng)計部大多是在這兩個部門的基礎(chǔ)上分化而來的。因為沒有統(tǒng)一的標準,全社會的數(shù)據(jù)就不可能進行有效的對比和匯總,即使計算得再準確,也沒有什么意義。1901年,美國還建立了國家標準與技術(shù)研究院(NIST),推進各類標準在社會中的建立和應(yīng)用。勞工統(tǒng)計局、普查局、標準局與1863年成立的農(nóng)業(yè)統(tǒng)計局并駕齊驅(qū),標志著美國國家統(tǒng)計機構(gòu)的健全和崛起。
值得一提的是,在棉花統(tǒng)計過程中,開始出現(xiàn)商業(yè)隱私的爭議。普查局最初以縣為單位,公開發(fā)布各地的棉花產(chǎn)量,以供各級政府、商業(yè)組織和個體農(nóng)戶參考。但對于一個小縣,如果只有兩三臺軋棉機,公布其總數(shù),則意味著各臺軋棉機的機主就能推算出其他軋棉機的產(chǎn)量,這相當于商業(yè)機密的變相泄露,因此引起了一些地方的抗議。普查局很快修改了規(guī)定,規(guī)定一個郡縣的軋棉機如果不超過三臺,其數(shù)據(jù)必須合并在其他郡縣中,不予單獨發(fā)布。這也表明,美國社會的隱私意識在逐步成熟。
到1910年,第27任總統(tǒng)塔夫脫首次為普查發(fā)表了專門的總統(tǒng)聲明,向大眾公開保證政府不會濫用普查信息和數(shù)據(jù)。他在聲明中說:
“普查的唯一目標是獲得我們國家人口和資源的總體信息,我們要求每個人都回答問卷,是為了保證能夠編撰細致的統(tǒng)計信息。普查和納稅、軍隊服役、強制入學(xué)、移民管理以及任何國家、州和地方層面的執(zhí)法工作沒有任何關(guān)系,任何人都不會因為提供這些信息而受到傷害,沒有任何必要擔心我們會公開個人情況及事務(wù)的數(shù)據(jù)。我們會對信息提供人的權(quán)益進行合理保護,每個工作人員都禁止泄露任何信息,違反規(guī)定必受重罰?!?/p>
棉花,又一次改變了美國歷史。
數(shù)據(jù)安全浮出水面
除了隱私意識的成熟,在棉花的統(tǒng)計和預(yù)測中,數(shù)據(jù)安全的問題也開始浮出水面。上文提到,農(nóng)業(yè)統(tǒng)計局每個月都要發(fā)布統(tǒng)計報告,其中的一個重要指標,就是對下個月各種農(nóng)作物產(chǎn)量的預(yù)測。這些數(shù)據(jù)會影響全國很多商品的供求關(guān)系,甚至左右期貨市場價格的波動和成交量的多少。因此,這份報告在發(fā)布之前,被視為機密。1903年,農(nóng)業(yè)部總統(tǒng)計師海德成立了一個三人小組,專門負責對全國各種農(nóng)作物的產(chǎn)量進行預(yù)測。每月正式發(fā)布數(shù)據(jù)的當天,三人小組就會召開會議,共同確定各項數(shù)據(jù)的大小,然后在同一時間提供給所有的新聞媒體。
1903年12月,羅斯福給農(nóng)業(yè)部部長寫信,說他收到多起投訴,有人提前知道了棉花的產(chǎn)量數(shù)據(jù),并利用它在股票和期貨市場上進行內(nèi)線交易。這意味著數(shù)據(jù)泄密。海德立刻修改了數(shù)據(jù)討論和發(fā)布的過程:他把會議地點定在了一個與外界通信隔絕的房間,并規(guī)定在完成數(shù)據(jù)預(yù)測的工作之后,三人小組的成員也必須待在會議室,直到數(shù)據(jù)正式對外發(fā)布之后才能離開。
海德認為這萬無一失,他也向部長拍胸膛保證,但羅斯福總統(tǒng)還是繼續(xù)接到投訴。
泄密者確實是三人小組中的一名成員,他是助理統(tǒng)計師霍姆斯。霍姆斯把數(shù)據(jù)泄露給了華爾街一位棉花投機商賴柏。在被要求不能離開會議室之后,他跟賴柏約定,用會議室百葉窗的窗簾作為信號:當窗簾拉到一半,就是約定的棉花產(chǎn)量,窗簾最后停在不同的位置,就表示不同的產(chǎn)量。
海德百思不得其解,但他最終還是想出了一個辦法,挖出了“內(nèi)鬼”。
一天,在所有的數(shù)據(jù)匯總、預(yù)測完成后,他在最后一分鐘提出要緊急修改,但這時候,霍姆斯的信號已經(jīng)發(fā)出,得到錯誤信號的賴柏在當天的交易中損失了25000 美元。巨虧之下,賴柏憤憤不平,他在交易現(xiàn)場公開指責有人“篡改”了數(shù)據(jù),這當然也暴露了他提前知道數(shù)據(jù)這一事實。在后續(xù)的調(diào)查當中,賴柏供出了霍姆斯。
令人尷尬的是,雖然霍姆斯對其陰謀供認不諱,但當時卻找不到一部法律能給他定罪。因為無法可依,農(nóng)業(yè)部最后只能對霍姆斯開除了事,總統(tǒng)計師海德被迫引咎辭職。
面對丑聞的尷尬,羅斯福十分震怒,他責令立即立法。1909 年,美國國會通過立法,將公務(wù)員提前泄露相關(guān)數(shù)據(jù)的行為定為刑事犯罪。此后,農(nóng)業(yè)部著力完善了數(shù)據(jù)安全機制,推出了“鎖定”制度:凡是接觸到敏感數(shù)據(jù)的工作人員,在數(shù)據(jù)發(fā)布前必須被隔離,數(shù)據(jù)公布以后隔離才能解除。鎖定制度同時也明確規(guī)定,數(shù)據(jù)大小的最終決定權(quán)在專業(yè)統(tǒng)計人員手中,即使是農(nóng)業(yè)部部長,也屬于鎖定的對象:他僅僅在數(shù)據(jù)正式發(fā)布前的15分鐘,在同樣封閉的情況下聽取專業(yè)人員對數(shù)據(jù)的解釋,以便回答記者們提出的問題。這個制度不僅提高了數(shù)據(jù)的安全性,也把數(shù)據(jù)的決策權(quán)牢牢地掌控在專業(yè)技術(shù)人員手里,保證了統(tǒng)計工作的中立性和專業(yè)性。
這種鎖定制度很快在其他統(tǒng)計部門得到推廣。例如,每屆總統(tǒng)大選期間,“失業(yè)率”就十分敏感,甚至可以影響老總統(tǒng)的去留和成敗,它的計算過程,都是在“鎖定”的情況下由統(tǒng)計學(xué)家獨立計算得出的,連勞工部部長也無權(quán)過問。
隱私觀念的成熟、數(shù)據(jù)安全管理制度的完善都表明,這時候的美國,已經(jīng)開始向一個具有現(xiàn)代意識的國家轉(zhuǎn)變。