勞倫斯·R.道爾
譯/裴淑娟
尋找來(lái)自外星球文明的信號(hào),為什么不從地球上一些已知的非人類通信系統(tǒng)著手呢?鯨數(shù)百萬(wàn)年前就已經(jīng)有了全球通信系統(tǒng)——這比智人的出現(xiàn)都要早。蜜蜂在某種程度上通過(guò)舞蹈交流,很久之前就通過(guò)民主辯論的方式?jīng)Q定筑巢的最佳地點(diǎn)。這個(gè)時(shí)間比人類民主政治體系的產(chǎn)生還要早數(shù)百萬(wàn)年呢。類似的例子還有很多。據(jù)我所知,研究動(dòng)物交流體系的人都會(huì)得出一致結(jié)論:這些物種比人類預(yù)想的“更善言辭”。
標(biāo)題
通過(guò)研究動(dòng)物通信,我和同事研發(fā)出一種新的探測(cè)器,一種“通信情報(bào)”過(guò)濾器,來(lái)判斷某個(gè)太空信號(hào)是否來(lái)自先進(jìn)文明。SETI(搜尋地外文明學(xué)會(huì))已經(jīng)開(kāi)始尋找窄頻帶頻率的無(wú)線電傳輸及快速閃爍的光學(xué)信號(hào)。根據(jù)已有的天體物理學(xué)知識(shí),此類信號(hào)傳輸顯然是人為的。他們的發(fā)現(xiàn)證明了星際間信號(hào)傳輸技術(shù)存在的可能性。SETI的研究一般會(huì)拋開(kāi)寬頻帶通信信號(hào)及較慢的光學(xué)脈沖,因?yàn)檫€不太清楚它們的來(lái)源。這些信號(hào)有可能來(lái)自外星人,也有可能來(lái)自自然界的無(wú)線電波,我們目前還不能很好地區(qū)分它們。
簡(jiǎn)單地說(shuō),我們可能收到過(guò)來(lái)自外星人的信息,但因未能識(shí)別它們的信號(hào),就將其忽略了。這或許能解釋為什么我們?cè)谶^(guò)去50年一直未能探測(cè)到星際間的通信信號(hào)。
通過(guò)15年的努力,我和同事找到了一種更好的方法。我們嘗試把信息理論應(yīng)用到人類和動(dòng)物的通信系統(tǒng)上,結(jié)果發(fā)現(xiàn)某些物種能夠傳達(dá)復(fù)雜的思想,雖然目前還不知道它們具體在說(shuō)些什么。使用“通信系統(tǒng)”這個(gè)術(shù)語(yǔ),目的在于不去預(yù)設(shè)其他物種是否具有人類意義上的語(yǔ)言。復(fù)雜的通信遵循類似于語(yǔ)法且能辨別智能內(nèi)容的通用規(guī)則。如果有足夠大的信息樣本,我們可以量化其復(fù)雜度或語(yǔ)法結(jié)構(gòu)。在信息理論的數(shù)學(xué)中,該結(jié)構(gòu)被稱為“條件信息熵”,是由通信基本單元(例如字母和音素) 之間的數(shù)學(xué)關(guān)系構(gòu)成的。日常話語(yǔ)中,這種結(jié)構(gòu)被識(shí)別為語(yǔ)法,從更基本的層面上講,可被視為聲音轉(zhuǎn)化成詞和句子的包裝。在加利福尼亞州山景城的SETI研究所,我們已經(jīng)開(kāi)始從SETI數(shù)據(jù)庫(kù)中尋找這種結(jié)構(gòu)。
我和我的同事布倫達(dá)·麥科恩及加利福尼亞大學(xué)戴維斯分校的肖恩·F.漢澤決定使用易于分類的聲音信號(hào)研究既具有社會(huì)復(fù)雜性又高度依賴聲學(xué)通信的物種。我們的前三個(gè)主題物種分別為瓶鼻海豚、松鼠猴和座頭鯨。
齊普夫定律是從字母、單詞和音素的早期統(tǒng)計(jì)研究中發(fā)現(xiàn)的人類語(yǔ)言學(xué)的一個(gè)特征。它以哈佛大學(xué)語(yǔ)言學(xué)家喬治·齊普命名。在英語(yǔ)文本中,“e”出現(xiàn)的頻次要高于“t”,而“t”出現(xiàn)的頻次又高于“a”,最不常出現(xiàn)的字母是“q”。如果以頻率的降序列出從“e”到“q”的字母,并在雙對(duì)數(shù)圖上繪制它們的頻率,則可以用4 5°線(一條斜率為-1的線)擬合這些值。日語(yǔ)、德語(yǔ)、印地語(yǔ)和其他幾十種語(yǔ)言對(duì)話中的字母、單詞或音素亦是如此。嬰兒的咿呀學(xué)語(yǔ)并不遵循齊普夫定律,它的斜率小于-1,因?yàn)樗麄兊穆曇魩缀跏请S機(jī)溢出的。但是隨著孩子們的語(yǔ)言學(xué)習(xí),斜度逐漸傾斜,并在大約24個(gè)月的時(shí)候達(dá)到-1。
數(shù)學(xué)語(yǔ)言學(xué)家認(rèn)為,這個(gè)-1斜率表明給定系列的聲音或書(shū)寫(xiě)符號(hào)包含足夠的復(fù)雜性來(lái)構(gòu)成語(yǔ)言。這是個(gè)必要但不充分條件。齊普夫稱,形成這個(gè)-1斜率的原因是“最小努力原則”。它在發(fā)射器(想要以最少能量發(fā)送信號(hào))與接收器(想要最多冗余以確保接收到完整信息)之間取得平衡。
座頭鯨交流的復(fù)雜性可與人類語(yǔ)言相匹敵,這表明存在甚至連外星人都要遵循的交流通用原則
信息理論應(yīng)用的關(guān)鍵是隔離信令單元。例如,只要在摩爾斯電碼中繪制所有的點(diǎn)和破折號(hào),即可得到約為-0.2的齊普夫斜率。但是,如果一個(gè)基本單位有多個(gè)點(diǎn)和短畫(huà)線,斜率會(huì)向-1傾斜,這反映了字母表中的字母在該系統(tǒng)中是如何被編碼的。由此,人們可以逆向設(shè)計(jì)原始單位的意義。
大多數(shù)語(yǔ)言學(xué)家曾認(rèn)為,齊普夫定律只是人類語(yǔ)言的特征。但是我們?cè)诶L制成年海豚哨音的發(fā)生頻率時(shí),發(fā)現(xiàn)它們也遵循了齊普夫定律!這讓我們異常興奮。后來(lái),兩只小寬吻海豚在加利福尼亞的海洋世界出生,我們記錄了它們的嬰兒哨音,發(fā)現(xiàn)它們和咿呀學(xué)語(yǔ)的人類嬰兒有著相同的齊普夫斜率。嬰兒海豚學(xué)習(xí)它們的哨音,并以跟人類寶寶學(xué)習(xí)語(yǔ)言相同的方式學(xué)習(xí)它們的通信系統(tǒng)。當(dāng)海豚長(zhǎng)到12個(gè)月的時(shí)候,它們哨音的發(fā)生頻率分布也達(dá)到了-1斜率。
我們還在探究寬吻海豚是否和鯨一樣,擁有內(nèi)部復(fù)雜性接近人類語(yǔ)言的通信系統(tǒng)。這種復(fù)雜性使通信具有復(fù)原能力。在環(huán)境噪聲、干擾障礙物和其他影響信號(hào)傳播的效應(yīng)下,任何交換信息的生物都必須具備這種能力。人類語(yǔ)言的構(gòu)造為冗余提供了條件。在最基本的層次上,這種結(jié)構(gòu)決定了給定字母出現(xiàn)的概率。如果我告訴你我在想一個(gè)單詞,你可能會(huì)猜到第一個(gè)字母是“t”,因?yàn)檫@是英語(yǔ)中最常見(jiàn)的單詞首字母。你的猜測(cè)是安全的,但沒(méi)什么信息含量。相反,如果你猜到的字母是“q”,并且是正確的,你會(huì)得到一些真正的信息,假如我正在想的這個(gè)詞確實(shí)是
以字母“q”開(kāi)頭的話。
現(xiàn)在進(jìn)一步來(lái)講。如果我告訴你,我正在想的字母是首字母為“q”的單詞的第二個(gè)字母,你會(huì)立刻猜到字母“u”。為什么?因?yàn)槟阒涝谟⒄Z(yǔ)中這兩個(gè)字母一起出現(xiàn)的概率幾乎是100%。為了猜測(cè)空缺內(nèi)容,你不僅使用了字母出現(xiàn)的概率,還運(yùn)用了這兩個(gè)字母之間的條件概率——在字母“q”給定的情況下,“u”出現(xiàn)的概率。每當(dāng)我們的大腦需要修復(fù)信息傳輸中的錯(cuò)誤,如低墨副本文件上的褪色文本或嘈雜電話呼叫中的混亂話語(yǔ)時(shí),就會(huì)使用條件概率。
對(duì)于英語(yǔ)單詞,條件概率在一行中可以連續(xù)指定多達(dá)9個(gè)單詞。如果缺少一個(gè)單詞,你可以根據(jù)上下文猜測(cè)出來(lái);缺少兩個(gè)單詞,你仍然可以根據(jù)上下文將其恢復(fù)。舉個(gè)簡(jiǎn)單的例子,一句話中缺少一個(gè)單詞:“How are___doing today?”我們可以很容易地根據(jù)已知的英語(yǔ)規(guī)則填寫(xiě)出缺少的單詞“you”?,F(xiàn)在再來(lái)看一個(gè)句子中缺少兩個(gè)詞的例子:“How___ ___ doing today?”這句話可以是:“How is Joe doing today ?” 但也不乏其他可能性。顯然,缺失的單詞越多,根據(jù)上下文填充它們的難度就越大,它們之間的條件概率就越低。對(duì)于人類的大多數(shù)書(shū)面語(yǔ)言, 在一行中缺失約9個(gè)單詞時(shí),條件依賴性就會(huì)消失。當(dāng)有10個(gè)單詞缺失時(shí),就真的沒(méi)有線索來(lái)推測(cè)缺失的內(nèi)容可能是什么了。
我們?cè)趧?dòng)物通信系統(tǒng)中發(fā)現(xiàn)了同樣的條件概率,例如我們和阿拉斯加鯨基金會(huì)的弗雷德·夏普在阿拉斯加?xùn)|南部記錄座頭鯨聲音時(shí)的發(fā)現(xiàn)。座頭鯨因其歌聲而出名,通常會(huì)在夏威夷交配時(shí)歌唱,這與它們?cè)诎⒗辜拥慕新暎?qū)趕魚(yú)群進(jìn)入氣泡網(wǎng)的呼叫和社交呼叫)極為不同。我們分別記錄了有無(wú)船舶噪聲兩種情況下的座頭鯨叫聲,并計(jì)算了海洋信道的靜態(tài)作用,然后用信息理論量化鯨魚(yú)在何種程度下會(huì)減慢其發(fā)聲,以確保信息的無(wú)誤接收。
正如預(yù)期的那樣,當(dāng)有船的噪音時(shí),鯨魚(yú)減慢了它們的發(fā)聲速度,正如人們打電話時(shí)背景中帶有噪音時(shí)所做的那樣。但是它們的傳輸速度只是減慢了理論上要求的3/5,以確保對(duì)方收到的整個(gè)信息無(wú)誤。它們是如何做到不按照噪音水平要求來(lái)減慢聲音的?我們思考了一段時(shí)間,意識(shí)到它們的通信系統(tǒng)一定有足夠的規(guī)則結(jié)構(gòu)來(lái)恢復(fù)最后2/5的信號(hào)。座頭鯨是利用了它們聲音等價(jià)詞之間的條件概率。如此一來(lái),不必接收全部信息,就能夠填補(bǔ)空缺。
我們還發(fā)現(xiàn)了海豚交流的內(nèi)部結(jié)構(gòu)。它們與座頭鯨最大的區(qū)別是,海豚有大約50種核心的信號(hào)類型,而座頭鯨有幾百種。我們目前正在收集數(shù)據(jù),以確定座頭鯨通信系統(tǒng)的最高階熵。
海豚不必接收全部信息來(lái)填補(bǔ)缺失
有天文學(xué)家用我們的方法區(qū)分來(lái)自天體的自然信號(hào)與來(lái)自智慧生命的信號(hào)。天文學(xué)家喬瑟琳·貝爾·伯勒爾和安東尼·休伊什最初在1967年發(fā)現(xiàn)恒星脈沖星的信號(hào)時(shí),媒體將它們稱為“LGMs”(小綠人)。因?yàn)檫@些無(wú)線電源發(fā)出的脈沖非常規(guī)律,一些科學(xué)家猜測(cè)它們可能來(lái)自非常先進(jìn)的外星人。我們?cè)诎拇罄麃唶?guó)家望遠(yuǎn)鏡中心西蒙·約翰斯頓的幫助下重新分析了帆船座脈沖星的脈沖,發(fā)現(xiàn)脈沖星信號(hào)的齊普夫斜率約為-0.3。這不同于我們所知的任何一種語(yǔ)言。此外,我們還發(fā)現(xiàn)這些脈沖信號(hào)內(nèi)很少存在或根本沒(méi)有條件概率結(jié)構(gòu)?,F(xiàn)在,我們已經(jīng)知道脈沖星
是超新星的天然殘余物。因此,信息理論可以輕易地將推定的智能信號(hào)和自然信號(hào)區(qū)分開(kāi)。
我們目前正在分析從SETI研究所的艾倫望遠(yuǎn)鏡陣列獲得的微波數(shù)據(jù),該陣列由在1千兆赫至1 0千兆赫的頻帶中觀測(cè)的42個(gè)單獨(dú)的望遠(yuǎn)鏡組成。除了尋找窄頻帶無(wú)線電載波的常規(guī)技術(shù)之外,我們現(xiàn)在開(kāi)始應(yīng)用信息理論測(cè)量。這項(xiàng)工作是與SETI研究所的格里·哈普、喬恩·理查茲和吉爾·塔特合作進(jìn)行的。假如我們能夠找到遵循齊普夫定律的信號(hào),就會(huì)繼續(xù)前進(jìn),并在信號(hào)內(nèi)尋找語(yǔ)法結(jié)構(gòu),以量化候選消息實(shí)際上的復(fù)雜性。
為了傳播信息,即便是非常先進(jìn)的地外文明,也必須遵守信息理論的規(guī)則。由于缺乏共同的符號(hào)(與座頭鯨相同的問(wèn)題),我們可能無(wú)法解讀這樣的信息,但是能夠從中了解到它們的通信系統(tǒng)以及它們思維過(guò)程的復(fù)雜性。如果SETI信號(hào)的條件概率是20階,則不僅信號(hào)源是人為的,而且它反映的是比地球上任何語(yǔ)言都復(fù)雜得多的語(yǔ)言。我們后續(xù)將會(huì)對(duì)外星物種思維過(guò)程的復(fù)雜性進(jìn)行定量測(cè)量。