国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

喬姆斯基的形式語言理論與計算機程序的電路控制

2023-11-28 11:10:18
西部學刊 2023年21期
關鍵詞:計算機程序喬姆斯基謂詞

陳 銳

(中南大學 馬克思主義學院,長沙 410083)

生成語法學的奠基者艾弗拉姆·諾姆·喬姆斯基(1928年12月7日—,以下簡稱喬姆斯基)認為,自然語言所蘊含的遞歸性結(jié)構(gòu),可以轉(zhuǎn)換為具有一階謂詞邏輯形式的普遍語法,而一階謂詞邏輯也是計算機語言的邏輯基礎,計算機語言與喬姆斯基語言學具有完全的邏輯等價性,意味著人的認知推理過程可以通過電子機械方式進行自動化表達。

一、語言學的升級版——一階謂詞邏輯

(一)語言表達數(shù)學化的嘗試

1879年,德國著名的邏輯學家弗雷格第一次用精確的句法構(gòu)造出形式化的人工語言,開始了將語言推理數(shù)學化的探索,稱為一階謂詞演算系統(tǒng),即數(shù)理邏輯中的命題演算和謂詞演算。在謂詞邏輯中,命題分解成個體詞和謂詞兩個部分。個體詞表示可以獨立存在的事或物,它的詞匯包含形式邏輯所有的符號以及變量、常量、函數(shù)、固定的符號和關系共五類符號。謂詞則用來刻畫個體的性質(zhì)、狀態(tài)或個體間的關系。

二十世紀五十年代,哲學家、當世語言學泰斗、形式語言理論的奠基者喬姆斯基發(fā)現(xiàn),作為最為經(jīng)典的一種形式符號推理系統(tǒng),一階謂詞邏輯雖然屬于數(shù)理邏輯范疇,但利用自然語言的句法結(jié)構(gòu)和語義結(jié)構(gòu)所具有的遞歸性,通過將語言的短語結(jié)構(gòu)轉(zhuǎn)換為公理系統(tǒng)的形式邏輯,同樣可以構(gòu)造出人類語言的普遍語法和形式化表征。只要能將自然語言系統(tǒng)改造為符號邏輯演算系統(tǒng),就可以用數(shù)學方法描述人的認知過程,用數(shù)學符號構(gòu)造知識表達與推理的系統(tǒng)。從此,語言學這門傳統(tǒng)的人文學科成為一階謂詞邏輯的擴充或歸約,具有了自然科學的屬性。

(二)喬姆斯基語言學與計算機程序語言的邏輯共性

喬姆斯基在《句法結(jié)構(gòu)》中提出了轉(zhuǎn)換生成語法理論,被認為是二十世紀最偉大的語言學研究成果。他認為,人類語言按照詞序遵循句法、句法遵循語法的方式建構(gòu)而成,不論是自然語言還是人工語言,所有的人類語言都具有共同的基本語法結(jié)構(gòu),深層認知架構(gòu)中自帶轉(zhuǎn)換生成規(guī)則的語法,使不同語言的互譯成為可能。而兒童天生具有適用于所有語言的學習能力,這種與生俱來的能力得益于所有語言體系共同的深層語法結(jié)構(gòu),通常被稱作普遍語法理論。作為一種人工語言,計算機語言雖然表現(xiàn)形式與自然語言大相徑庭,但同樣是人類大腦智力活動的產(chǎn)物,帶有人類認知結(jié)構(gòu)的共同特性,因此從形式語言的角度來看,不同的計算機程序語言之間以及人工語言與自然語言之間,都具有共同的深層結(jié)構(gòu),也就是說,人機溝通以及機器與機器的溝通乃至模擬人類語音的人工智能遵循著同樣的語法規(guī)則,于是,在一階謂詞邏輯以及喬姆斯基語言學基礎上,正式誕生了龐大的計算機程序語言體系。

二、語言學、邏輯學與計算機科學的公理遞歸屬性

(一)一階謂詞的公理遞歸演繹性質(zhì)

公理化系統(tǒng)就是一個形式演繹系統(tǒng),由一組有限的公式構(gòu)成,它們由公理或是從公理推演出來的定理組成。遞歸是公理系統(tǒng)最核心的演繹方式,是指以有限數(shù)量的公理為基礎推演出下一級次的定理,通過不斷自我演算的方式,公理可以推導出無限的命題。一階謂詞邏輯的公理形式演繹體現(xiàn)在將有窮或無窮的符號集,賦值給合乎定義的有限數(shù)量的邏輯公式,得到無窮的邏輯表達式的集合,其中邏輯公式被反復調(diào)用,具有遞歸的屬性。

一階謂詞邏輯采用公理形式表現(xiàn)抽象的演繹過程,因此以一階謂詞邏輯為平臺,語言學、邏輯學、數(shù)學、計算機科學等不同領域的研究者可以利用其穩(wěn)定的遞歸特性構(gòu)造不同的公理演繹系統(tǒng),這些演繹系統(tǒng)不但遵循相同的遞歸模式生成無限的語句和函數(shù),彼此之間也能互相轉(zhuǎn)換,應用于不同的場景[1]。

(二)喬姆斯基語言學的公理化遞歸演繹

喬姆斯基語言學的主要概念和思想幾乎都來自數(shù)學,其中“遞歸”是最核心的概念?!斑f歸”的數(shù)學定義是,在函數(shù)的定義中使用函數(shù)自身的方法,描述以自相似方法重復事物的過程。在喬姆斯基理論中,遞歸指一個短語規(guī)則在生成句子的過程中無限制地重復使用。十九世紀的德國哲學家洪堡指出語言具有遞歸的演繹特征,即“把有限的手段作無限的使用”。從有限數(shù)量的詞匯中,以遞歸方式應用語法規(guī)則,可以得到任意數(shù)量、任意長度的句子。喬姆斯基深受數(shù)學形式主義學派的影響,力圖為語言建立一個永恒正確的模型,其畢生精力致力于把數(shù)學形式結(jié)構(gòu)移植到語言學,以實現(xiàn)其語言公理化的理想。在《句法結(jié)構(gòu)》一書中,喬姆斯基將人類千差萬別的語言提煉出一套普遍語法,這是一個排除現(xiàn)實具體意義的純形式系統(tǒng),其核心運行機制就是運用一套具有公理演繹特性的形式化語法規(guī)則推導出自然語言的邏輯結(jié)構(gòu),最后生成無限的句子集合[2]。喬姆斯基認為,普遍語法的生成時間先于兒童習得母語,即這套元規(guī)則本自具足于大腦的生物結(jié)構(gòu)之中,兒童習得母語或外語的過程,都是把該語言的具體符號代入這套早已準備好的語言自動機,自動機對語言材料的處理過程是,先為語言學建立一套有限的短語結(jié)構(gòu),再設立一套規(guī)則,最后生成出所有該語言合乎語法的句子,并根據(jù)形式系統(tǒng)的篩選,自動排除掉所有不合語法的句子。

喬姆斯基短語結(jié)構(gòu)的遞歸性具體演示如下。所有的句子的深層結(jié)構(gòu)都由名詞短語NP和動詞短語VP構(gòu)成,名詞短語NP一般是由名詞N加一個介詞短語Det構(gòu)成,動詞短語則由名詞短語NP加一個動詞V構(gòu)成,其遞歸特性可以逐層分解為:(1)S=NP+VP;(2)NP=Det+N;(3)VP=V+NP,S=NP+V+NP。我們發(fā)現(xiàn),名詞短語NP在深層結(jié)構(gòu)中重復出現(xiàn),構(gòu)成遞歸過程的核心要素,這個無限的遞歸過程就是語言遞歸性的體現(xiàn)??梢?短語結(jié)構(gòu)語法與公理系統(tǒng)十分相似,可以說,轉(zhuǎn)換生成語法的短語結(jié)構(gòu)充分體現(xiàn)了語言的遞歸原理的公理特性,體現(xiàn)了遞歸原理的公理化方法來描述自然語言的語法[3]。

圖1 短語結(jié)構(gòu)語法層次圖

(三)計算機程序語言的遞歸推演

如前所述,遞歸性是一階邏輯、自然語言的根本性質(zhì)之一,因此同樣也是程序語言的重要構(gòu)造形式。遞歸算法將許多復雜的問題分解為規(guī)模較小的子問題,通過直接或間接地不斷重復自我調(diào)用,不斷逼近臨界值,達到臨界值后,便跳出遞歸循環(huán),結(jié)束整個遞歸算法的操作。如1+2+3……+n的運算程序,實際就是n次重復調(diào)用i=i+1以及sum=sum+i兩個函數(shù)得到結(jié)果。遞歸程序如果用“樹”型圖表示,可更直觀地看到,其與喬姆斯基短語結(jié)構(gòu)的語法層次結(jié)構(gòu)圖相似的遞歸特性[4]。

“樹”作為計算機的一種基本數(shù)據(jù)結(jié)構(gòu),是由n個有限節(jié)點組成一個具有層次關系的有限集合,“樹”有且只有一個根,除根外其余結(jié)點互不相交,里面每一個節(jié)點具有相同的數(shù)據(jù)結(jié)構(gòu),都是由起始節(jié)點開始,往下延伸的每個分支節(jié)點代表一個推理步驟,上下節(jié)點之間是“一對多”的遞歸關系,每一步先在上一層節(jié)點中進行遞歸搜索,如果沒有滿足結(jié)束條件,就一層層往下延伸,不斷直接或間接地進行自我的調(diào)用[5]。計算機數(shù)據(jù)的遞歸結(jié)構(gòu)會以樹狀圖或堆棧圖的形式呈現(xiàn)。無論采用哪種形式,基本的結(jié)構(gòu)都是相同的:一個數(shù)據(jù)元素引用了同類型的其他元素。這種結(jié)構(gòu)可以繼續(xù)下去,形成更深的層級。每個層級都可以有它的子層級,而這些子層級又可以有自己的子層級,以此類推。

圖2 數(shù)據(jù)遞歸結(jié)構(gòu)圖

如圖2所示,根節(jié)點是數(shù)據(jù)的最初或最高級別,在許多情況下,根節(jié)點可能代表一個數(shù)據(jù)集或一組數(shù)據(jù)的總體。在子節(jié)點這個層級,我們開始看到數(shù)據(jù)的子集或更具體的分類,在上面的例子中,A和B是根節(jié)點的子節(jié)點。孫子節(jié)點是子節(jié)點的進一步細分,例如,A1和A2是A的子節(jié)點,然后A1a、A1b、A2a、A2b是A1和A2的子節(jié)點;同樣,B1、B2是B的子節(jié)點,然后B1a、B1b、B2a、B2b是B1和B2的子節(jié)點。這個結(jié)構(gòu)可以繼續(xù)下去,形成更深的層級。這種數(shù)據(jù)結(jié)構(gòu)通常用于表示具有層次關系的數(shù)據(jù)。

最后,程序語言的遞歸性是由計算機芯片電路的遞歸性決定的。1938年,現(xiàn)代信息論創(chuàng)始人香農(nóng)利用布爾代數(shù)的“邏輯乘”“邏輯加”和“邏輯非”的運算法則將電子元件組成“與”“或”“非”三種“門電路”模塊,這三種最基本的布爾邏輯電路以遞歸式的重復嵌套方式,構(gòu)成了計算機的硬件基礎——集成電路。所以,程序語言結(jié)構(gòu)與芯片電路設計的遞歸布局具有邏輯同一性。

三、計算機程序語言與喬姆斯基形式語言的數(shù)理邏輯表達

(一)一階邏輯構(gòu)造計算機程序語言

一階謂詞邏輯所構(gòu)建的形式語言是一組數(shù)學符號和規(guī)則來描述的語言。任何一種語言都是由該語言的字母表及其他基本符號所組成的滿足一定規(guī)則的符號串的集合。弗雷格認為,數(shù)學的自然數(shù)可以用純邏輯的術(shù)語來定義,因此所有數(shù)學公式都可以轉(zhuǎn)化為一種純粹邏輯的體系,用邏輯導出它們的性質(zhì)。例如4這個自然數(shù)可以定義為所有元素數(shù)為4的集合,意思是說,4這個數(shù)字既可以定義為不可分解的終結(jié)符號,也可以定義為一個可分解的非終結(jié)符。這個偉大的創(chuàng)見深刻地揭示了邏輯學、數(shù)學與計算機科學的內(nèi)在聯(lián)系,使得通過機械電子設備進行邏輯推理的自動化演算成為可能,它是計算機程序設計語言的前身,拉開了計算機模擬人類理性思維過程的序幕。

所謂計算機程序,就是一個動作執(zhí)行過程,由數(shù)據(jù)和指令(或算法)兩部分構(gòu)成,主要作用是告訴計算機在何時何地對什么數(shù)據(jù)做什么操作。何時,就是指令執(zhí)行序列;何地,就是數(shù)據(jù)所在的內(nèi)存地址以及操作所占用的內(nèi)存地址,換句話說,大部分程序的工作就是對內(nèi)存中的數(shù)據(jù)進行操作[5]。

所謂計算機程序語言是指計算機能夠接收和處理的、具有一定語法規(guī)則的語言。人們指揮計算機完成某個任務,程序語言擔負著人與計算機之間的溝通任務。這個語言是人機都能“讀懂”的語言,所謂機器“讀懂”,就是指程序語言符合芯片電路設計的布爾代數(shù)邏輯,布爾代數(shù)是計算機內(nèi)部運算的邏輯基礎。布爾代數(shù)邏輯又與一階謂詞邏輯相兼容,所以計算機高級語言和邏輯學有著本質(zhì)的聯(lián)系。計算機程序語言的發(fā)展分為機器語言、匯編語言和高級語言三個階段。比如,計算機程序語句“如果x是數(shù)學家,那么他必定是教授”??梢赞D(zhuǎn)換為一階邏輯表達式:?x(Math(x))→Prof(x)。箭頭“→”代表“如果,那么”(if…then…)的意思,“如果……,那么……”是邏輯學最基礎的邏輯關系,也是程序語言三大結(jié)構(gòu):順序結(jié)構(gòu)、循環(huán)結(jié)構(gòu)、選擇結(jié)構(gòu)的核心表達。

(二)喬姆斯基形式語言的數(shù)理邏輯化表達

喬姆斯基的短語結(jié)構(gòu)文法的具體表達,首先是將語言系統(tǒng)定義一個四元組G=(VN,VT,S,P),其中VN是非終結(jié)符號的集合,VT是終結(jié)符號的集合,S是初始符號,P是規(guī)則集合。非終結(jié)符號,非終結(jié)符是一個類或集合的記號,可理解為一個可拆分的元素,所以也叫語法變量或語法范疇。與之相反,終結(jié)符號不代表類,而是一個個體記號,是不可拆分的最小元素,所以是指組成語言的不可再分的基本符號。符號串則是由終結(jié)符號和非終結(jié)符號組成的任何有窮序列,俗稱句子。如果P的規(guī)則形式為A→β,A∈VN,A是非終結(jié)符號中非空的符號串,β∈(VN∪VT)*,β是包含終結(jié)符號與非終結(jié)符號的符號串。這個規(guī)則表示,如果存在一個符號串A,那么它可以被替換為符號串β,也就是一個函數(shù)可以表達為任意一句符合規(guī)則的句子,此文法被稱作上下文無關文法,或稱2型文法[6]。

四、喬姆斯基形式系統(tǒng)與計算機程序范式系統(tǒng)如何相互轉(zhuǎn)換

(一)計算機程序語言與形式語言的推理形式互換

正因為共同的公理化遞歸演繹性質(zhì),喬姆斯基形式語言理論直接促進了計算機程序語言的公理化進程,語言學與計算機程序系統(tǒng)獲得同等的表達效應。這個計算機程序語言的形式文法描述就是著名的巴科斯—諾爾范式(也稱為巴科斯—瑙爾范式),簡稱BNF。這個由美國人巴科斯和丹麥人諾爾命名的形式語法體系是一種程序元語言體系,如今的計算機各種高級程序語言都遵循這一語法范式[7]。

計算機科學家已經(jīng)證明,巴科斯—諾爾范式等價于喬姆斯基的2型文法。比如程序if…else…語句的合法性,用2型語法推理如下:(1)if…else…語句的語法規(guī)則是,if之后可以跟著else,也可以不跟else,但else前面必須有if;(2)換算為喬姆斯基形式語言推理形式,用i代表if,e代表else,那么if…else…語句的形式文法規(guī)則是:S→SS|iS|iSeS|ε;(3)據(jù)此推斷ieie、iie、iieie都是合法句子,因為e前面都有i,而ieei則是不合法句子,因為e前面有e[8]。

(二)計算機形式文法與喬姆斯基形式語言的文法規(guī)則互換

BNF語法規(guī)則同樣可以用喬姆斯基轉(zhuǎn)換生成語法的形式表達,比如喬姆斯基短語結(jié)構(gòu)四元組分為初始符號、終結(jié)符、非終結(jié)符和規(guī)則集合四個元素,在巴科斯—諾爾范式中,初始符號就是設定一個程序語句的開始狀態(tài);終結(jié)符是不可再分的字母、單詞符號、數(shù)字、界符等;非終結(jié)符可以看成是程序標識符或程序語句結(jié)構(gòu)等等語法范疇,例如,“算術(shù)表達式”這個非終結(jié)符代表某種算術(shù)式組成的類。

喬姆斯基的形式語言理論在被稱作“伽利略式的語言革命”。計算機科學家經(jīng)過多重論證已經(jīng)確定,喬姆斯基形式語言與計算機的自動機理論具有等價性,喬姆斯基總共發(fā)現(xiàn)了四型文法,皆與四種計算機語言自動機相對應。四種文法所產(chǎn)生的語言分別被計算機的四種語言自動機所接受和識別,既能描述自然語言,也能描述程序設計語言。如前所述,計算機程序語言的形式文法(巴科斯—諾爾范式)等價于喬姆斯基的2型文法,而喬姆斯基的3型文法,或稱正規(guī)文法,已被應用在人工智能的自動翻譯、語言識別等領域,因此喬姆斯基的4種類型文法被計算機科學界稱作喬姆斯基分類[9]。

五、程序語言如何控制芯片電路

如前所述,由于計算機程序語言的公理特性,使得計算機從機器語言、低級語言到高級語言在邏輯上皆具等價性,能夠互相轉(zhuǎn)譯,我們把這種互譯稱為編譯。計算機的功能由數(shù)據(jù)和控制兩部分構(gòu)成,這些功能的實現(xiàn)都要使用“0”“1”二進制數(shù)表示,所以在所有的程序設計語言中,只有由“0”“1”組成的機器語言被計算機芯片直接理解和執(zhí)行,其他程序設計語言編寫的程序叫做源程序,機器語言程序稱為目標代碼[10]。

根據(jù)喬姆斯基的形式語法理論原理,源程序和目標程序在語法邏輯上是等價的。為了不讓a、b、c、d、A、B、C、D這些大小寫字母以及各種常用的符號在轉(zhuǎn)換為“0”“1”過程中各自編碼產(chǎn)生混亂,美國標準化組織出臺了ASCII編碼,使用相同的編碼規(guī)則,統(tǒng)一規(guī)定了哪些符號對應哪些二進制數(shù)。比如加號“+”的ASCII碼可以表達為二進制“0010 1011”的形式。

在計算機芯片運行過程中,電路開關的通斷是基礎。芯片是由幾十億到幾百億的晶體管嵌套組合而成,所有的操作最終還原為一個晶體管的通或者斷,所以ASCII碼“1”“0”兩個符號所表征的最終物理形式就是有序的電壓的高低,稱為高電平和低電平。高電平表示打開電路,低電平表示關閉電路,也可以反過來設計,低電平表示打開電路,高電平表示關閉電路。

所謂計算機語言“指令”,就是某個代表一定控制命令的機器代碼,以“0”“1”的方式激活芯片內(nèi)部一堆“開關”的狀態(tài),高電平“開”、低電平“關”,或者低電平“開”、高電平“關”,這一堆高低電平的最終組合就叫“輸出”,其正好與“指令”所期待的演算結(jié)果相一致??傊?從FORTRAN、COBOL、LISP等高級語言轉(zhuǎn)譯匯編語言,再到機器語言直到還原為高低電壓的有序變化,這是一個層層轉(zhuǎn)換模擬的過程,所有的程序語言最終都將在芯片電路中還原為高電平或低電平兩種通斷信號,最終呈現(xiàn)為計算機屏幕中的圖像。

六、物質(zhì)與意識的辯證統(tǒng)一

語言是思想政治教育的主要工具和強力支撐,是思想意識表達的物質(zhì)外殼,正確的意識離不開準確的語言表達[11]。辯證唯物主義認為,世界的本原是物質(zhì),物質(zhì)是不依賴于人的意識并能為人的意識所反映的客觀實在。物質(zhì)決定意識,意識是對物質(zhì)的反映。同時,意識對物質(zhì)具有能動作用。也就是說,意識能夠正確反映客觀事物,在此基礎上,意識能夠反作用于客觀事物。正確的意識對客觀事物的發(fā)展具有促進作用,錯誤的意識對事物的發(fā)展起阻礙作用[12]。

計算機科學的奠基人圖靈設計了一臺可以在一套普遍語法規(guī)則之下運行所有計算機程序的機器,這臺機器被稱作圖靈通用機,其設計主旨與喬姆斯基形式語言有著異曲同工之妙,他們共同為人工智能的語言模擬乃至語言創(chuàng)造指明了理論方向。因此,計算機程序語言是人的意識能動性的一種特殊表現(xiàn),反映了正確的人類意識對于物質(zhì)世界的反作用。雖然語言改變了物質(zhì)電路,但語言不能決定物質(zhì)。計算機的本質(zhì)是將意識器官的部分功能電子化、自動化,通過操控物理機器中的電子變化模擬大腦的思維過程,語言代碼實質(zhì)上是對計算機芯片電路的映射,電路電壓的有序變化才是控制過程的物質(zhì)真相。所以意識的本質(zhì)是對物質(zhì)世界的反映,物質(zhì)對意識具有決定作用,物質(zhì)與意識是辯證統(tǒng)一的關系。

猜你喜歡
計算機程序喬姆斯基謂詞
涉及計算機程序的專利保護問題的研究
法制博覽(2021年15期)2021-11-24 13:11:31
被遮蔽的邏輯謂詞
——論胡好對邏輯謂詞的誤讀
黨項語謂詞前綴的分裂式
西夏研究(2020年2期)2020-06-01 05:19:12
Teaching methods in a Chinese Classroom
對計算機程序保護中“同一作品”原則的質(zhì)疑——兼評《著作權(quán)法(修訂草案送審稿)》第5條第15項
對“計算機程序產(chǎn)品”權(quán)利要求審查的比較研究
專利代理(2016年1期)2016-05-17 06:14:09
涉及計算機程序的發(fā)明專利申請產(chǎn)品權(quán)利要求的撰寫
專利代理(2016年1期)2016-05-17 06:13:57
也談“語言是存在的家”——從語言的主詞與謂詞看存在的殊相與共相
外語學刊(2016年4期)2016-01-23 02:33:55
Comments on Chomsky
跨越政治批評與學術(shù)研究的疆界——喬姆斯基訪談錄
安溪县| 吉首市| 安宁市| 南召县| 柳林县| 喜德县| 新巴尔虎左旗| 平定县| 宁德市| 德钦县| 长春市| 惠州市| 永善县| 华亭县| 四子王旗| 南漳县| 濮阳市| 武陟县| 政和县| 泰来县| 秀山| 云南省| 扬中市| 镇雄县| 赤峰市| 中江县| 宁安市| 昭平县| 东城区| 南平市| 惠州市| 缙云县| 丰顺县| 舟曲县| 海宁市| 郴州市| 贡山| 定西市| 叶城县| 澎湖县| 延川县|