李宇明
人機交際其實是“人-機-機-人”交際,分為3個環(huán)節(jié)。(1)“人-機”交際:人具有一定語言技術能
力,能夠與機器展開對話;(2)“機-機”交際:機器設備之間形成信息溝通的網(wǎng)絡,需要包括語言文字規(guī)范在內的各種技術標準的支撐;(3)“機-人”交際:機器具有一定的與人對話的能力。
“人-機-機-人”交際成為交際常態(tài)時,人在生活、生產(chǎn)的諸多領域都需要與機器進行語言合作,人類進入“人機共生”時代。在人機共生的時代,計算機有常見的五大語言行為:(1)自動翻譯;(2)自動信息檢索;(3)自動摘要和信息抽??;(4)智能寫作;(5)聊天等社交活動。隨著語言智能的發(fā)展,處在人機共生中的機器,其角色將從與人簡單對話發(fā)展為人類的助手,即“AI助手”。為人類的特殊職業(yè)、特殊工作場景、特殊人群配置AI助手,已經(jīng)是科技和社會發(fā)展的現(xiàn)實問題,ChatGPT的出現(xiàn),把這一問題推到了社會關注的聚光燈下。
ChatGPT(有學者給了它一個音意結合的中文譯名“柴語生”)這一生成式預訓練語言模型,是由AI驅動的聊天機器人。它已經(jīng)不是一般意義上的人機對話系統(tǒng),而是一個以自然語言為交互方式的通用語言處理平臺,是語言智能發(fā)展的一個新高度。它的出現(xiàn)令人驚令人喜,也引發(fā)了許多新思考。例如:
(1)ChatGPT的會話能力驚人,說起話來“滔滔不絕”,這似乎說明語言能力的獲得不是靠(或不一定靠)規(guī)則學習,而是可以在數(shù)據(jù)中“習得”。這對于解釋第一語言習得的奧秘會有新思路,對于第二語言教學會有新啟發(fā)。
(2)大數(shù)據(jù)是ChatGPT發(fā)展的基礎。對大數(shù)據(jù)進行科學的管理、利用成為科學問題,也是社會問題。國家組建數(shù)據(jù)局,一些大學積極發(fā)展語言資源/語言數(shù)據(jù)學科,是具有前瞻性的。
(3)ChatGPT主要運用的是網(wǎng)絡數(shù)據(jù)。網(wǎng)絡數(shù)據(jù)的量增長很快,但是其類型主要是書面語,模態(tài)比較單一;其內容多是大眾領域的,一些特殊領域、特殊人群的數(shù)據(jù)難以自然增長,比如兒童成長數(shù)據(jù)、老年人的語言和生活數(shù)據(jù)等。ChatGPT滔滔不絕地講的外行話、缺乏常識的話、知識貧乏的話等,都是因為網(wǎng)絡上缺乏這類數(shù)據(jù)。這類數(shù)據(jù)可以稱為“網(wǎng)絡數(shù)據(jù)赤字”,就像稀有金屬一樣珍貴。有效收集、擁有這類數(shù)據(jù),有效彌補“網(wǎng)絡數(shù)據(jù)赤字”,具有戰(zhàn)略意義。
(4)ChatGPT發(fā)展迅速,現(xiàn)在已經(jīng)升級到GPT–4,在各種專業(yè)測試和學術基準上的表現(xiàn)幾乎與人類水平相當。中國也研發(fā)出了“星火認知”“文心一言”等。ChatGPT發(fā)展所帶來的倫理問題,也引起了世界的極大關注。這種語言智能產(chǎn)品對人類究竟意味著什么?對教育、科技論文的寫作與發(fā)表、咨詢產(chǎn)業(yè)、創(chuàng)意產(chǎn)業(yè)等一些社會行業(yè)意味著什么?對非英語語言、非英語國家意味著什么?國際上有許多人士甚至呼吁人工智能研發(fā)者停一停腳步,把一些問題想清楚了、把一些舉措跟上去了再開始研發(fā)。這種呼吁也許有用,也許沒人聽,但是呼吁者的倫理學思考是非常有意義的,是對人類終極命運和人工智能終極發(fā)展的思考。
在人機共生時代,特別是在ChatGPT問世后的時代,如何對語言數(shù)據(jù)進行研究與管理、如何彌補“網(wǎng)絡數(shù)據(jù)赤字”、如何為語言智能這匹飛馬裝上倫理學的馬嚼子等,都是值得語言學界認真思考的重要問題。