喻國(guó)明 蘇健威 黃哲浩
【摘要】生成式人工智能時(shí)代的一個(gè)重要特征,是自然交互正在逐漸取代圖形控件交互成為主流的人機(jī)交互范式。其對(duì)媒介傳播的影響在于:一方面使媒介超越個(gè)性化的范疇,能夠以極為細(xì)微的需求為基礎(chǔ)形成資源的聚攏以及與用戶的細(xì)密連接;另一方面,自然交互范式允許媒介以無(wú)界的方式融入用戶情境中。自然交互范式存在三個(gè)主要的發(fā)展階段,分別是初期話語(yǔ)溝通、中期模態(tài)拓展與數(shù)據(jù)匯通、遠(yuǎn)期心智融通,這本質(zhì)上是自然交互范式從模擬人類交往到超越人類交往的過(guò)程。
【關(guān)鍵詞】生成式人工智能 人機(jī)交互 自然交互 媒介實(shí)踐
【中圖分類號(hào)】G206 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1003-6687(2024)3-058-08
【DOI】 10.13786/j.cnki.cn14-1066/g2.2024.3.008
人機(jī)交互是研究人、計(jì)算機(jī)之間相互影響的技術(shù),其研究重點(diǎn)是用戶界面,即人與計(jì)算機(jī)之間傳遞、交換信息的媒介和對(duì)話接口。[1]20世紀(jì)70年代,美國(guó)施樂(lè)公司研究人員艾倫·凱發(fā)明了重疊式多窗口系統(tǒng),形成了圖形用戶界面,[2]隨后基于觸摸屏的交互,例如iOS、Android的系統(tǒng)交互界面,在交互學(xué)習(xí)成本和易用性方面做出了重大改進(jìn),使得圖形界面交互得到了極大普及,成為移動(dòng)互聯(lián)網(wǎng)媒介時(shí)代人機(jī)交互的主要形式。
自然交互是區(qū)別于圖形控件交互的一種嶄新形態(tài),它顛覆了圖形控件交互所依賴的鍵盤、鼠標(biāo)或觸摸屏交互邏輯,通過(guò)自然語(yǔ)言、表情、行為等方式,使用戶與計(jì)算機(jī)形成交流,催生了智能音箱、智能客服、語(yǔ)音助手等諸多媒介形態(tài)。伴隨著以ChatGPT為代表的生成式人工智能技術(shù)的成熟,自然交互進(jìn)一步實(shí)現(xiàn)了從堪用到好用的質(zhì)變。一方面,ChatGPT通過(guò)持續(xù)與用戶對(duì)話,不斷對(duì)用戶的個(gè)性化要素進(jìn)行識(shí)別、學(xué)習(xí)和整合,并將輸出要素進(jìn)行結(jié)構(gòu)化處理,以貼近用戶的方式進(jìn)行有機(jī)呈現(xiàn),實(shí)現(xiàn)了對(duì)人類交往方式的深度模擬。[3]另一方面,ChatGPT能夠?qū)崿F(xiàn)連續(xù)性人機(jī)協(xié)同。用戶可以在個(gè)人賬號(hào)中保存人機(jī)對(duì)話記錄,并基于該記錄實(shí)現(xiàn)長(zhǎng)期連續(xù)性對(duì)話。[4]這種前所未有的技術(shù)特性驅(qū)動(dòng)了人機(jī)交互范式的變革——自然交互將逐漸取代圖形控件交互成為主流。
由于交互界面是用戶(人類)調(diào)用數(shù)據(jù)、算力、算法等機(jī)器智能要素的關(guān)鍵中介,因此人機(jī)交互范式的革新標(biāo)志著機(jī)器智能可供性的提升以及人類借由媒介增強(qiáng)自身實(shí)踐能力的拓張,這是整個(gè)社會(huì)深度媒介化進(jìn)程中一個(gè)極為重要的變化。據(jù)此,本文聚焦生成式人工智能時(shí)代的自然交互范式,在其概念特征的基礎(chǔ)上,探討自然交互范式如何影響現(xiàn)有媒介實(shí)踐,及其未來(lái)走向何處。
一、自然交互范式:定義、特征及其與媒介的關(guān)聯(lián)
1. 自然交互:以先天習(xí)得、符合直覺(jué)的方式與機(jī)器交流
自然交互即基于自然用戶界面的交互范式。自然用戶界面是人機(jī)交互界面的新興范式,通過(guò)研究現(xiàn)實(shí)世界的環(huán)境和情況,利用新興的技術(shù)能力和感知解決方案實(shí)現(xiàn)物理和數(shù)字對(duì)象之間更準(zhǔn)確和最優(yōu)化的交互,從而達(dá)到用戶界面不可見(jiàn)或者交互的學(xué)習(xí)過(guò)程不可見(jiàn)的目的,其重點(diǎn)關(guān)注傳統(tǒng)的人類能力(如觸摸、視覺(jué)、言語(yǔ)、手寫、動(dòng)作)和更重要、更高層次的過(guò)程(如認(rèn)知、創(chuàng)造力、探索)。[5]自然用戶界面被認(rèn)為是下一代交互界面的主流。用戶只需以最自然的交流方式(如自然語(yǔ)言和肢體動(dòng)作)就能與計(jì)算機(jī)進(jìn)行交互,與計(jì)算機(jī)交流就如同和一個(gè)真實(shí)的人交流一樣。在基于自然用戶界面的交互時(shí)代,鍵盤和鼠標(biāo)等將會(huì)逐漸消失,取而代之的是更為自然、更具直覺(jué)性的科技手段,如觸摸控制、動(dòng)作控制、自然語(yǔ)言控制等。[6]
自然交互具有通用性、規(guī)范與有效性、經(jīng)驗(yàn)性三個(gè)基本特征,這三個(gè)基本特征詮釋了自然交互區(qū)別于以往交互方式的關(guān)鍵之處。
(1)通用性:機(jī)器拓展人類實(shí)踐的全功能。作為自然交互的基礎(chǔ),語(yǔ)言是一種生活形式上的一致,[7]是人們可以相互理解的基礎(chǔ),是意義的載體。盡管并非所有人都共享同一套語(yǔ)言系統(tǒng),但是人們對(duì)語(yǔ)言的運(yùn)用模式,語(yǔ)言的構(gòu)成要素是大同小異的,都展現(xiàn)了人類對(duì)事物的理解與邏輯推理,都承載了絕大部分的意義,實(shí)現(xiàn)了大部分的交流,而并不是某一種語(yǔ)言系統(tǒng)只能實(shí)現(xiàn)某一個(gè)或幾個(gè)功能。因此,生成式人工智能的核心即讓人工智能步入通用性實(shí)踐,能夠處理多范圍任務(wù),解決多領(lǐng)域問(wèn)題,[8]表現(xiàn)出自然交互的通用性。
(2)規(guī)范與有效性:機(jī)器對(duì)人類認(rèn)知機(jī)制的深度模擬。語(yǔ)句的意義是為了某種目的而產(chǎn)生的,并且個(gè)體只有理解使用者的目的,才能真正理解語(yǔ)句的意義,自然交互才有可能產(chǎn)生。若人工智能無(wú)法理解使用者的意圖,它就無(wú)法對(duì)使用者進(jìn)行合適有效的反饋,自然交互就不可能實(shí)現(xiàn)。因此自然交互必須具有規(guī)范性。在人際傳播中,符號(hào)互動(dòng)論與社會(huì)行為等理論都指向了雙方主體共享同一套規(guī)范體系。在自然用戶界面上,這種規(guī)范性更為凸顯,使用者組織的語(yǔ)言必須遵守所使用語(yǔ)言的語(yǔ)法,要構(gòu)建合適恰當(dāng)?shù)恼Z(yǔ)境,要真實(shí)明確地反映自己的需求,這樣才能實(shí)現(xiàn)有效的自然交互。
(3)經(jīng)驗(yàn)性:人類個(gè)性化交互的慣習(xí)累積與模式形成。“語(yǔ)言游戲論”指出,人類在場(chǎng)景中學(xué)會(huì)表達(dá),在場(chǎng)景中理解語(yǔ)義。在此基礎(chǔ)上,語(yǔ)句逐步脫離特定場(chǎng)景,話語(yǔ)套著話語(yǔ),一個(gè)詞的意義由另一個(gè)詞或一串詞來(lái)解釋。[9]這充分表明,人們?cè)谧匀唤换ブ袝?huì)積累一定的經(jīng)驗(yàn),并運(yùn)用到之后的自然交互中。然而,經(jīng)驗(yàn)性除了表現(xiàn)為交互語(yǔ)言蘊(yùn)含的個(gè)體在之前的知識(shí)積累外,還能體現(xiàn)為在交互過(guò)程中個(gè)體根據(jù)反饋實(shí)現(xiàn)的調(diào)節(jié)與修正。在與生成式人工智能的交互中,這一特性更為明顯,用戶可以對(duì)人工智能進(jìn)行預(yù)訓(xùn)練,使其對(duì)某個(gè)板塊的知識(shí)完成匯聚和積累,再通過(guò)指令促成其對(duì)問(wèn)題的準(zhǔn)確回答,若回答不能讓用戶滿意,用戶可以給予反饋,此時(shí)人工智能將根據(jù)反饋進(jìn)行解釋、調(diào)整或糾正,從而完成多輪交互。
2. 自然交互范式下的媒介:細(xì)微的連接與無(wú)感化的中介
為了更好地理解自然交互范式對(duì)媒介的影響,我們有必要先回顧自然交互的基礎(chǔ)——自然語(yǔ)言之于傳播的意義。維特根斯坦曾提出“語(yǔ)言圖像論”,將世界的本質(zhì)看作“事態(tài)”,即對(duì)象關(guān)系的連接。因?yàn)榫哂邢嗤Y(jié)構(gòu),所以語(yǔ)言可以描繪世界、表達(dá)心靈。“語(yǔ)言游戲論”則認(rèn)為語(yǔ)言作為一種原始形式的活動(dòng)而存在,是和人類其他活動(dòng)編織在一起的。[9]比如老師指著一塊石頭,學(xué)生說(shuō)出對(duì)應(yīng)的“石頭”一詞,在這一層面上,語(yǔ)言是一種對(duì)世界的直觀反映與描摹,是一種不可逆的同外界的交互形式。未經(jīng)分析的語(yǔ)言表達(dá)式是我們正常的交際工具,其意義在使用中被賦予。[10]這里的關(guān)鍵在于,維特根斯坦以語(yǔ)言的工具觀揭示了人類與世界交互的連續(xù)性、發(fā)展性。奧斯汀與塞爾的“言語(yǔ)行為論”在此基礎(chǔ)上強(qiáng)調(diào)語(yǔ)句的意義是由使用者(人)在某種語(yǔ)境下,為了某種目的而產(chǎn)生的。因此個(gè)體只有理解使用者使用語(yǔ)句的意圖時(shí),才能真正理解語(yǔ)句的意義。[11]它將語(yǔ)境、行為等非語(yǔ)言要素引入意義的交流。這些理論共同揭示了自然語(yǔ)言之于交流的關(guān)鍵意義在于,其實(shí)現(xiàn)了用戶外部經(jīng)驗(yàn)世界的解析和內(nèi)心世界的演繹,幫助交流的雙方理解領(lǐng)會(huì)彼此的意蘊(yùn)。
從自然語(yǔ)言之于傳播的意義出發(fā),自然交互范式對(duì)媒介與傳播的影響可以歸結(jié)為:一方面,自然交互范式構(gòu)造了傳播場(chǎng)域中更加細(xì)密的連接。從傳播學(xué)的核心概念“受眾”被更具有交互主動(dòng)性色彩的“用戶”所替代可以窺見(jiàn),在媒介(中介形式)不斷迭變的過(guò)程中存在著一條重要的規(guī)律——人類與媒介的交互程度是在不斷加深的。人類通過(guò)與機(jī)器越來(lái)越深入地交互,不斷驅(qū)動(dòng)機(jī)器輸出與自身更加匹配的內(nèi)容。例如衛(wèi)視頻道的切換使得用戶能夠自主選擇心儀的節(jié)目,檢索詞的輸入幫助用戶快速定位到需要的信息等。媒介交互范式進(jìn)化帶來(lái)的最為顯著的影響是媒介中介的粒度加細(xì),即從大眾傳播到分眾傳播,再到針對(duì)每一個(gè)用戶的個(gè)性化傳播,用戶能夠使用越來(lái)越豐富、多元、立體的信息來(lái)描摹自身以及自身的需求,驅(qū)動(dòng)媒介對(duì)相關(guān)的信息、資源、服務(wù)等形成針對(duì)性的聚攏。這是理解人機(jī)交互范式的變革如何改變媒介的一個(gè)重要視角。自然交互范式的興起意味著用戶無(wú)須再受圖形控件交互可供性的限制,能夠以自然語(yǔ)言的指涉范圍和建構(gòu)能力形成更為廣闊的信息輸入,使媒介超越個(gè)性化的范疇,能夠以極為細(xì)微的需求(或語(yǔ)義)為基礎(chǔ)形成資源的聚攏以及與用戶的細(xì)密連接。
另一方面,自然交互范式允許媒介以無(wú)界的方式融入用戶情境中。正如Valli提出,自然交互是人們通過(guò)手勢(shì)、表情、動(dòng)作自然地交流,并通過(guò)環(huán)顧四周和操縱物理事物來(lái)發(fā)現(xiàn)世界;這里的關(guān)鍵假設(shè)是,應(yīng)該允許他們與技術(shù)交互,因?yàn)樗麄兞?xí)慣于在日常生活中與現(xiàn)實(shí)世界交互,正如進(jìn)化和教育教他們做的那樣。[12]這意味著自然交互范式下的媒介與用戶形成了更加深刻的技術(shù)具身關(guān)系,從而無(wú)感地、系統(tǒng)地增強(qiáng)人類的實(shí)踐能力和實(shí)踐自由。
二、基于自然交互范式的媒介實(shí)踐:雙向預(yù)設(shè)、場(chǎng)景解析與會(huì)話行為
生成式人工智能技術(shù)的應(yīng)用熱潮帶動(dòng)了自然交互范式的興起,使得以圖形控件交互為特征的媒介應(yīng)用逐步呈現(xiàn)出新的特征——人們能夠用平日里自然表達(dá)的語(yǔ)句與人工智能交流,從而達(dá)到自己的目的,不必再將自己的意圖轉(zhuǎn)譯成指令或高度凝練成詞塊或控件。這種新興的媒介趨向?qū)⑸羁痰赜绊懨浇檫M(jìn)化的邏輯。因此,對(duì)基于自然交互范式的媒介實(shí)踐進(jìn)行分析是十分必要的。
語(yǔ)用學(xué)為分析這種新興媒介實(shí)踐提供了一個(gè)有效的框架。該學(xué)科是與自然語(yǔ)言交互關(guān)系最為緊密的幾個(gè)學(xué)科之一,主要關(guān)注“在不同語(yǔ)境中尋找并確立使話語(yǔ)意義得以恰當(dāng)?shù)乇磉_(dá)和準(zhǔn)確地理解的基本原則和準(zhǔn)則”。[13](15-16)在語(yǔ)用學(xué)研究中,一般將會(huì)話劃分為語(yǔ)境、指示詞語(yǔ)、會(huì)話含義、預(yù)設(shè)、言語(yǔ)行為和會(huì)話結(jié)構(gòu)幾個(gè)部分。[13](13)這些要素并不是完全獨(dú)立的,在自然交互的過(guò)程中,不同的要素不斷交互,表現(xiàn)為一定程度的交織樣態(tài)。語(yǔ)用學(xué)的框架為分析基于自然語(yǔ)言的自然交互提供了一個(gè)有益的框架。在此,本文借助這一框架,將自然交互范式構(gòu)造下的媒介實(shí)踐分為媒介與用戶的雙向認(rèn)知(對(duì)應(yīng)預(yù)設(shè))、媒介的用戶場(chǎng)景解析(對(duì)應(yīng)語(yǔ)境)、媒介與用戶的會(huì)話協(xié)同(對(duì)應(yīng)指示詞語(yǔ)、言語(yǔ)行為與會(huì)話結(jié)構(gòu))三個(gè)部分進(jìn)行分析(見(jiàn)圖1)。
1. 媒介與用戶的雙向預(yù)設(shè):將用戶(媒介)介紹給媒介(用戶)
預(yù)設(shè)指言語(yǔ)交際過(guò)程中說(shuō)話人對(duì)聽(tīng)話人和自己已有知識(shí)的推測(cè),是說(shuō)話人認(rèn)為聽(tīng)話人聽(tīng)到話語(yǔ)之后總能根據(jù)語(yǔ)境或常識(shí)等推斷出來(lái)的信息。[14]比如“丈夫”或者“妻子”在作為指示詞使用時(shí),其假設(shè)是對(duì)應(yīng)人物已婚?;谧匀唤换シ妒剑脩襞c媒介交流過(guò)程中的預(yù)設(shè),呈現(xiàn)為媒介對(duì)用戶的預(yù)設(shè)以及用戶對(duì)媒介的預(yù)設(shè),這兩種預(yù)設(shè)均在交互過(guò)程中發(fā)揮作用。
(1)媒介對(duì)用戶的預(yù)設(shè)。媒介對(duì)用戶的預(yù)設(shè)主要是指在會(huì)話開(kāi)始之初(或在媒介執(zhí)行任務(wù)之前),媒介基于生成式人工智能技術(shù)的自然語(yǔ)言處理功能,確定針對(duì)每一位用戶的內(nèi)容生成、資源匹配策略,從而實(shí)現(xiàn)自身對(duì)交互過(guò)程與使用者的預(yù)設(shè)。媒介對(duì)用戶的預(yù)設(shè)通常涉及對(duì)用戶興趣、需求、知識(shí)結(jié)構(gòu)、文化背景等方面的假設(shè)。諸多生成式人工智能應(yīng)用已經(jīng)做出嘗試。比如GPT-4的“Custom instruction”功能允許用戶自行介紹自己,并說(shuō)明希望GPT扮演何種角色以及如何響應(yīng)。這種預(yù)設(shè)會(huì)體現(xiàn)在用戶設(shè)置后的所有對(duì)話之中。此外一些應(yīng)用也嘗試以問(wèn)答的形式來(lái)獲取更多用戶數(shù)據(jù),形成對(duì)用戶更個(gè)性化、多維化的認(rèn)知,比如百度的文心一言大模型就采取了問(wèn)答形式,通過(guò)基本的設(shè)問(wèn)獲悉用戶使用習(xí)慣與偏好。
目前,媒介對(duì)用戶預(yù)設(shè)的實(shí)踐仍然不夠成熟。一方面,僅僅基于文本或語(yǔ)音模態(tài)信號(hào)進(jìn)行分析精確度有限。比如僅依靠文本交互很難準(zhǔn)確判斷用戶的性別、年齡、文化背景等特征,這與人類交流中依靠多模態(tài)信息的融合來(lái)構(gòu)建印象相去甚遠(yuǎn)。未來(lái)人工智能在接入三維數(shù)字虛擬空間的交互情境后,有望獲得更多的識(shí)別信號(hào),從而生成更為細(xì)膩的內(nèi)容和服務(wù)響應(yīng)。另一方面,大模型需要哪些用戶數(shù)據(jù),如何對(duì)用戶數(shù)據(jù)進(jìn)行維度化和結(jié)構(gòu)化,如何使用戶更輕松有效地告訴大模型“自己是一個(gè)什么樣的人”,這些問(wèn)題仍然有待相關(guān)理論與技術(shù)的進(jìn)一步探索,比如需要考慮不同用戶群體(如老年人、兒童等)數(shù)據(jù)采集方式的問(wèn)題,以及不同文化背景的用戶會(huì)側(cè)重關(guān)注哪些方面的自我信息等。
(2)用戶對(duì)媒介的預(yù)設(shè)。用戶在與媒介交互時(shí),也會(huì)基于自己的經(jīng)驗(yàn)和認(rèn)知,對(duì)媒介可供性、價(jià)值傾向、交互方式等形成預(yù)期和預(yù)設(shè),并相應(yīng)調(diào)整自己的交互策略。例如,首次使用智能助手聊天機(jī)器人的用戶可能會(huì)默認(rèn)其只能進(jìn)行有限的問(wèn)答,不具備復(fù)雜交流的能力。這種預(yù)設(shè)會(huì)導(dǎo)致用戶選擇簡(jiǎn)單的提問(wèn)方式。經(jīng)過(guò)一段時(shí)間的互動(dòng)后,用戶發(fā)現(xiàn)聊天機(jī)器人可以進(jìn)行更深入的討論,他們的提問(wèn)才會(huì)逐漸變得更開(kāi)放和復(fù)雜。
學(xué)界對(duì)這種預(yù)設(shè)的研究可以追溯至用戶對(duì)計(jì)算機(jī)的社會(huì)反應(yīng)。比如早期部分學(xué)者認(rèn)為擬人化是個(gè)體對(duì)計(jì)算機(jī)反應(yīng)的重要機(jī)理。這一觀點(diǎn)認(rèn)為個(gè)體會(huì)在本質(zhì)上認(rèn)為計(jì)算機(jī)是人類,即將計(jì)算機(jī)“擬人化”,因此用戶在與計(jì)算機(jī)交互時(shí)會(huì)使用人類社會(huì)的交往規(guī)范。[15]其后著名的“計(jì)算機(jī)為社會(huì)行動(dòng)者”范式(the computers are social actors paradigm, CASA)也在諸多實(shí)驗(yàn)證據(jù)的基礎(chǔ)上表明,個(gè)人會(huì)無(wú)意識(shí)地將社會(huì)規(guī)則和期望應(yīng)用于計(jì)算機(jī),例如性別刻板印象、種族認(rèn)同、禮貌、互惠、認(rèn)知承諾、個(gè)性尊重等。[16]這些研究都指向這樣的結(jié)論,即用戶在與計(jì)算機(jī)交往時(shí),即使其不具備自然交互的特征,用戶也不僅僅將其視為無(wú)社會(huì)屬性的機(jī)器,而是在無(wú)意識(shí)中形成某種預(yù)設(shè)。
進(jìn)入生成式人工智能技術(shù)時(shí)代,一個(gè)十分顯著的特征是自然交互范式賦予媒介以具身性的功能角色(見(jiàn)圖2),目前有關(guān)具身角色的媒介實(shí)踐呈現(xiàn)為兩種思路:
一是媒介應(yīng)用自身作為具身角色。比如字節(jié)跳動(dòng)的豆包、小米的小愛(ài)同學(xué)(大模型版)、接入大模型的游戲NPC等,它們直接利用大模型生成對(duì)話內(nèi)容,賦予自身一個(gè)具體的角色屬性。這可以幫助用戶更好地建立對(duì)媒介的預(yù)設(shè),增加交互的代入感。二是大模型自身作為工具并內(nèi)嵌聊天機(jī)器人,這些聊天機(jī)器人綁定著具身角色。比如Poe內(nèi)置的“Chat Assistants”,以及ChatGPT的“My GPTs”都允許用戶使用已經(jīng)設(shè)計(jì)好的具身角色或自行創(chuàng)建具身角色。這些聊天機(jī)器人配合大模型生成對(duì)話,同樣幫助用戶建立預(yù)設(shè)。相較于沒(méi)有具身角色的自然交互,具身角色更有利于減少用戶的使用門檻,引導(dǎo)用戶形成對(duì)會(huì)話有建設(shè)性的媒介預(yù)設(shè),從而提升用戶體驗(yàn)。
2. 媒介的用戶場(chǎng)景解析:通過(guò)場(chǎng)景匹配、應(yīng)用開(kāi)發(fā)、嵌入系統(tǒng)形成會(huì)話語(yǔ)境
語(yǔ)境即“運(yùn)用自然語(yǔ)言進(jìn)行言語(yǔ)交際的言語(yǔ)環(huán)境”。索振羽將語(yǔ)境劃分為三部分,分別為:上下文語(yǔ)境,即存在于語(yǔ)用上下文中的語(yǔ)言因素;情景語(yǔ)境,即除了語(yǔ)言因素外的非語(yǔ)言因素;民族文化傳統(tǒng)語(yǔ)境,該語(yǔ)境關(guān)注歷史與國(guó)族方面的因素對(duì)語(yǔ)言交際的影響。[13](23)語(yǔ)境對(duì)于有成效的會(huì)話極為重要,它蘊(yùn)含著對(duì)應(yīng)語(yǔ)境下的行動(dòng)框架。個(gè)體基于既往社交經(jīng)驗(yàn)發(fā)展出了常見(jiàn)序列行為的知識(shí)結(jié)構(gòu),并將其保留在記憶中。一旦遇到類似情境,這些社交腳本就會(huì)被激活,[17]從而指導(dǎo)用戶的會(huì)話實(shí)踐。因此,清楚的語(yǔ)境可以幫助生成式人工智能更好地預(yù)測(cè)用戶意圖,做出符合預(yù)期的回應(yīng)。否則就可能出現(xiàn)脫離語(yǔ)境的回答,降低交互效率。
目前諸多媒介實(shí)踐是圍繞解析用戶的會(huì)話語(yǔ)境而展開(kāi)的。其中,上下文語(yǔ)境包括對(duì)時(shí)空特征、主題、文化背景、參與者角色的構(gòu)建,主要依賴于用戶的提示詞和會(huì)話歷史而形成;民族文化語(yǔ)境依賴于預(yù)訓(xùn)練過(guò)程中對(duì)用戶認(rèn)知偏好相關(guān)語(yǔ)料的訓(xùn)練以及會(huì)話過(guò)程中對(duì)用戶特征的識(shí)別。相較于前兩者,依賴于非語(yǔ)言要素的情景語(yǔ)境是解析用戶會(huì)話語(yǔ)境的難點(diǎn),目前的媒介實(shí)踐呈現(xiàn)為以下幾類。
(1)基于專用型媒介所對(duì)應(yīng)的場(chǎng)景形成會(huì)話語(yǔ)境。這是一種較為簡(jiǎn)單和粗放的路線,不涉及用戶場(chǎng)景性數(shù)據(jù)的讀取。比如基于生成式人工智能技術(shù)的游戲NPC就能準(zhǔn)確地匹配其扮演角色和所處情景,與玩家形成會(huì)話,為玩家提供沉浸式游戲體驗(yàn)。基于生成式人工智能技術(shù)的導(dǎo)購(gòu)機(jī)器人也可以根據(jù)自身所處的時(shí)空特征為用戶提供精準(zhǔn)推薦服務(wù),提供更人性化的溝通方式。
(2)媒介接入專用型插件(應(yīng)用)讀取場(chǎng)景數(shù)據(jù)。通過(guò)開(kāi)發(fā)插件,媒介能夠直接匹配用戶場(chǎng)景,并獲取更多細(xì)粒度的數(shù)據(jù)。比如ChatGPT-4已經(jīng)支持以購(gòu)物、餐飲、學(xué)習(xí)為目的的插件;百度的文心一言大模型也正在創(chuàng)建插件生態(tài),提供可視化界面和API接口,支持開(kāi)發(fā)者進(jìn)行自定義模型與插件開(kāi)發(fā)(見(jiàn)圖3)。用戶在使用專門型插件或應(yīng)用的過(guò)程中定位自身情景,并通過(guò)行為數(shù)據(jù)反映會(huì)話語(yǔ)境,幫助媒介更快、更準(zhǔn)確地解析所處的會(huì)話語(yǔ)境。
(3)將生成式人工智能技術(shù)植入計(jì)算機(jī)操作系統(tǒng)(或應(yīng)用平臺(tái))采集場(chǎng)景數(shù)據(jù)。這一策略可以保障媒介讀取用戶場(chǎng)景數(shù)據(jù)的權(quán)限,并可以在對(duì)應(yīng)功能場(chǎng)景下接入智能服務(wù)。采用這一路線的包括小米的“小愛(ài)同學(xué)”語(yǔ)音助手、微軟的智慧辦公應(yīng)用“Microsoft 365 Copilot”、金山的智慧辦公應(yīng)用“WPS AI”等。
(4)媒介基于實(shí)時(shí)聯(lián)網(wǎng)的響應(yīng)。由于生成式人工智能技術(shù)的底層模型都由預(yù)訓(xùn)練完成,而會(huì)話語(yǔ)境往往具有即時(shí)性,因此實(shí)時(shí)聯(lián)網(wǎng)有助于智能媒介識(shí)別會(huì)話語(yǔ)境。目前百度的文心一言通過(guò)接入百度搜索實(shí)現(xiàn)實(shí)時(shí)聯(lián)網(wǎng)獲取信息,ChatGPT以及NewBing亦接入Bing搜索等。
3. 媒介與用戶的會(huì)話協(xié)同:多模態(tài)交互與提示工程
媒介與用戶的會(huì)話協(xié)同主要涵蓋了語(yǔ)用學(xué)的三個(gè)研究領(lǐng)域,即指示詞語(yǔ)、言語(yǔ)行為以及會(huì)話結(jié)構(gòu)。指示詞語(yǔ)將具體的人物、地點(diǎn)、時(shí)間等信息簡(jiǎn)化,使語(yǔ)言高度凝練。[18]言語(yǔ)行為則是將指示詞語(yǔ)組織成句進(jìn)行發(fā)聲發(fā)音、表意行事,并對(duì)會(huì)話主體產(chǎn)生影響。[13](152-155)會(huì)話結(jié)構(gòu)涉及的是語(yǔ)言之外的對(duì)話組織方式,包括開(kāi)頭語(yǔ)、結(jié)束語(yǔ)、話輪替換,以及對(duì)話中的其他結(jié)構(gòu)特征如插入序列、由受話者打斷發(fā)話者話段引發(fā)的分岔序列、以及發(fā)話者自己的補(bǔ)救辦法等。[19]媒介與用戶的會(huì)話同樣包含以上機(jī)制,自然交互范式下的媒介實(shí)踐也按照以上類別機(jī)制展開(kāi)。
媒介側(cè)的媒介實(shí)踐主要是基于多輪會(huì)話窗口形成的多模態(tài)交互方式。除了生成式人工智能技術(shù)深度模擬人類認(rèn)知機(jī)制生成的文本模態(tài)外,媒介應(yīng)用也在探索其他模態(tài)的交互。目前ChatGPT已經(jīng)能夠基于“VoiceOver”等插件實(shí)現(xiàn)與用戶的高質(zhì)量語(yǔ)音對(duì)話;自定義的GPTs允許用戶上傳自定義的圖像作為頭像,內(nèi)置的DALL·E模型也可以幫助用戶在任意對(duì)話中生成圖像、讀取圖像,從而使基于ChatGPT的交互表現(xiàn)出高度的擬真度和擬人化。在未來(lái),更多模態(tài)比如語(yǔ)音、語(yǔ)調(diào)、實(shí)時(shí)表情、動(dòng)作、姿態(tài)等模態(tài)也有望成為會(huì)話的基礎(chǔ),并在多輪會(huì)話的機(jī)制下形成更加全面的可供性。
在這樣的自然交互媒介界面下,如何使用語(yǔ)言或非語(yǔ)言符號(hào)有效表達(dá)需求是用戶側(cè)的關(guān)鍵任務(wù),這一工作由于需要提供提示詞,因而也被稱為“提示工程”。提示工程直接影響交互的質(zhì)量。如果用戶提供的提示模糊不清,生成式模型就難以準(zhǔn)確理解用戶意圖。反之,如果用戶提示設(shè)計(jì)得當(dāng),能夠充分利用語(yǔ)言和非語(yǔ)言符號(hào)傳達(dá)自身目的,生成式模型就能快速捕捉其意圖并作出正確回應(yīng)。目前大多數(shù)用戶尚缺乏提示能力,為此,一些自然交互界面也在探索輔助提示的功能設(shè)計(jì),如顯示歷史提示、關(guān)聯(lián)提示以及提示模板等。
時(shí)至今日,自然交互范式已經(jīng)在智能音箱、智能客服、AI語(yǔ)音助手等媒介實(shí)踐中得到彰顯,但其本身仍不完善,需要在技術(shù)、法規(guī)、倫理、文化等諸多方面調(diào)試和落地。盡管如此,自然交互范式所具有的革命性的可供性為媒介融合發(fā)展提供了巨大的想象空間,其有望成為未來(lái)媒介交互的主流范式,突破現(xiàn)有媒介交互甚至是人際交互的局限,開(kāi)創(chuàng)人類對(duì)外連接的嶄新局面。
三、自然交互范式的實(shí)踐進(jìn)路:初期話語(yǔ)溝通,中期數(shù)據(jù)匯通,遠(yuǎn)期心智融通
本文認(rèn)為自然交互范式至少存在初期話語(yǔ)溝通、中期數(shù)據(jù)匯通、遠(yuǎn)期心智融通三個(gè)主要的發(fā)展階段。
1. 話語(yǔ)溝通:初期基于文本模態(tài)的自然語(yǔ)言,滿足最基本的交互可供性
(1)自然語(yǔ)言具有基本的交互可供性?!翱晒┬浴备拍钤趧偺岢鰰r(shí)強(qiáng)調(diào)環(huán)境的客觀品質(zhì)與生物行動(dòng)的可能性之間的相互協(xié)調(diào),[20]隨著理論的發(fā)展,可供性已被延展到設(shè)計(jì)、媒介、新媒體等多個(gè)方面,而在自然語(yǔ)言交互中,語(yǔ)言這一承載內(nèi)容的形式也為人類與機(jī)器之間的互動(dòng)提供了廣泛可能,體現(xiàn)出交互可供性。由于人類與機(jī)器的生理及機(jī)理構(gòu)造不同、認(rèn)知模式不同,人機(jī)交互存在障礙。隨著技術(shù)的發(fā)展,人類與機(jī)器可以通過(guò)自然語(yǔ)言這一媒介,在交互中達(dá)到一種協(xié)同狀態(tài)。自然語(yǔ)言以最基礎(chǔ)通用的方式在界面中呈現(xiàn),使人機(jī)交互成為可能,讓其得以存在與賡續(xù)。
(2)語(yǔ)言交互是自然交互的早期和基礎(chǔ)范式。話語(yǔ)溝通是人與機(jī)器交互的基礎(chǔ)模式。在計(jì)算機(jī)剛問(wèn)世時(shí),馮·諾依曼所設(shè)計(jì)的人與計(jì)算機(jī)溝通的模式是機(jī)械地編碼與解碼自然語(yǔ)言的模式:人將自己想要傳達(dá)的命令或信息以計(jì)算機(jī)指令語(yǔ)言的方式表現(xiàn)出來(lái),輸入計(jì)算機(jī),計(jì)算機(jī)再對(duì)指令語(yǔ)言進(jìn)行理解,形成二進(jìn)制代碼,從而執(zhí)行相應(yīng)的操作(比如運(yùn)算或邏輯處理),輸出以自然語(yǔ)言為表現(xiàn)形式的結(jié)果。盡管市面上已經(jīng)涌現(xiàn)出各式各樣能以不同形式感知人類、理解人類的模型,但直到現(xiàn)在,因語(yǔ)言獨(dú)有的特征,最為人們所關(guān)注、使用的通用人工智能仍然是ChatGPT、Llama、Claude這種以提示詞語(yǔ)言為交互紐帶的模型。人機(jī)交互范式仍然以語(yǔ)言交互為主,這與人際交互的主要方式是一致的。
需要說(shuō)明的是,基于文本模態(tài)的初期自然交互范式主要通過(guò)自然語(yǔ)言完成所有交互所需要素的設(shè)定,即用自然語(yǔ)言描繪所有的預(yù)設(shè)、語(yǔ)境、指示詞語(yǔ)、言語(yǔ)行為……人類只有使用模塊化的語(yǔ)言、精準(zhǔn)的提示詞才能達(dá)到交互目的。這也暴露了當(dāng)前人機(jī)交互中自然語(yǔ)言交互的短板,即人類每次與機(jī)器展開(kāi)交流時(shí),都需要進(jìn)行過(guò)于完整的、相對(duì)不自然的敘述才能實(shí)現(xiàn)對(duì)相應(yīng)功能的調(diào)用,否則可能出現(xiàn)較大偏差。因此,初期的基于文本模態(tài)自然語(yǔ)言的自然交互范式表現(xiàn)為“可用”,而非“好用”,與用戶熟悉的人際交流仍有較大差距。
2. 模態(tài)拓展與數(shù)據(jù)匯通:中期極大縮短人機(jī)協(xié)同的邏輯鏈條,實(shí)現(xiàn)人際交往的基本模擬
為了彌補(bǔ)媒介自然交互范式發(fā)展初期對(duì)人類交往的模擬不足,促使媒介產(chǎn)品從“能用”變?yōu)椤昂糜谩?,自然交互范式在中期更加?qiáng)調(diào)交互信息模態(tài)的拓展以及交互數(shù)據(jù)的融匯,以更加精確地識(shí)別人機(jī)交互環(huán)境中的非語(yǔ)言信號(hào),從而極大縮短人機(jī)協(xié)同的邏輯鏈條,實(shí)現(xiàn)人際交往的基本模擬。
(1)話語(yǔ)溝通的局限性。除了自然語(yǔ)言交互在人機(jī)交互中體現(xiàn)出的不足,我們還需要認(rèn)識(shí)到話語(yǔ)溝通模式本身的局限性——人際傳播中的話語(yǔ)溝通應(yīng)當(dāng)是多感官、多模態(tài)的。語(yǔ)言符號(hào)學(xué)家艾伯特·梅拉比安為此提出了一個(gè)公式:傳播信息達(dá)到相互理解=語(yǔ)調(diào)(38%)+表情(55%)+語(yǔ)言(7%)。[21]由此可知,目前人際交互中僅停留在界面上的文字式語(yǔ)言溝通,遠(yuǎn)遠(yuǎn)沒(méi)有使人機(jī)交互達(dá)到充分理解的程度。盡管現(xiàn)在計(jì)算機(jī)領(lǐng)域已經(jīng)開(kāi)始關(guān)注語(yǔ)音識(shí)別的相關(guān)分支,如語(yǔ)音情感識(shí)別,[22]但目前在人機(jī)交互的應(yīng)用中相關(guān)技術(shù)還略顯單薄。交互的過(guò)程除了調(diào)動(dòng)視覺(jué)與聽(tīng)覺(jué)外,還應(yīng)存在其他的要素在其中發(fā)揮作用,如交互主體的姿態(tài)與動(dòng)作可以調(diào)動(dòng)觸覺(jué),具身交互可以實(shí)現(xiàn)更多感官的調(diào)動(dòng)甚至是融合,感官的調(diào)動(dòng)激發(fā)又與主體內(nèi)生的情感、所處的外在環(huán)境相聯(lián)系,這些都為人機(jī)交互未來(lái)的發(fā)展提供了可能。
(2)拓展交互模態(tài)。媒介在人機(jī)交互發(fā)展中期需要拓展更多的交互模態(tài)以輸入更多要素、產(chǎn)生更細(xì)膩的連接、形成更高水平的可供性。在這一層面,技術(shù)需要對(duì)自然交互中的情緒進(jìn)行拆解,通過(guò)面部表情特征提取、語(yǔ)音情感特征提取等技術(shù),完成對(duì)多模態(tài)情感的識(shí)別;[23]同時(shí),需要對(duì)自然交互中的非語(yǔ)言符號(hào)進(jìn)行拆解,通過(guò)人臉跟蹤、姿態(tài)跟蹤、語(yǔ)音識(shí)別等技術(shù),[24]最大限度地理解用戶在交互中傳達(dá)出來(lái)的有意識(shí)或無(wú)意識(shí)的信息。最后,機(jī)器需要通過(guò)特征級(jí)融合或者決策級(jí)融合或者混合融合的方法,完成對(duì)人機(jī)交互多模態(tài)信號(hào)的融合,以實(shí)現(xiàn)數(shù)據(jù)的整合分析,[25]得出更加精準(zhǔn)的分析結(jié)果并以恰當(dāng)?shù)姆绞捷敵?,從而使用戶與人工智能能夠進(jìn)行更加深入的交互。
(3)通過(guò)數(shù)據(jù)與算法的融匯極大縮短人機(jī)協(xié)同的邏輯鏈條。有學(xué)者結(jié)合語(yǔ)義三角形模型,提出了基于語(yǔ)義三角形的自然人機(jī)交互模型。[26]如圖4所示,用戶與計(jì)算機(jī)具備相同的概念體系,并且計(jì)算機(jī)能直接完成對(duì)用戶界面設(shè)定的符號(hào)表示(LH)或具象呈現(xiàn)(OH)的識(shí)別,并將其轉(zhuǎn)化為計(jì)算機(jī)概念(GC)。
實(shí)現(xiàn)如上交互方式的重要前提是實(shí)現(xiàn)人機(jī)交互的概念共享、認(rèn)知共通。首先在大模型的產(chǎn)業(yè)層面,用戶或模型訓(xùn)練者需要提供非常充沛的、專業(yè)的預(yù)訓(xùn)練材料,完成大模型或者機(jī)器本身對(duì)場(chǎng)景、語(yǔ)境、社會(huì)慣習(xí)、社會(huì)文化等非言語(yǔ)符號(hào)的認(rèn)知塑造,從而避免用戶在交互時(shí)對(duì)機(jī)器進(jìn)行背景闡述或角色塑造。此外,目前OpenAI、Meta、Google等互聯(lián)網(wǎng)公司都在改進(jìn)并創(chuàng)新運(yùn)用微調(diào)、神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等多項(xiàng)人工智能技術(shù),投入制作插件與AI原生應(yīng)用的工作中,完成對(duì)大模型的拓展,以進(jìn)行更高效更自然的信息讀取與理解,甚至形成對(duì)用戶的個(gè)性化感受。
自然交互范式中期發(fā)展本質(zhì)上是對(duì)人類交往方式的進(jìn)一步模擬,正如熟人彼此交談一般不需要問(wèn)及各種細(xì)枝末節(jié)的預(yù)設(shè)或情景信息,處于自然交互范式中期的用戶與媒介交往也將不再依賴繁重的提示工程,而是媒介能夠敏銳地捕獲用戶多模態(tài)的、內(nèi)隱的非語(yǔ)言信號(hào),促使人機(jī)協(xié)同的邏輯鏈條進(jìn)一步縮短,人機(jī)協(xié)同的體驗(yàn)進(jìn)一步趨向人際傳播或人際交流。
3. 心智融通:超越語(yǔ)言局限以觸達(dá)心靈
即便基于自然交互范式的人機(jī)交往能夠不斷接近人際交往的自然體驗(yàn),但其始終存在一個(gè)根本性問(wèn)題——就如人際交往一般,交往主體在充分交流后可能依然難以理解彼此。這是由于語(yǔ)言本質(zhì)上并不能完全反映心靈,這就容易導(dǎo)致同一指示物在不同的交互體系下有著偏離甚至相反的指稱,或者在同一環(huán)境下,一種指稱可能指向多個(gè)指示物。同時(shí),語(yǔ)言是片面的,自然語(yǔ)言對(duì)話反映了一個(gè)人的結(jié)構(gòu),但它無(wú)法支撐起一個(gè)人的完整角色,[27]這加大了人被誤解的可能。這種情況在人際傳播中非常常見(jiàn),會(huì)引起傳播失效。
目前的人工智能從本質(zhì)上來(lái)說(shuō)是一種基于概率的很生硬的智能,而人類智能是一種相對(duì)比較精致、細(xì)膩、復(fù)雜的智能。不論是人類智能與人工智能之間的交互過(guò)程,還是從人工智能過(guò)渡到人類智能甚至更高維度的進(jìn)化,都缺少了一個(gè)中間態(tài)的、連接與調(diào)度的接口,這個(gè)接口決定了人類如何調(diào)度和使用機(jī)器智能。
因此,媒介或人工智能仍然需要一次重要的技術(shù)革命,以實(shí)現(xiàn)人與機(jī)器的“心有靈犀”。這種技術(shù)革命需要一種全新的、呈現(xiàn)為硅基文明的技術(shù)基座,而不是簡(jiǎn)單地運(yùn)用通過(guò)計(jì)算和概率實(shí)現(xiàn)的大模型。有研究認(rèn)為,信息作為高層次基礎(chǔ)的感受性關(guān)系,是智能的根本基礎(chǔ)。[28]因此我們可以設(shè)想,在硅基文明創(chuàng)造的賽博格世界里面,人類可以完全擺脫身體束縛,接入網(wǎng)絡(luò)系統(tǒng),一切都是信息的傳播,[29]一切也都成為數(shù)字化的意義交換、心智流動(dòng)。此時(shí),在與硅基系統(tǒng)持續(xù)不斷的適配過(guò)程中,生命的“含硅量”不斷上升,[30]人機(jī)融合的形態(tài)逐步浮現(xiàn),智能成為人類的延伸。
在通用智能、賽博格化的世界,人類智能與人工智能的相互作用完全可以如現(xiàn)實(shí)一般,甚至因?yàn)樾录夹g(shù)突破了交互形式的局限而超越現(xiàn)實(shí),以數(shù)字化的心靈相通達(dá)到心流狀態(tài)。[31]硅基智能的最大優(yōu)勢(shì)是碳基智能無(wú)法比擬的進(jìn)化速率,[28]因此人類與人工智能心智融通的時(shí)候,時(shí)間是非常短暫的,但由于用戶極其投入在這種狀態(tài)中,所以感覺(jué)不到時(shí)間的流逝。從這層意義上講,用戶心流狀態(tài)可以作為一個(gè)心智融通狀態(tài)的關(guān)鍵評(píng)量指標(biāo)。
結(jié)語(yǔ)
伴隨著生成式人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)人機(jī)交互中廣泛排布的控件、模塊乃至圖形交互界面逐漸被消解,自然交互范式被引入人們的媒介生活,通過(guò)多模態(tài)的感知、智能代理交互、知識(shí)處理、可視化的顯示,機(jī)器與人類已經(jīng)幾乎能夠?qū)崿F(xiàn)與人際傳播同等維度的交互。[32]“非受限性”成為新型人機(jī)交互技術(shù)的主要特性,即機(jī)器給人以最小的限制并對(duì)人的各種動(dòng)作做出反應(yīng),人是主動(dòng)參與者,可以自由地操作機(jī)器,就像日常生活中人與人之間的交流一樣自然、高效和無(wú)障礙。[33]這是媒介交互范式的重大進(jìn)步。
這種媒介交互范式的革命將驅(qū)動(dòng)整個(gè)媒介生態(tài)和人機(jī)關(guān)系的改變。正如麥克盧漢將媒介稱作“人的延伸”,媒介是人類對(duì)外實(shí)踐的中介,當(dāng)中介的模式從圖形控件交互轉(zhuǎn)變?yōu)樽匀唤换?,這意味著人機(jī)交流與協(xié)同走向全新范式,意味著筑建于原有范式基礎(chǔ)上的傳播樣態(tài)、人機(jī)關(guān)系也將迎來(lái)嬗變。在這種變局中把握人機(jī)關(guān)系,把握媒介演進(jìn)的關(guān)鍵邏輯,將成為未來(lái)傳播研究的重要課題。
參考文獻(xiàn):
[1] 董士海. 人機(jī)交互的進(jìn)展及面臨的挑戰(zhàn)[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2004(1):1-13.
[2] 馬衛(wèi)娟,方志剛. 人機(jī)交互風(fēng)格及其發(fā)展趨勢(shì)[J]. 航空計(jì)算技術(shù),1999(3):16-20.
[3] 喻國(guó)明,蘇健威. 生成式人工智能浪潮下的傳播革命與媒介生態(tài)——從ChatGPT到全面智能化時(shí)代的未來(lái)[J]. 新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023,44(5):81-90.
[4] 史安斌,劉勇亮.聊天機(jī)器人與新聞傳播的全鏈條再造[J]. 青年記者,2023(3):98-102.
[5] Glonek G, Pietruszka M. Natural user interfaces (NUI): review[J]. Journal of Applied Computer Science, 2012, 20(2): 27-45.
[6] 范俊君,田豐,杜一,等. 智能時(shí)代人機(jī)交互的一些思考[J]. 中國(guó)科學(xué):信息科學(xué),2018,48(4):361-375.
[7] 維特根斯坦. 邏輯哲學(xué)論[M]. 賀紹甲,譯. 北京:商務(wù)印書館,2019:132.
[8] 郭全中,袁柏林. AI能力新突破下的AIGC:內(nèi)容生產(chǎn)新范式[J]. 青年記者,2023(13):66-69.
[9] 陳嘉映. 語(yǔ)言哲學(xué)[M]. 北京:北京大學(xué)出版社,2003:184.
[10] 崔鳳娟,苗興偉. 語(yǔ)用學(xué)的哲學(xué)維度[J]. 外語(yǔ)學(xué)刊,2007(4):67-72.
[11] 盛曉明. 話語(yǔ)規(guī)則與知識(shí)基礎(chǔ)——語(yǔ)用學(xué)維度[M]. 上海:學(xué)林出版社,2000:87-88.
[12] Valli A. The design of natural interaction[J]. Multimedia Tools and Applications, 2008, 38(3): 295-305.
[13] 索振羽. 語(yǔ)用學(xué)教程[M]. 北京:北京大學(xué)出版社,2004.
[14] 北京大學(xué)外國(guó)語(yǔ)學(xué)院語(yǔ)言學(xué)研究所. 語(yǔ)言學(xué)研究(第三輯)[M]. 北京:高等教育出版社,2004:67.
[15] Stephen·R. Barley. The Social Construction of a Machine: Ritual, Superstition, Magical Thinking and other Pragmatic Responses to Running a CT Scanner[M]//Lock M, Gordon D.Biomedicine Examined. New York: Springer, 1988: 497-539.
[16] Nass C, Moon Y. Machines and Mindlessness: Social Responses to Computers[J]. Journal of Social Issues, 2000, 56(1): 81-103.
[17] 徐琦. 超越“計(jì)算機(jī)為社會(huì)行動(dòng)者”范式:智媒時(shí)代人機(jī)傳播理論創(chuàng)新的突破點(diǎn)[J]. 現(xiàn)代傳播,2023(6):160-168.
[18] 劉森林. 語(yǔ)用策略與指示詞語(yǔ)[J]. 解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2004(6):21-24.
[19] 祝畹瑾. 社會(huì)語(yǔ)言學(xué)概論[M]. 長(zhǎng)沙:湖南教育出版社,1992:173.
[20] Gibson·J. J. The ecological approach to visual perception[M]. Boston: Houghton Mifflin, 1979: 127.
[21] Mehrabian A, Ferris·S.R. Inference of Attitudes from Nonverbal Communication in Two Channels[J]. Journal of Consulting Psychology, 1967, 31(3): 248-252.
[22] 王怡,王黎明,柴玉梅. 融合多特征的語(yǔ)音情感識(shí)別方法[J]. 小型微型計(jì)算機(jī)系統(tǒng),2022,43(6):1232-1239.
[23] 何俊,劉躍,何忠文. 多模態(tài)情感識(shí)別研究進(jìn)展[J]. 計(jì)算機(jī)應(yīng)用研究,2018,35(11):3201-3205.
[24] 楊明浩,陶建華,李昊,等. 面向自然交互的多通道人機(jī)對(duì)話系統(tǒng)[J]. 計(jì)算機(jī)科學(xué),2014,41(10):12-18,35.
[25] 張亞洲,戎璐,宋大為,等. 多模態(tài)情感分析研究綜述[J]. 模式識(shí)別與人工智能,2020,33(5):426-438.
[26] 劉勝航,陳輝,朱嘉奇,等. 基于語(yǔ)義三角形的自然人機(jī)交互模型[J]. 中國(guó)科學(xué):信息科學(xué),2018,48(4):466-474.
[27] Gaines·B. R, Shaw·M. L. Foundations of dialog engineering: the development of human-computer interaction. part ii[J]. International Journal of Man-Machine Studies, 1986, 24(2): 101-123.
[28] 王天恩. 論廣義智能進(jìn)化[J]. 江漢論壇,2023(4):5-12.
[29] 劉海龍. 傳播中的身體問(wèn)題與傳播研究的未來(lái)[J]. 國(guó)際新聞界,2018,40(2):37-46.
[30] 劉濤,湯志豪. 死亡的媒介化配置:賽博格與數(shù)字資本主義的生命政治[J]. 湖南師范大學(xué)社會(huì)科學(xué)學(xué)報(bào),2023,52(3):112-122.
[31] Csikszentmihalyi M, Csikszentmihalyi·I. S. Optimal experience: Psychological studies of flow in consciousness[M]. New York: Cambridge University Press, 1988: 3.
[32] 袁保宗,阮秋琦,王延江,等. 新一代(第四代)人機(jī)交互的概念框架特征及關(guān)鍵技術(shù)[J]. 電子學(xué)報(bào),2003(S1):1945-1954.
[33] 杜廣龍. 面向多自由度機(jī)器人的非受限智能人機(jī)交互的研究[D]. 廣州:華南理工大學(xué),2013.
Media's Natural Interaction Paradigm and Practical Approaches in the Generative AI Era: An Analysis Based on the Perspective of Pragmatics
YU Guo-ming, SU Jian-wei, HUANG Zhe-hao(School of Journalism and Communication, Beijing Normal University, Beijing 100875, China)
Abstract: An important characteristic of the generative artificial intelligence era is that natural interaction is gradually replacing graphical control interaction as the mainstream paradigm in human-computer interaction. Its impact on media communication lies in enabling media to transcend the realm of personalization and form resource aggregation when intricating connections with users based on highly granular needs on the one hand; on the other hand, allowing interaction paradigm media to integrate seamlessly into user contexts. There are three main stages for the development of natural interaction paradigm: initial discourse communication, mid-term modality expansion and data convergence, as well as long-term mental integration, which is essentially a process for the natural interaction paradigm evolving from simulating human communication to transcending it.
Key words: generative artificial intelligence; human-computer interaction; natural interaction; media practice