摘 要:ChatGPT和“文心一言”作為生成式人工智能的新產品,造就了人機合作進行知識生產(尤其是學術研究)的新形式。以探究數(shù)字勞動的含義為例,以人機問答的方式獲得機器智能提供的答案,這展現(xiàn)了ChatGPT和“文心一言”可以輔助人進行學術研究的新功用,從而形成人機合作的知識生產新模式。在這種模式中,機器智能在提供資源的概括和簡單的文本生成方面對人的知識生產提供高效的幫助,并通過人機問答的互動使這種幫助更具針對性和時效性。通過對機器生成內容的具體考察,深入體驗這兩款生成式人工智能新產品的實際使用,也可以發(fā)現(xiàn)其明顯的不足和局限,尤其體現(xiàn)在:由于受限于訓練數(shù)據(jù)集和能夠進入的學術資源數(shù)據(jù)庫,其歸納既有知識成果的全面性和準確性與人的要求還有較大的差距,更不能替代人去進行原創(chuàng)性的知識創(chuàng)新。鑒于此,需要理性地看待智能機器為人類的知識生產所能起到的功用,既要前瞻性預測這一新型的人機協(xié)同方式對人類未來知識生產走向的巨大影響和積極意義,也要根據(jù)現(xiàn)階段生成式人工智能的工作機制,發(fā)揮好人在使用提示詞等方面的作用,通過人的積極作為來調動智能輔助系統(tǒng)的潛能,在人機之間既有合理的分工又有融洽的互補式合作,來助力學術研究型知識生產活動的開展,并對人作為知識生產的主體始終保持足夠的警醒。
關鍵詞:ChatGPT;“文心一言”;人機合作;數(shù)字勞動;生成式人工智能
中圖分類號:TP18文獻標識碼:A
文章編號:1673-8268(2023)04-0001-10
以ChatGPT為代表的生成式人工智能(Generative AI,GAI),正在引發(fā)新一輪機器智能的革命,其應用的領域和范圍,也隨著GPT-4和“文心一言”等新產品的推出而不斷擴展,其表現(xiàn)之一就是它們越來越深度地介入人類的知識生產過程,成為學術研究的有力幫手,甚至被一些人視為正在引發(fā)一場知識生產方式的革命,或正在造成知識生產的“顛覆性變化”。
知識生產是有意識、有組織地促進知識形成的活動,是人們利用已有的知識和技術,通過各種途徑生產和創(chuàng)造新的知識的過程。學術研究也是一種知識生產,它是對特定問題的研究和探討,以形成專門的學問,因此,學術研究是我們考察知識生產的一個重要窗口,也可稱其為“學術研究型知識生產”。GAI對人類知識生產方式的改變,無疑可以從它給學術研究帶來的新變化中加以考察。ChatGPT和“文心一言”均提供了通過人機合作進行學術研究的新手段、新工具,引起了學術研究型知識生產的許多新變化【本文不討論OpenAI的ChatGPT與百度的“文心一言”之間的優(yōu)劣問題,只是就應用它們作為輔助工具進行某一問題的學術研究時,考察其能提供什么樣的幫助,由此會啟發(fā)我們對這一問題的哪些思考?!?。筆者借助這兩款GAI的新產品來探究數(shù)字勞動的含義,力圖從實際應用這種新手段的切身體驗中,來發(fā)現(xiàn)這一新型的人機合作模式究竟使我們在知識生產中能獲得什么具體的幫助,以及還有哪些方面它仍然“愛莫能助”,也就是力求對GAI的功能作出基于使用體驗的評價,避免泛泛而談的空議,讓事實說話而不是憑想象發(fā)聲??梢哉f,這也是學術精神的內在要求。
一、案例體驗:關于數(shù)字勞動的人機問答
GAI與數(shù)字勞動具有密切的相互關聯(lián),無論是ChatGPT還是“文心一言”,都是數(shù)字勞動的產物,而數(shù)字勞動是智能時代的一種基本而普遍的勞動方式,正在成為學術研究的重要對象和熱點問題;而研究數(shù)字勞動問題,可以反過來幫助我們理解生成式人工智能[1]。所以,對數(shù)字勞動使用GAI進行研究,從中體驗新手段的新功能,具有天然的合理性。
無疑,研究數(shù)字勞動需要從“什么是數(shù)字勞動”開始。目前,學術界在理解數(shù)字勞動的含義時,通常還會涉及幾個重要的相關概念,如“免費勞動”“非物質勞動”“玩勞動”等,尤其在數(shù)字勞動與這幾個概念的關系上存在著分歧和爭議,成為展現(xiàn)數(shù)字勞動含義豐富性的一個重要方面。此外,對一些活動(如上網(wǎng))是否為數(shù)字勞動,某些職業(yè)的從業(yè)者(如外賣騎手和網(wǎng)約車司機)是否為數(shù)字勞動者,也存在不同說法,使得數(shù)字勞動的外延呈現(xiàn)出復雜的情況??梢哉f,上述幾個方面構成了從學術上界定和理解數(shù)字勞動的一個相對完整的閉環(huán)系統(tǒng)。對此,筆者就“什么是數(shù)字勞動”及其相關的系列問題(“數(shù)字勞動是免費勞動嗎”“數(shù)字勞動是非物質勞動嗎”“數(shù)字勞動是一種玩勞動嗎”“凡上網(wǎng)的活動都是數(shù)字勞動嗎”“外賣騎手和網(wǎng)約車司機的勞動是數(shù)字勞動嗎”)分別與ChatGPT和“文心一言”進行了問答,從它們自動生成的內容中考察人工智能如何“理解”這些有豐富內涵甚至存在爭議的問題,也從中體驗人機合作的學術研究性知識生產中,機器所能提供的幫助。
問題1:什么是數(shù)字勞動?
ChatGPT:數(shù)字勞動是指使用計算機、網(wǎng)絡和數(shù)字技術等工具進行的各種勞動活動,包括但不限于程序設計、數(shù)據(jù)分析、網(wǎng)頁設計、社交媒體管理、電子商務運營等。這些勞動形式通常不需要實際的物理空間和傳統(tǒng)的生產要素(如土地、資金、原材料等),同時也具有較高的彈性和靈活性,可以在全球范圍內開展。
“文心一言”:數(shù)字勞動是指數(shù)字化時代借助于各種電子媒介進行的勞動形式。這種勞動形式不再局限于傳統(tǒng)的有形物質對象,而是擴大到了信息、數(shù)據(jù)、知識等各種非物質對象。在這種背景下,數(shù)字勞動作為一種新的勞動形式在社會生產中占據(jù)關鍵地位。
問題2:數(shù)字勞動是免費勞動嗎?
ChatGPT:不是。數(shù)字勞動是一種有報酬的勞動形式,從事者通常會獲得雇主或客戶支付的相應費用。雖然在某些情況下,數(shù)字技術的發(fā)展使得個人可以通過網(wǎng)絡平臺自由發(fā)布內容、分享知識、提供服務等,并從中獲得收入,但這并不意味著數(shù)字勞動就是免費的。從事數(shù)字勞動的人同樣需要付出時間、精力和成本等,而且也需要具備相應的能力和經(jīng)驗才能勝任工作,因此,他們應該獲得合理的報酬來體現(xiàn)其價值和貢獻。
“文心一言”:數(shù)字勞動不是免費勞動。雖然數(shù)字勞動可以通過各種數(shù)字化媒介進行創(chuàng)造性的工作,但它并不是免費的。用戶在使用數(shù)字化媒介進行數(shù)字勞動時,需要支付一定的費用來購買數(shù)字資源、使用平臺服務等。此外,數(shù)字勞動還需要消耗用戶的時間和精力,而這些都是需要成本的。因此,數(shù)字勞動不是免費勞動,而是一種需要成本投入的勞動形式。
問題3:數(shù)字勞動是非物質勞動嗎?
ChatGPT:數(shù)字勞動通常被認為是一種非物質勞動。雖然數(shù)字勞動的產出通常體現(xiàn)在虛擬產品、服務和信息等形式上,但它們本身并不具有物質性質,因此被歸類為非物質勞動。數(shù)字勞動常涉及使用計算機、網(wǎng)絡和數(shù)字技術等工具進行信息處理、創(chuàng)意設計、數(shù)據(jù)分析、運營管理等活動,與傳統(tǒng)的生產要素(如土地、資金、原材料等)沒有直接關系。
“文心一言”:數(shù)字勞動是一種非物質勞動。數(shù)字勞動是指人們利用數(shù)字技術和數(shù)據(jù)管理技術進行的各種形式的勞動,包括但不限于生產、管理、營銷、服務等方面的工作。數(shù)字勞動是一種高度技術化、知識化、創(chuàng)新性的勞動,它不同于傳統(tǒng)的物質勞動,但也需要人的體力和智力投入。
問題4:數(shù)字勞動是一種玩勞動嗎?
ChatGPT:不是。數(shù)字勞動雖然使用了計算機、網(wǎng)絡和數(shù)字技術等工具,但本質上仍然是一種勞動活動,需要人們付出精力和時間,進行各種信息處理、數(shù)據(jù)分析、創(chuàng)意設計、運營管理等工作。數(shù)字勞動與普通的業(yè)余或娛樂性活動有著本質上的區(qū)別,它要求具備專業(yè)知識、技能和經(jīng)驗,需要付出時間和精力來完成任務,以獲取相應的薪酬或回報,并面臨著與其他行業(yè)同樣的工作壓力和挑戰(zhàn)。所以,數(shù)字勞動不能簡單地被看作是一種“玩勞動”,而應該被視為一種新型的職業(yè)形態(tài)。
“文心一言”:數(shù)字勞動不是玩勞動。雖然數(shù)字勞動也需要消耗一定的腦力和體力,但它與傳統(tǒng)的體力勞動或簡單重復的手工勞動有所不同。數(shù)字勞動是一種基于數(shù)字技術的腦力勞動,需要借助于各種電子媒介進行創(chuàng)造性的工作,如信息檢索、知識管理、算法設計、程序開發(fā)等。這種勞動形式不僅需要較高的認知能力和思維能力,還需要較強的信息處理和邏輯思維能力。因此,數(shù)字勞動與傳統(tǒng)的體力勞動或簡單重復的手工勞動有所不同,需要具備一定的專業(yè)知識和技能。
問題5:凡上網(wǎng)的活動都是數(shù)字勞動嗎?
ChatGPT:凡是使用計算機、網(wǎng)絡和數(shù)字技術工具進行的勞動都可以被歸類為數(shù)字勞動,但并不一定所有上網(wǎng)的活動都屬于數(shù)字勞動。例如,只是簡單地瀏覽網(wǎng)頁、聊天娛樂等消費性活動就不能算作數(shù)字勞動,在網(wǎng)上玩游戲也不是數(shù)字勞動,而是一種娛樂性和休閑性的活動。數(shù)字勞動通常涉及生產、創(chuàng)造、分析或管理信息和數(shù)據(jù)等方面的工作。
“文心一言”:上網(wǎng)并不一定是在進行數(shù)字勞動,但我們可以在上網(wǎng)的同時進行有意義的數(shù)字勞動,比如學習、工作等活動。
問題6:外賣騎手和網(wǎng)約車司機的勞動是數(shù)字勞動嗎?
ChatGPT:是的,外賣騎手和網(wǎng)約車司機都屬于數(shù)字勞動者的范疇。他們通過數(shù)字平臺(例如外賣平臺和網(wǎng)約車平臺)提供服務,并在數(shù)字化的工作環(huán)境中完成工作。他們的勞動與傳統(tǒng)的藍領工作不同,具有更高度的數(shù)字化、靈活性和非標準化特征,因此被歸類為數(shù)字勞動者。
“文心一言”:是的,網(wǎng)約車司機的勞動是數(shù)字勞動。憑借數(shù)字媒體技術(最典型的就是各種平臺,如直播平臺、電商平臺、外賣打車為典型的眾包勞動平臺、社交問答平臺)進行的勞動,區(qū)別于傳統(tǒng)勞動形式,它最顯著的特點就是工作時間看似自由、沒有固定的勞動關系。
二、對機器生成內容的考察和分析
由ChatGPT和“文心一言”自動生成的上述問題的答案,兩者具有高度的一致性,尤其是對具有爭議的問題(即問題2問題6),選擇的“立場”也完全相同。
對于問題1“什么是數(shù)字勞動”,ChatGPT和“文心一言”的看法基本一致,既高度概括又在表述上并不雷同。這也表明,在什么是數(shù)字勞動的問題上,對于機器來說并不存在什么“標準答案”,或者它們不是簡單地照搬或復制某一現(xiàn)成的定義,而是根據(jù)涉獵的數(shù)據(jù)集以及對問題的理解,而生成在表述上有差異的回答,甚至在不同的時候就同一個問題可能還會給予不同的回答,此即“動態(tài)生成”而非“靜態(tài)復制”,這也正是GAI輔助人進行知識生產時的一個顯著特點。這一特點的長處是為學術研究帶來了理解上的豐富性和觀點看法上的“與時俱進”,其不足是作為學術研究的資料根據(jù)或“引用來源”時具有不穩(wěn)定性和不確定性,它常常無從追溯,難以作為論證的支撐。若要揚長避短,就需要進行再度的人工整合。如對于問題1生成的兩個回應版本,我們看到ChatGPT側重于數(shù)字勞動使用的工具——數(shù)字信息技術,“文心一言”則強調數(shù)字勞動的對象——信息、數(shù)據(jù)、知識等各種非物質形式,而加以人工的“博采眾長”,對兩個版本的機器敘事再施加概括和補充,則可以形成一個基于“人機合作”的更全面的數(shù)字勞動新界定:數(shù)字勞動就是人使用數(shù)字技術面對數(shù)字信息這一對象所進行的生成新的數(shù)字信息品的活動。這一界定既借鑒了機器生成的內容,又超越其內容,集合了人機合作或人機互補的成果。
對于問題2“數(shù)字勞動是免費勞動嗎”,ChatGPT和“文心一言”都做了否定回答,可以說它們的“觀點鮮明”且“立場一致”。但是,我們讀不到在這一問題上的學術分歧,尤其是看不到“數(shù)字勞動”這一概念在起源時的“原始含義”,從而忽視了在這一問題上最有影響力的學術觀點。我們知道,“數(shù)字勞動”的概念是由意大利學者泰拉諾瓦(Tiziana Terranova)在2000年發(fā)表的《免費勞動:為數(shù)字經(jīng)濟生產文化》一文中首次提出的,她明確將數(shù)字勞動定義為“互聯(lián)網(wǎng)用戶在網(wǎng)上創(chuàng)建網(wǎng)站、調試軟件、閱讀和發(fā)送郵件以及構建網(wǎng)絡虛擬空間等互聯(lián)網(wǎng)無酬勞動”[2]。由于這類網(wǎng)上活動可以生成網(wǎng)絡數(shù)據(jù),而網(wǎng)絡數(shù)據(jù)可以作為進一步去創(chuàng)造價值的數(shù)字原料來使用,也能被當作商品進行售賣,由此為網(wǎng)絡資本家?guī)砝麧?,所以,上網(wǎng)者進行的是一種被資本無償占有和剝削的勞動,并且是被他們欣然接納的自愿給予和“零報酬”并存、享受和剝削同在的“免費勞動”。可以說,正是在認為存在著免費、無償勞動的意義上,泰拉諾瓦提出了數(shù)字勞動這一概念,并通過它來揭示和批判數(shù)字資本主義對數(shù)字勞工的新剝削??梢?,機器對這一問題的回答有可能限制我們對數(shù)字勞動所具有的最重要的一個特征(作為免費勞動)的了解,并無法關聯(lián)到傳播政治經(jīng)濟學拓展的學術視野上去,而這正是嚴謹?shù)膶W術研究必須要做的功課。由此我們看到,GAI輔助學術研究的一個重大缺陷在于,它并非像一些一邊倒的介紹所說的那樣,可以“一網(wǎng)打盡”所有的學術資源來為我們提供全面的研究背景,僅僅靠它提供或概括的學術資料,還不足以了解一個學術領域的研究全貌。
對于問題3“數(shù)字勞動是非物質勞動嗎”,兩者都做了肯定性回答,即數(shù)字勞動是一種非物質勞動。這也是主張數(shù)字勞動是一種免費勞動的泰拉諾瓦所持的觀點,她認為,數(shù)字勞動就是互聯(lián)網(wǎng)用戶在瀏覽網(wǎng)頁內容、參與虛擬社區(qū)建設、撰寫郵件和博客等過程中不自覺生成個性化信息的“非物質勞動”[2]。但同樣的問題是,在數(shù)字勞動研究領域中影響更大的另一位學者??怂梗–hristian Fuchs)的觀點顯然未被機器系統(tǒng)囊括和歸納??梢哉f,??怂拐且运磳?shù)字勞動視為非物質勞動的“流行說法”而在這一領域中聲名鵲起的,他將數(shù)字產業(yè)或信息和通信技術價值鏈的各個階段的勞動都納入到數(shù)字勞動中,甚至為了生產數(shù)字化的硬件設備而需要的采礦勞動都包括在內。在他看來,非洲礦山奴隸般的礦石開采勞動、中國的ICT(信息通信技術)制造和裝配工的勞動、印度的軟件工程師的勞動、呼叫中心的服務工作、位于硅谷的谷歌軟件工程師的勞動以及互聯(lián)網(wǎng)產銷合一者或用戶的消費活動,皆屬此類。這樣一來,數(shù)字勞動涵蓋了工業(yè)、服務業(yè)、信息業(yè)等諸多領域,以至于凡是參與信息和通信技術價值鏈的各種形式的工作[3]296,或涉及數(shù)字媒體技術的制造和內容生產的所有活動[3]351,都是數(shù)字勞動,并且都是物質勞動。不管這些看法是否正確,但在了解“數(shù)字勞動是不是一種物質勞動”的問題時,作為學術背景無疑是不容忽視的。當我們在人機對話中看不到“無所不知”的機器為我們提供??怂沟淖钣杏绊懥Φ挠^點時,也就不能不質疑它作為“全知”型助手的功能,從而難以相信它作為學術助手可以確保不遺漏最重要的學術資源,而這又是影響研究質量的決定性因素。
對于問題4“數(shù)字勞動是一種玩勞動嗎”,它們都加以了否定,但同樣沒有看到在這一問題上最有影響的學術觀點。如泰拉諾瓦在其首次提出數(shù)字勞動概念的那篇文章中,就明確將那些通常被視為網(wǎng)絡休閑活動的瀏覽網(wǎng)頁、線上聊天、玩網(wǎng)絡游戲等網(wǎng)上的玩樂活動視為數(shù)字勞動;阿威德·倫德(Arwid Lund)則明確稱數(shù)字勞動為“玩勞動”(playbour)[4],朱利安·庫克里奇(Julian Kücklich)則將從事數(shù)字勞動的人稱為“玩工”,他認為電子游戲的玩家在無意中實際上成為游戲公司和互聯(lián)網(wǎng)平臺的“免費勞動力”[5]。這些主張都明確將數(shù)字勞動的特性之一歸結為玩勞動,或直接認為數(shù)字勞動就是一種玩勞動。目前,國內的許多學者也認同這一說法,認為數(shù)字勞動消解了工作與休閑娛樂之間的界限,使得在網(wǎng)上的許多玩樂的過程就是數(shù)字勞動的過程,或者說數(shù)字勞動具有了玩樂的性質,這甚至被視為數(shù)字勞動不同于傳統(tǒng)勞動的最主要特征之一。所以,如果只看到數(shù)字勞動不是玩勞動的一面,有可能失去對數(shù)字勞動一個重要新特征的把握,在此,機器智能生成的答案也未能給我們提供完整的學術信息,若僅以此為據(jù),就會使我們在這方面的學術研究視野嚴重受限。
對于問題5“凡上網(wǎng)的活動都是數(shù)字勞動嗎”,這也是探討數(shù)字勞動時面臨的一個頗具爭議的問題?;跀?shù)字勞動是免費勞動的說法,任何上網(wǎng)者都會在網(wǎng)上留下數(shù)字痕跡,都可以作為數(shù)據(jù)被收集起來而為平臺所用,即福克斯所說的這些上網(wǎng)時遺留的數(shù)據(jù)都可以轉化為生產資料,用于創(chuàng)造新的價值,由此轉化為額外的生產性活動。在他看來,人們在互聯(lián)網(wǎng)上的瀏覽、分享、點擊等行為,都是用戶在互聯(lián)網(wǎng)上把自身生產生活經(jīng)驗數(shù)據(jù)化的活動,從而是一種生產數(shù)據(jù)商品的“數(shù)字勞動”,且這些數(shù)據(jù)商品被平臺無償占有,所以凡是上網(wǎng)都是在進行遭受剝削的數(shù)字勞動。如果這一重要的學術見解未被整合到機器的答案中,我們關于數(shù)字勞動的政治經(jīng)濟學批判就無從展開。
對于問題6“外賣騎手和網(wǎng)約車司機的勞動是數(shù)字勞動嗎”,這也是在確定數(shù)字勞動的邊界時經(jīng)常面對的一個爭議性問題。我們知道,外賣騎手和網(wǎng)約車司機確實離不開數(shù)字平臺的管理,如他們使用數(shù)字技術平臺接單、導航、計費等,甚至他們的收入也由平臺直接支付,他們的雇主似乎也是平臺,其勞資關系表面上也是與平臺的關系。但是,他們的主要任務則是提供實體服務,即運輸人員和物品:將作為實體的人或物品從一地移動到另一地,這是發(fā)生在現(xiàn)實空間而不是數(shù)字空間中的行為,他們勞動的結果也不是前面界定的“形成數(shù)字信息品”,而是更符合傳統(tǒng)意義上的服務業(yè)。雖然數(shù)字技術平臺在其中扮演了重要角色,但這并不足以將其定義為數(shù)字勞動,所以沒有一個網(wǎng)約車司機、快遞員和外賣小哥以及零工平臺上的家政人員會說“我是一個數(shù)字勞動者”[6];在這個意義上,他們從事的并非數(shù)字勞動。當這一重要觀點未被ChatGPT和“文心一言”囊括時,其回答就難以使我們對數(shù)字勞動的邊界有準確的把握,或者至少難以對與數(shù)字勞動內涵相關的外延問題有全面的了解。
以上問題(尤其是從問題2到問題6),是理解數(shù)字勞動時必然會遇到且持續(xù)存在爭議的問題,也是最能將數(shù)字勞動的探究推向深入的學術方向,顯然機器的回答沒有使我們看到在這些問題上存在的“大有可為”的廣闊空間,而是以“無可爭議”“無可辯駁”“自然合理”的方式終結了在這些問題上的繼續(xù)追問和不斷探究,雖有“斬金截鐵”的干脆性和清晰性,但一些重要的觀點顯然沒有被概括或歸納到機器的回應之中,這表明它生成的觀點對于進行數(shù)字勞動的研究還有視野不夠全面、不夠開闊的局限性,更無法體現(xiàn)學術研究型知識生產的不可窮盡性。這也提醒我們,在使用這些新工具來輔助知識生產時,一定要對它們能做什么和不能做什么持有清醒的認識和評估。
三、機器作為知識生產的助手:基于技術邏輯的優(yōu)劣
在評價ChatGPT等智能工具生成內容的特點時,我們通常會認為它具有快速、便捷和水平高、信息全等優(yōu)勢。前兩個特點易于理解和接受,對于后兩個特點,有的觀點主張:ChatGPT等可以提高內容質量,人工智能生成的內容可能比人類創(chuàng)建的內容質量更高,因為人工智能模型能夠從大量數(shù)據(jù)中學習,并識別人類可能看不到的模式,由此可以產生更準確、信息更豐富的內容[7]。然而,通過本文的使用體驗,我們發(fā)現(xiàn),在具有更高要求的學術研究型知識生產中,可以說,ChatGPT和“文心一言”保留了快速和便捷的優(yōu)勢,但水平高和信息全的特點則并無突出表現(xiàn),從而受到質疑。
就快速和便捷來說,GAI產品確實能將我們快速帶入數(shù)字勞動的學術領域,幫助我們了解這一概念及相關問題的概要性知識,這是因為對其進行訓練的數(shù)據(jù)集大、搜索功能強,可以對全網(wǎng)資源快速抓取,并在短時間內對海量資源加以整合,自動生成高度概括和簡潔的摘要,使我們快速了解相關的研究資料和成果,從而迅速進入某一學術領域的核心內容。這也是基于歸納路徑的GAI的長處所在,這一長處可以減少學術研究中的大量準備性和重復性工作,節(jié)約人力成本,提高研究效率。
此外,人對智能機器提出幫助自己的要求時,它可以“隨叫隨到”“召之即來”;在人機問答中,如果人對某個問題不了解,機器可以對人釋疑解惑,而且做到有問必答、百問不煩甚至“誨人不倦”,起到“資料員”乃至“咨詢師”的作用。雖然機器知道的歸根到底都是人“喂入”的,但作為個體的人遠不如匯集了集體訓練成果的機器系統(tǒng)儲存的知識多,因而機器可以在一定意義上充當作為個體的人在追求學問時的“良師益友”,且以非常便捷的方式實現(xiàn)兩者之間的通達和交互。
但就筆者的使用體驗來說,如果要從我們使用的兩款智能工具那里獲得信息全和水平高的內容,則還言之過早。如前所述,它們并未在具有爭議性的那些問題中將一些較為重要乃至最有影響的學術觀點囊括在自己生成的內容中,這種“信息不全”直接決定了其整合的成果即形成的文本質量不高,尤其是應對復雜問題生成的文本遠遠滿足不了人的要求。造成這一狀況的技術原因很多,不妨從以下幾個方面切入考察。
一是它受到預訓練時的數(shù)據(jù)集以及能搜索到的網(wǎng)絡學術資源之影響與限制。生成式智能機器雖能整合海量資源,為我們充當進行知識生產時的“資料員”或文案助手,但即便如此,也常有遺漏,而且可能是重大遺漏。首先,這源于它們對訓練數(shù)據(jù)的依賴。所有生成式AI模型,即使是大語言模型,都依賴于它們接受訓練的數(shù)據(jù)。例如,沒有與Bing結合的ChatGPT在底層用到的訓練語料,只是截止到2022年3月以前的數(shù)據(jù),對這之后的新資源它就無法采用。此外,如果訓練數(shù)據(jù)有偏差、過時或質量低,就會對這些模型生成的輸出產生負面影響;而對于來自非常專業(yè)領域的問題,如果沒有進行足夠的語料“喂食”,這種模型就無法生成全面而適當?shù)幕卮?。其次,即使鏈接了網(wǎng)絡資源,也會受它們所能檢索的網(wǎng)絡資源的限制。盡管生成式的大語言模型可以“一網(wǎng)打盡”地檢索網(wǎng)絡資源,但主要還是限于網(wǎng)上開放的公共的免費資源,而無法進入那些設立了賬戶權限的收費數(shù)據(jù)庫。我們知道,大多數(shù)提供學術資源的數(shù)據(jù)庫都屬于收費數(shù)據(jù)庫,而前面我們論及的那些著名學者關于數(shù)字勞動的觀點和思想,主要分布于這些收費數(shù)據(jù)庫中的學術論文里,當ChatGPT等不能自由進入其中時,就不能檢索和歸納這些觀點和思想,更無法企及那些沒有電子網(wǎng)絡版的學術論著,這就極大地限制了我們以其為手段進行學術研究時的資料來源,由此決定了僅靠它們還達不到對這個領域中“高水平”成果的把握,因而即使由它來充當“資料員”意義上的學術助手,其能力也是有限的。因此,學術成果的引用來源在短期內不會認可ChatGPT之類生成的內容,這一點我們從迄今仍有不少學術刊物不認可網(wǎng)絡資源作為參考文獻的事實中也可看到。
二是受提問方式的影響。在人機問答的交互中,機器有問必答,我們凡有求知的問題,基本上都可以從機器那里得到答案,其在一定意義上起到了“咨詢師”或“解惑師”的作用。但它全面理解問題的能力還有限,如對于第一節(jié)提出的問題,并沒有給我們提供相關的全面學術觀點,似乎只是介紹了機器自己所主張的“一面之詞”。這或許就是機器將問題理解為需要它們去“創(chuàng)造性地生成”自己的觀點。如果改變提問方式,如將問題3“數(shù)字勞動是非物質勞動嗎”改為“在數(shù)字勞動是不是物質勞動的問題上,學術界存在哪些觀點”,則ChatGPT所給的回答是:“學術界對這個問題存在以下幾種不同的觀點:(1)數(shù)字勞動是物質勞動的一種延伸或擴展。這種觀點認為,數(shù)字勞動與傳統(tǒng)的生產勞動同樣需要占用物質資源,并且數(shù)字產業(yè)也需要有物質基礎才能運轉。因此,數(shù)字勞動雖然不像傳統(tǒng)的體力勞動那樣需要直接操作實物,但是它仍然屬于物質勞動的范疇。(2)數(shù)字勞動是非物質勞動。這種觀點認為,數(shù)字勞動并不需要直接操作實物,而是通過信息和知識的處理和交流來完成工作,因此它不屬于物質勞動的范疇。(3)數(shù)字勞動既是物質勞動又是非物質勞動。這種觀點認為,數(shù)字勞動在某種程度上依賴于物質基礎,但是它的價值主要來自于知識和信息的處理、創(chuàng)新、交流等過程,因此,數(shù)字勞動的性質既包含物質勞動的一些特征,也包含非物質勞動的一些特征。總之,數(shù)字勞動是否屬于物質勞動的范疇仍然存在爭議,不同的觀點主要取決于對數(shù)字勞動的定義以及對物質勞動和非物質勞動的界定?!薄拔男囊谎浴苯o出的回答與此類似:“在數(shù)字勞動是不是物質勞動的問題上,學術界存在不同觀點。一些學者認為,數(shù)字勞動不是物質勞動,而是一種信息勞動或知識勞動。他們認為數(shù)字勞動是通過數(shù)字設備和網(wǎng)絡技術進行的創(chuàng)造性工作,具有高度復雜性、創(chuàng)造性和價值密集性等特征,屬于高端的知識型勞動。這種勞動需要使用數(shù)字技術工具和專業(yè)知識,難以通過傳統(tǒng)的體力勞動或簡單的重復操作來替代。另一些學者則認為,數(shù)字勞動是物質勞動的一種形式,因為它也需要通過物質資料進行生產和加工,例如計算機硬件和軟件、網(wǎng)絡帶寬等都需要通過物質資源來實現(xiàn)。他們認為數(shù)字勞動和物質勞動是相互依存的,數(shù)字技術的發(fā)展需要物質資源的支持。還有一些學者持中立態(tài)度,認為數(shù)字勞動既不是物質勞動,也不是信息勞動或知識勞動,而是一種介于兩者之間的混合勞動?!北M管在主張數(shù)字勞動是一種物質勞動的理由中,仍未概括??怂沟闹^點,但至少讓我們看到了多種觀點的存在。
可以說,這也是ChatGPT和“文心一言”這類智能工具回答問題時的一大特點,即會受到提示詞(prompt)的影響。提示詞是指提問者在提問時給出的文本或語言提示,即告訴機器需要回答的內容、領域和語境,由此來指導機器系統(tǒng)回答問題的方向。根據(jù)不同的提示詞,機器可以給出不同的答案或從不同的視角來回答相同的問題。人在向機器提問時,一個清晰、準確并且具體的提示詞通常能夠幫助機器更好地理解問題,并產生更加準確和有用的答案。而提示詞如果稍微有些不同,機器就可能會根據(jù)不同的信息提供不同的答案。所以,對于看似相同的問題,當問法稍作變化時,就看到了不同的答案。由此,對AI系統(tǒng)的使用效果在很大程度上取決于人給出的提示詞的質量,如果人對機器系統(tǒng)提示得好,它就回答得好,如果提示不好,它就回答不好,或不能按人的要求提供幫助。由此一來,在人機合作的知識生產中,人也需要通過改善使用提示詞的水平來不斷開發(fā)機器系統(tǒng)蘊含的潛力,當人感到機器未能給出滿意的回答時,也要考察是不是提問的指向被其“誤解”,即是否需要嘗試換個提問的方式,使用更清晰明確的提示詞,從而消除其對問題的誤讀或誤解。
三是受智能工具自身的“生成邏輯”之制約。ChatGPT和“文心一言”都有相同的工作機制,它們無非是一個數(shù)學上的概率預測模型,這種概率預測加上隨機擇優(yōu),構成了GPT之類的內容生成邏輯,這就是根據(jù)提問的請求、投喂的數(shù)據(jù)和統(tǒng)計計算得出回應(某種結果)的內容?;蛘哒f,GAI通過對輸入數(shù)據(jù)的隱變量進行采樣,根據(jù)先前的輸入和模型學習到的概率分布來生成輸出序列,即我們所見的“內容”。機器并不理解這些內容的含義,但通過訓練,它們掌握了詞與詞的轉移概率,建立起語言的最小單位token(譯為“記號”或“語元”)之間的關聯(lián)性,從而在一個token(如一個詞)出現(xiàn)后(或基于過去的信息)可以預測下一個token(如下一個詞)可能是什么,這就是按照概率來組合拼接文字,從上一個詞過渡到下一個詞,再由詞組成句子,通過句子顯示出它生成的語義內容。這個過程也是基于統(tǒng)計學習的方法,通過對海量語句的統(tǒng)計學處理,從捕捉的代碼片段、文本片段中找出語義相似性與相關性特征,然后生成相應的回應文本。在回答問題時,這些被訓練過的模型會從它們的知識庫中提取相關信息并組合成一個自然流暢的回答,同時,為了保證回答的準確性和可靠性,它們還會進行事后的檢查和驗證。
ChatGPT和“文心一言”在回答問題時,都會受到這樣的詬?。核鼈冇袝r候對自己不知道的問題也要發(fā)表見解,從而不時會生成一些“一本正經(jīng)的胡說八道”。這既可能是它們因為不太理解所提出的問題,也可能因為背景知識不夠豐富而回答不夠準確或專業(yè),只能以內部循環(huán)的數(shù)據(jù)流動來生成一些似是而非的內容。它們有時候還可能會以故意夸大事實或者歪曲事實來迎合聽眾的口味。還有,在通常的情況下,智能機器對一個問句和它的回答之間的關聯(lián)是根據(jù)上下文推導出來的,然而在某些情況下,它生成的回答可能會有意外的關聯(lián)或者轉折,也會使人產生莫名其妙的感覺。在本文中向其詢問的關于數(shù)字勞動的有些問題中,也不時得到了如上所述的回應(限于篇幅不再列舉)。在桑德松(Katharine Sanderson)看來,ChatGPT一類的生成式模型的功能是預測一句話的下一個詞,所以無法完全擺脫胡編亂造的問題,這種現(xiàn)象也稱為“幻覺”(hallucinating)。她說你不能全信這些模型,因為它的幻覺太多了。她認為即使是最新版本也有這個問題,盡管OpenAI表示已經(jīng)提升了GPT-4的安全性[8]。即是說,當GAI歸納或綜合了錯誤的歪曲性的材料或數(shù)據(jù)時,就會生成“扭曲事實”的錯誤結論。由于GAI會受到人為因素和其他因素的影響,故其生成內容的準確性和可靠性還有待進一步提高。目前,由ChatGPT和“文心一言”等工具在學術研究上為我們提供的幫助,還需要我們自己“親手”去對其正誤加以評判,對其準確性和完整性加以核實,繼而對生成的文本進行審核、編輯和整合等,以確保生成結果(知識)的準確性和可靠性,而不能盲目輕信或現(xiàn)成地使用它提供的結論與看法。由于當前對智能工具生成文本的真實性、可靠性、合法性等方面存在著廣泛質疑,所以愛丁堡大學在發(fā)布的《關于學生使用ChatGPT的指南》中就明確規(guī)定:不要將由人工智能生成的內容作為主要來源依賴,而應該將它與其他來源一起使用,因為它們生成的文本并不總是事實正確的,鑒于此,要看到GAI的局限性和依賴它作為信息來源的危險性,還要看到過度依賴人工智能工具來生成書面內容、軟件代碼或分析結果會減少學生練習和發(fā)展重要技能(例如寫作、批判性思維、評估、分析或編程技能)的機會[9]。如果長此以往,反而可能會限制人的能力尤其是創(chuàng)造力的形成與發(fā)揮。
四、在知識生產中建構有序的人機合作關系
借助ChatGPT和“文心一言”等新型智能工具,以人機合作的方式來研究數(shù)字勞動的含義,我們“現(xiàn)場地”體驗了使用GAI輔助學術研究的長短優(yōu)劣。我們體驗的結論是,一方面,決不能無視這一新型工具的價值和意義,GAI正在為人機合作進行知識生產提供新引擎和新平臺而進入新的階段,尤其是它蘊含的無限可能性,預示了人類以后的學術研究及知識生產能力乃至其他方面的能力,將由人機合作或人機融合的水平或方式來決定。其中,智能機器或工具的作用將會越來越重要,它對人的知識生產所能提供的幫助也會從更多的方面展開。例如,GAI由于改變了內容生產的邏輯及形式,當其與其他數(shù)據(jù)庫和AI系統(tǒng)相聯(lián)結后,就會生成更符合不同偏好的個性化內容,由此形成的知識文本更有可讀性或共享性[7]。又如,在線教育和在線咨詢等通過GAI的介入,可以提高其個性化滿意度,像ChatSonic這款GAI產品,就可以通過其15個以上的個性化頭像來幫助人們進行量身定制的“專家對話”,類似于通過與“私人教練”交談來創(chuàng)建一個個性化的鍛煉計劃[10]。此外,目前的ChatGPT和“文心一言”還可以通過與用戶進行友好和幽默的對話、生成詩歌和故事等,來幫助人們在知識生產過程中增加工作樂趣和消除疲勞,使工作變得輕松而有趣[11]。凡此種種,使得生成性人工智能技術有時被描述為類似于蒸汽動力、電力和計算機的通用技術,因為它們可以深刻地影響許多行業(yè)和領域[12]。
另一方面,從現(xiàn)實效果來看,無論是ChatGPT還是“文心一言”,目前它們作為GAI的代表性產品,還未能達到令人完全滿意的水平,其功能還限于可以便捷地為我們補充一些知識、提供經(jīng)過整合與濃縮的資料。它們可以在思路和視野上對我們的知識生產形成一定的啟示,但至少在目前還不能高估它的作用,尤其是它對于學術研究型知識生產的更多或更實質性的幫助還不夠充足,僅僅依靠它來匯集既有的研究成果或進行文獻綜述,也是極為有限的,更遑論將學術研究或知識生產的主干部分寄托于ChatGPT這類工具上。換句話說,不能因為ChatGPT之類在眼下可以幫助學生完成規(guī)范化的作業(yè)、可以幫助文秘人員完成標準化的文案、可以幫助程序員編寫簡單的程序,就將其定性為“知識生產方式的革命”或“學術研究方式的突破”,至少在目前這樣的評價還言過其實、為時尚早。
可以說,ChatGPT和“文心一言”等智能工具對于學術研究型知識生產來說還是輔助性的,人的主導性地位仍是不可或缺的。它們可以在一定程度上為我們充當永遠不知疲倦的“資料員”“文案員”甚至“答疑解惑的咨詢員”,在其他領域還被形容為“助教”“副駕駛”等。例如,在其作為“資料員”時,可以為我們搜索、整理、歸納和濃縮資料,把浩如煙海的資料進行加工與整合,承擔大量繁重而初步的準備工作,并輔之以其他功能來大大提高研究人員的閱讀和寫作效率,由此降低知識生產的人力消耗和時間成本,直接或間接提高知識生產的效率和能力。
還可以說,GAI中的人機合作正在不斷拓展和推進人機協(xié)同和交互學習,并在這個過程中實現(xiàn)多方面的互助互補。在筆者提供的體驗性案例中,可以看到人機交互中的多方面互助互補,如資料掌握上的互相補充:GAI對資料的掌握限于來源的渠道并不齊全,而人(尤其是作為個體的研究者)限于時間和精力也常常掌握不全,此時就需要互相補充,形成盡可能全面的視野。又如知識上的互相補充:GAI幾乎無所不知,但也由于常識的缺乏而生編硬造一些“知識”,具有不可靠性,此時就需要人的常識來加以糾偏;而作為個體的人則由于學習的時間和精力有限、記憶有限,也不可能懂得研究時涉及到的多領域知識,此時也需要廣博到幾乎“全知”的機器來提供知識補充。再如思路上的互相補充:機器可以通過抓取全網(wǎng)的信息來將某一學術問題的既有研究思路加以列舉,而人則在此基礎上接受啟發(fā),進而提出新思路,由此實現(xiàn)思路的新拓展。在上述互補的基礎上,兩者之間最后達成的是優(yōu)勢互補:機器具有快速和大量生成新內容的優(yōu)勢,為學術研究增加量上的豐富性,但這些生成都屬于“從1到n”或“有中生有”的生成,而不是“從0到1”或“無中生有”的生成,而人則能進行這種無中生有的生成,這才是真正的創(chuàng)造或拓新,才是學術研究上質的突破[13]。由此,人機之間也可以形成生成能力上的優(yōu)勢互補,借助這種互補就能在學術研究中形成更強大的知識生成能力,在學術成果的質和量上獲取“雙豐收”,這無疑也意味著人類學術能力的新進化。
總之,本文案例展現(xiàn)的體驗式應用和研究,可以看到ChatGPT和“文心一言”之類的GAI對我們學術研究和知識生產能力的增強是空前的,它們確實是一種具有新功能的新工具,一種能對人類知識生產提供更多幫助的新手段。學術研究需要在廣泛啟發(fā)下獲得新思想和新見解,GAI為此提供了一種新的開啟思路的路徑,使人可以從機器伙伴那里獲得啟發(fā)和幫助,從而為我們開辟了知識生產的新途徑。它遠不能替代人的學術研究,但可以成為一個新“幫手”,尤其是在提高了有效使用它的技巧(如善用提示手段)的情況下,就更能開發(fā)其助力知識生產的潛力。當然,目前它仍有許多不足,并未引來一場知識生產方式的革命,也沒有造成學術研究的顛覆性改變。可以說,目前人機合作的知識生產仍舊是“機器助人”而不是“機器換人”,所以,對于AI代替人的擔憂至少在真正的知識生產領域還不足為慮。鑒于此,我們可以將其作為輔助工具而透明地使用,無需過度地依賴它們,也不必對其抱太高的期望。毋容置疑,這些工具的不足和缺陷是會被不斷改善的,今后的知識生產乃至人類的其他活動都可以被功能更強大的人工智能越來越深度地介入,它們會不斷優(yōu)化我們的使用體驗,做越來越多的事情。但即使如此,僅靠它們也無法為我們生成真正具有原創(chuàng)性的學術成果,即進行從0到1的知識生產或思想創(chuàng)造。由此延伸的問題是,當更強版本的GPT出來后,隨著其生成能力的提高,智能機器是否可以獨立地進行知識生產?知識生產中的原創(chuàng)性工作是否也會發(fā)生“機器換人”的現(xiàn)象?一旦發(fā)生這種情況,對人意味著什么?人類是否會允許這種情況的發(fā)生?這些問題引發(fā)了當前關于是否應該暫停訓練和研發(fā)GPT-4以上大語言模型的激烈爭論。這表明,人類如何在維持自身主導性和原創(chuàng)力的前提下,與GAI建立既分工又合作的人機互補與協(xié)同關系,將其始終定位為“助手”而不是“槍手”或“替身”,從而始終保持對人作為知識生產主體的足夠警醒,將是我們在迎接人工智能不斷有所突破時需要持續(xù)探究的問題。
參考文獻:
[1]肖峰.生成式人工智能與數(shù)字勞動的相互關聯(lián)——以ChatGPT為例[J].學術界,2023(4):52-60.
[2]TERRANOVA T.Free labor:Producing culture for the digital economy[J].Social Text,2000(2):33-58.
[3]FUCHS C.Digital labour and Karl Marx[M].New York:Routledge,2014.
[4]LUND A.Playing,gaming,working and labouring:Framing the concepts and relations[J/OL].TripleC,2014(2)[2023-02-01].https://www.triple-c.at/index.php/tripleC/article/view/536.DOI:https://doi.org/10.31269/triplec.v12i2.536.
[5]K?CKLICH J.Precarious playbour:Modders and the digital games industry[J/OL].Fibreculture Journal,2005(5)[2023-02-01].https://xueshu.baidu.com/usercenter/paper/show?paperid=e5e4026bc919e191b7f4e584f7401b8d.DOI:http://five.fibreculturejournal.org/fcj-025-precarious-playbour-.
[6]劉雨婷,文軍.“數(shù)字”作為“勞動”的前綴:數(shù)字勞動研究的理論困境[J].理論與改革,2022(1):117-131.
[7]DAVENPORT T H, MITTAL N.How generative AI is changing creative work?[EB/OL].(2022-11-14)[2023-03-03].https://hbr.org/2022/11/how-generative-ai-is-changing-creative-work.
[8]SANDERSON K.GPT-4 is here:What scientists think[J].Nature,2023(615):773.DOI:10.1038/d41586-023-00816-5.PMID:36928404.
[9]愛丁堡大學發(fā)布關于學生使用ChatGPT的指南[EB/OL].(2023-03-26)[2023-04-01].https://www.163.com/dy/article/I1ILPKHL05561JHU.html.
[10]NORONHA J.ChatGPT and generative AI:The future of content creation[EB/OL].(2023-03-13)[2023-03-30].https://writesonic.com/blog/chatgpt-generative-ai/.
[11]GMA Team.An inside look at a 5th grade classroom using ChatGPT[EB/OL].(2023-03-09) [2023-03-30].https://abcnews.go.com/GMA/Living/inside-5th-grade-classroom-chatgpt/story?id=97691302.
[12]LAWTON G.What is generative AI?Everything you need to know[EB/OL].[2023-05-30].https://www.techtarget.com/searchenterpriseai/definition/generative-AI.
[13]肖峰.何種生成,能否創(chuàng)造——ChatGPT的附魅與祛魅[N].中國社會科學報,2023-03-06.
Function analysis of generative artificial intelligence in
knowledge production:
Exploring the experience of digital labor with ChatGPT and ERNIE Bot
XIAO Feng
(School of Marxism, Shanghai University, Shanghai 200444, China)
Abstract:ChatGPT and ERNIE Bot, as new products of generative AI, have created a new form of human-computer cooperation in knowledge production (especially academic research). Taking exploring the meaning of digital labor as an example, we can obtain the answers provided by machine intelligence through man-machine question and answer, and show the new function of ChatGPT and ERNIE Bot to assist people in academic research, thus forming a new knowledge production model of human-computer cooperation. In this mode, machine intelligence provides efficient assistance to human knowledge production in providing resource summarization and simple text production, and makes this assistance more targeted and timely through human-machine Q&A interaction. Through a specific examination of machine generated content and a deep experience of the practical use of these two generative AI new products, it can also be found that their obvious shortcomings and limitations are particularly reflected in the limitations of training datasets and accessible academic resource databases. There is still a significant gap between the comprehensiveness and accuracy of the summarized knowledge results and human requirements, and it cannot replace human original knowledge innovation. In view of this, it is necessary to rationally view the functions that intelligent machines can play in human knowledge production. It is necessary to predict the significant impact and positive significance of this new human-machine collaboration method on the future direction of human knowledge production in a forward-looking manner, and also to leverage the role of good people in using prompt words and other aspects based on the current working mechanism of generative artificial intelligence. Through human initiatives, the potential of intelligent auxiliary systems can be mobilized. There is a reasonable division of labor and harmonious complementary cooperation between humans and machines to assist in the development of academic research-oriented knowledge production activities, and to always maintain sufficient vigilance towards humans as the main body of knowledge production.
Keywords:ChatGPT; ERNIE Bot; human machine cooperation; digital labor; generative AI(GAI)
(編輯:李春英)