張雙志 李 敏 張龍鵬
(1.成都大學師范學院 成都 610106;2.電子科技大學公共管理學院 成都 611731)
2021年11月,聯(lián)合國教科文組織第41屆會議審議通過的《開放科學建議書》將“開放科學”(Open science)定義為一個集理念與實踐為一體的包容性框架,主張科學應向不同區(qū)域、學科以及職業(yè)生涯不同階段的科研人員,還有傳統(tǒng)科學界以外的公眾科學家開放知識創(chuàng)造、評估和傳播的全過程[1]。開放科學是全球科技發(fā)展的大勢所趨,推進共享、共贏和可持續(xù)的科學研究是科技界的共同理想和目標[2]。知識服務被視為推動開放科學實踐的重要手段,在支持知識增長和共享方面具有獨特優(yōu)勢,助力增加不同知識持有者參與科學研究的機會,使職業(yè)科學家、公眾科學家、學術(shù)團體等協(xié)同生產(chǎn)知識成為一種可能。然而,面向開放科學的知識服務卻面臨著組織中心化、資源配置不佳、以及協(xié)同生產(chǎn)失衡的發(fā)展挑戰(zhàn),這明顯制約了期刊論文、圖書著作、研究報告、專利發(fā)明等知識資源在知識持有者之間的便利可及性。這些問題并不能單純依靠制度建設本身獲得較好解決,可考慮從外部環(huán)境中尋找解決路徑。
新一代數(shù)字技術(shù)為知識服務未來形態(tài)的塑造提供了無限可能性,關(guān)注知識生態(tài)系統(tǒng)構(gòu)建的去中心化組織也孕育而生[3]。人工智能的嵌入打破了知識服務傳統(tǒng)的“中心—邊緣”式組織架構(gòu),促使每個有意愿參與科學研究的知識持有者都可以公開使用、可訪問和可重用知識資源[4],構(gòu)建了一個突破時空限制、數(shù)據(jù)快速解析與內(nèi)容迭代更新的知識服務平臺。因此,面向開放科學的知識服務智能化是指充分利用人工智能對知識資源從知識采集、知識標的、知識計算到知識推送進行全生命周期管理,在即時滿足知識持有者使用需求的同時,也能快速洞悉知識的未來趨勢,以此為科學研究提供可選擇的發(fā)展方向。但現(xiàn)有文獻尚未對面向開放科學的知識服務智能化展開系統(tǒng)研究,鑒于此,本文針對開放科學環(huán)境下知識服務存在的發(fā)展困境,探討“人工智能+”破解知識服務困境的邏輯機理,并進一步闡述知識服務智能化的總體架構(gòu)、驅(qū)動機制以及實現(xiàn)路徑,為滿足用戶個性化、精準化的知識使用需求提供學術(shù)洞見。
聚焦知識檢索、知識推送、知識咨詢、知識訂閱等內(nèi)容的知識服務,在推動開放科學實踐的進程中面臨諸多困境,例如組織中心化、資源配置不佳、協(xié)同生產(chǎn)失衡等,這需要引起學界的重視并提出相應解決路徑。
從“三重螺旋”(大學—產(chǎn)業(yè)—政府)向“四重螺旋”(大學—產(chǎn)業(yè)—政府—公眾)演化的知識生產(chǎn)模型Ⅲ,認為公眾既是科技創(chuàng)新的用戶群體,也是科學研究的重要參與者[5],這引發(fā)知識服務向體制化科學界外的公眾開放知識創(chuàng)造、評估和傳播的全進程。但由于以出版社、圖書館、科技館等為代表的傳統(tǒng)知識服務組織存在門檻效應[6],公眾科學家很少能直接獲取其提供的知識資源,這與開放科學的開放獲取原則相去甚遠。而且,傳統(tǒng)知識服務組織的“中心—邊緣”式運行邏輯客觀上加劇了知識資源分布不均的現(xiàn)象??梢姡R服務組織存在的中心化問題不僅禁錮了利益相關(guān)者參與開放科學的積極性,也可能會導致科學知識生產(chǎn)出現(xiàn)停滯、甚至是退化的現(xiàn)象。
開放科學的核心目標是保證科學研究的可持續(xù)性,這涉及到科學出版物、研究數(shù)據(jù)、基礎設施等方面的知識資源共享使用[7]。但由于組織壁壘、服務邊界、制度藩籬等因素的存在,知識服務在不同區(qū)域、不同學科、以及不同群體之間存在資源分配不佳的問題。從區(qū)域差異來說,與廣袤的中西部地區(qū)相比,東部地區(qū)由于擁有數(shù)量眾多的科研機構(gòu)、出版社、圖書館等,有能力提供類型多樣的知識服務。就學科差異而言,以醫(yī)療健康領域為例,為引導公眾對身體健康監(jiān)控數(shù)據(jù)的及時共享,許多醫(yī)療研發(fā)機構(gòu)會主動為其提供全周期的知識服務[8],而一些“冷門”學科能獲取的知識服務就明顯不足。從群體差異來說,無論是在體制內(nèi)的專家型科學家與新手科學家之間,還是在體制外的職業(yè)科學家與公眾科學家之間,后者往往都是知識服務享受不充分的群體。
在科研人員越來越廣泛和多元化的背景下,特別是當具有不同目標、動機和能力的公眾科學家涌入科學研究領域后,傳統(tǒng)知識服務的預定義面臨解構(gòu)失效的風險,科學研究邊界的不可預測性也愈發(fā)明顯?!肮娍茖W”(Citizen science)作為一種新型研究范式,是指公眾以智力形式,或以智力周邊的知識、工具、資源等方式參與科學研究[9]。因此,在面對開放科學的開放獲取、開放數(shù)據(jù)、開放教育資源、開放評價等多重要求時,公眾科學可以在其中發(fā)揮更大的“群體智慧”[10]。然而,當前的知識服務在采用公眾科學研究范式方面存在明顯不足,未能有效協(xié)調(diào)各知識持有者積極參與知識內(nèi)容和解決方案的生產(chǎn),從而限制了為深入推進開放科學實踐提供類型廣泛、粒度不一的知識服務能力。
人工智能的技術(shù)開放性、可供性和生成性有助于破解知識服務在推進開放科學實踐中所面臨的發(fā)展困境,實現(xiàn)組織去中心化、資源優(yōu)化配置和協(xié)同生產(chǎn)機制的構(gòu)建,具體的邏輯機理如圖1所示。
圖1 “人工智能+”破解知識服務困境的邏輯機理
傳統(tǒng)的主客二分式組織架構(gòu)存在削弱一線科研人員參與知識服務的積極性,但人工智能的“開放性”(Openness)為破除知識服務的組織壁壘提供了變革途徑。去中心化的組織架構(gòu)允許職業(yè)科學家、公眾科學家、行業(yè)企業(yè)、學術(shù)團體等利益相關(guān)者自由展開跨組織邊界和層級的知識共享[11],并參與跨地域、跨學科以及跨群體的知識資源聯(lián)合治理,根據(jù)自身需要建構(gòu)或補充知識內(nèi)容和解決方案。其中,數(shù)據(jù)共享是推動知識服務開放性建設的關(guān)鍵,這有利于減少科研人員在資料收集、數(shù)據(jù)整理等方面的不必要重復勞動,而把時間和精力主要用于知識資源的再生產(chǎn)方面[12]。未來技術(shù)庫、技術(shù)路線圖、科研項目庫、案例數(shù)據(jù)庫等大數(shù)據(jù)在智能平臺上的集成,通過機器學習、深度學習等算法的標識和分析,有助于產(chǎn)出更高質(zhì)量的知識內(nèi)容方案,從而賦能開放科學的深入推進。
人工智能的“可供性”(Affordances)為知識持有者利用相同的智能工件、智能平臺與智能基礎設施生成類型多樣的知識資源提供了媒介載體。具體而言,人工智能將在技術(shù)資源、空間資源和制度資源方面為激發(fā)知識持有者的創(chuàng)新潛力提供支撐。關(guān)于技術(shù)資源供給,人工智能不是某種單一的技術(shù),而是由數(shù)據(jù)、算法和算力等構(gòu)成的技術(shù)群,科研人員可根據(jù)不同的場景需求運用相應的技術(shù)以達成預期目的。關(guān)于空間資源供給,物聯(lián)網(wǎng)(IOT)、分布式網(wǎng)絡等技術(shù)重新定義了知識服務的系統(tǒng)邊界及其嵌入科學研究的可能性,推動基于鄰近性原則的知識空間機制重構(gòu)。關(guān)于制度資源供給,互聯(lián)互通的知識服務有助于實現(xiàn)跨區(qū)域、跨學科、以及跨群體之間的知識交流,充分借鑒和整合不同領域的優(yōu)質(zhì)知識資源[13],從制度層面打造了促進科學研究發(fā)展的質(zhì)量文化。
開放科學倡導構(gòu)建一種全新的開放式創(chuàng)新模式,強調(diào)知識資源能被知識生產(chǎn)者與消費者平等、公平地獲取共享,為不同研究群體、包括傳統(tǒng)科學界以外的社會公眾提供科學出版物、研究數(shù)據(jù)、教育資源、開源軟件和源代碼等多重支撐[14]。人工智能的“生成性”(Generativity)指涉“一項技術(shù)在大量、多樣和不協(xié)調(diào)的使用者驅(qū)動下產(chǎn)生非預期變化的總體能力”[15],其加持知識服務聚焦于理解開放科學背后的不確定性,以及知識內(nèi)容和解決方案如何應對這種不確定性。換言之,人工智能通過對數(shù)字化的知識資源進行快速匯聚、標的處理和迭代分析,形成在內(nèi)容生產(chǎn)時即可考慮服務需求的響應式系統(tǒng)。面向開放科學的知識服務智能化,迫切需要知識持有者之間的共建共享(例如數(shù)據(jù)庫建設),他們在協(xié)同生產(chǎn)中既是知識服務的建設者,也是知識服務的受益者[16]。
知識服務的組織去中心化、資源優(yōu)化配置及協(xié)同生產(chǎn)構(gòu)建如何落地,需要結(jié)合人工智能的算力、算法、數(shù)據(jù)等關(guān)鍵要素為知識資源的數(shù)字化表達、集成化獲取、智能化分析提供技術(shù)支撐。接下來,在系統(tǒng)搭建知識服務智能化總體框架的基礎上,根據(jù)現(xiàn)有文獻進一步闡明知識服務智能化的驅(qū)動機制。
圍繞打造知識資源共享和按需使用的智能化服務系統(tǒng),構(gòu)建標準統(tǒng)一的數(shù)字底座、集約高效的平臺體系和泛在連接的統(tǒng)一門戶,高效賦能開放科學的全場景智能應用,為實現(xiàn)數(shù)據(jù)驅(qū)動、一體協(xié)同、全業(yè)務融合的知識服務智能化提供總體框架,具體的結(jié)構(gòu)設計如圖2所示。首先,數(shù)字底座涉及算力、算法、數(shù)據(jù)、知識等四大信息基礎設施體系,為知識全要素數(shù)字化、知識資源運行實時可視化、知識管理決策協(xié)同化和智能化提供強有力支持。其次,在數(shù)字底座的基礎上構(gòu)建涵蓋數(shù)據(jù)平臺、操作平臺和業(yè)務平臺的共性系統(tǒng)平臺,為加快知識服務全場景融入和支撐開放科學的深入推進提供必要的一體化數(shù)字界面。再次,基于數(shù)字底座和平臺體系,建設一條兼具智能運行和安全可信的“知識服務鏈”,為各知識持有者共同參與科學研究提供知識檢索、知識推送、知識咨詢和知識訂閱等全方位的知識服務。最后,面向職業(yè)科學家、公眾科學家、知識管理者等不同對象,提供便利可及的統(tǒng)一門戶,實現(xiàn)知識服務在APP、小程序、瀏覽器、微信公眾號等常見的媒介載體上“一鍵觸達”。
圖2 知識服務智能化的總體架構(gòu)
現(xiàn)有文獻發(fā)現(xiàn)驅(qū)動人工智能創(chuàng)新的影響因素比較多,但其中最直接的影響機制是“分布式創(chuàng)新”(Distributed innovation)和“重組創(chuàng)新”(Recombinant innovation)[17-18]。因此,遵循已有研究結(jié)論對知識服務智能化展開分析,發(fā)現(xiàn)開放科學環(huán)境下的知識服務參與者是分布式存在的[19],且具有不可預定義性,需要對不同來源的知識資源進行快速的重組創(chuàng)新[20],以便滿足不同知識持有者個性化、精準化的知識服務需求,為促進知識的迭代更新提供必要支撐。
分布式創(chuàng)新在本質(zhì)上是一種去中心化的研究范式[21],即不同知識持有者通過自選擇參與、自組織協(xié)調(diào)和合作對共同感興趣的知識服務議題進行共同生產(chǎn),以快速提升知識內(nèi)容方案的生產(chǎn)效率。一方面,人工智能在知識管理者與科研人員、職業(yè)科學家與公眾科學家等不同主體之間塑造了一種新型的多對多互動模式,這有助于消解不同知識服務提供者之間的組織壁壘。另一方面,離散且平等分布的數(shù)字節(jié)點網(wǎng)絡,為擴大知識持有者的參與數(shù)量和規(guī)模提供了平臺支撐,有相近或相同需求的科研人員在數(shù)字平臺上組建具有身份認同的虛擬社區(qū),并在此社區(qū)中共建共享知識資源,從而打造服務科學研究的知識服務數(shù)據(jù)庫。簡言之,分布式創(chuàng)新大幅降低了知識檢索、知識推送、知識咨詢、以及知識訂閱的成本,吸納許多充滿活力的公眾科學家共建共享高質(zhì)量的知識服務。
重組創(chuàng)新并不是一個新概念,而是源于熊彼特對創(chuàng)新的定義,即創(chuàng)新就是對現(xiàn)有生產(chǎn)要素進行重新組合[22]。結(jié)合“人工智能+”的數(shù)字屬性,將知識服務智能化的重組創(chuàng)新定義為知識持有者聚焦數(shù)字化知識資源的重組使用和重組創(chuàng)造,通過“拆裝”和“整合”現(xiàn)有的工件、平臺、基礎設施等資源要素,為新問題的解決提出知識內(nèi)容方案,甚至是創(chuàng)造新的知識見解[23]。知識資源的數(shù)字化使得知識服務具有“可重新編程”(Reprogrammable)的特性,這可從資源端的設計思維和使用端的需求思維進行理解。資源端聚焦現(xiàn)有知識資源和潛在可獲得的知識資源,通過智能算法對其重新排序、組合和建構(gòu)類型多樣的知識服務方案。使用端強調(diào)如果要創(chuàng)造新的知識價值應該如何組合數(shù)字化的知識資源,以此預研一批具有引領性的知識服務方案,反過來推動知識持有者需求的轉(zhuǎn)型升級,從而創(chuàng)造出遠遠超出最初預期的知識成果。
知識服務智能化涉及如何構(gòu)建一個規(guī)模龐大、關(guān)聯(lián)甚廣的服務平臺,但這并不能一蹴而就。鑒于此,從組織搭建、平臺打造、機制構(gòu)建的角度設計知識服務智能化的實現(xiàn)路徑,以期深入推進開放科學的發(fā)展。
人工智能加持區(qū)塊鏈將從流程驅(qū)動、組織適配、數(shù)據(jù)使能等維度搭建知識服務的聯(lián)盟鏈組織架構(gòu),實現(xiàn)開放科學環(huán)境下知識服務不同環(huán)節(jié)之間的協(xié)作,重構(gòu)“知識服務生產(chǎn)者—知識服務消費者”的雙輪驅(qū)動模式。具體如圖3所示,在聯(lián)盟側(cè)鏈上開展高頻少量的某個研究項目的知識服務交易,而聯(lián)盟主鏈則通過與多個側(cè)鏈的交易信息進行互聯(lián)互通,最終實現(xiàn)知識服務從生產(chǎn)、分配、流通到消費在鏈上的有效銜接與高效運轉(zhuǎn)。去中心化聯(lián)盟鏈組織的構(gòu)建,除了有助于出版社、圖書館、科技館等組織內(nèi)部技能和專業(yè)知識的分享交流外,也獲取了新的外部合作所帶來的知識紅利,這無疑對推動開放科學的深入實踐是十分必要的。例如,由歐盟委員會資助的公眾科學計劃“Ground Truth 2.0”在全球布局了6個觀測站,鼓勵職業(yè)科學家與公眾科學家聯(lián)合就當?shù)厣鐓^(qū)感興趣的環(huán)境保護、氣候觀測、城市規(guī)劃、社會治理等問題展開合作,并在研究過程中及時向公眾科學家提供必要的知識圖譜、研究數(shù)據(jù)等知識服務[24],這就在充分調(diào)動公眾科學家參與積極性的同時,也確保了相關(guān)研究項目的順利推進。
圖3 知識服務智能化的聯(lián)盟鏈架構(gòu)
集成數(shù)據(jù)、算法、算力的人工智能可能會導致許多出版社、圖書館、科技館等知識服務組織無力統(tǒng)合散落在不同系統(tǒng)和平臺中的數(shù)字技術(shù),從而不能展現(xiàn)出“人工智能+知識服務”的全部甚至是部分效應。顯然,無法實現(xiàn)數(shù)據(jù)自由交換的分裂式平臺,已經(jīng)嚴重影響科研人員對知識服務智能化的使用體驗。針對不同的開放科學項目,識別困擾業(yè)務發(fā)展的核心場景,利用自然語言處理技術(shù)、知識圖譜、機器學習、深度學習、神經(jīng)網(wǎng)絡等算法模型對此深挖進去,從而形成一個便利可及的體系化智能平臺。構(gòu)建聚焦開放科學核心業(yè)務的場景化解決方案群,助力推動各利益相關(guān)者持續(xù)性釋放知識創(chuàng)造力。具體如圖4所示,利用人工智能加持區(qū)塊鏈構(gòu)建一條完整的“知識服務鏈”,將鏈下數(shù)據(jù)集成、鏈上鏈下互操作、鏈間互操作、以及應用層互操作置于統(tǒng)一的技術(shù)框架中,實現(xiàn)知識服務從生產(chǎn)、流通、分配到消費的數(shù)字化、網(wǎng)絡化和智能化轉(zhuǎn)型,從而打造了跨越數(shù)據(jù)邊界、知識資源共享和按需使用的知識服務平臺。
圖4 一站式“知識服務鏈”平臺
協(xié)同生產(chǎn)作為知識服務的變革趨勢,需要出版社、圖書館、科技館等組織廣泛吸納職業(yè)科學家、公眾科學家等科研人員積極參與知識內(nèi)容和解決方案的創(chuàng)造、評估和傳播。其中,激勵機制的構(gòu)建是實現(xiàn)知識服務協(xié)同生產(chǎn)的關(guān)鍵??蒲腥藛T在參與開放科學實踐中所產(chǎn)生的附加成果,例如研究數(shù)據(jù)、知識圖譜、軟件及源代碼、實驗日志等都是知識服務的重要內(nèi)容。但由于這些附加成果與傳統(tǒng)的學術(shù)產(chǎn)出形式不同,可能無法以期刊論文、會議論文、學術(shù)著作等科學出版物進行傳播,這可能會削弱科研人員提供知識服務的積極性。鑒于知識服務成果在推動科技創(chuàng)新中所發(fā)揮的基礎作用,出版社、期刊編輯委員會、科研機構(gòu)、學術(shù)團體等應對科研人員在開放科學實踐中產(chǎn)生的附加成果,采用但不限于同行評審通過后作為學術(shù)評價和職稱認定的重要依據(jù)。當然,隨著開放科學實踐的日趨深入,如何治理研究數(shù)據(jù)私有化、利用研究數(shù)據(jù)牟利、科研人員“機會成本”增加、以及商業(yè)模式下的科技出版高額處理費等負面現(xiàn)象,成為確保學術(shù)交流多樣性和對知識服務產(chǎn)出進行知識產(chǎn)權(quán)保護的重要議題。
算法作為人工智能的核心,在自適應學習過程中有可能會出現(xiàn)連算法工程師等專業(yè)人員都不能理解的“黑箱”問題[25]。究其原因,在于算法并不真正“認識”這個世界,其對事物的解讀更多是停留在相關(guān)分析層面,甚至有時候連這種相關(guān)分析都是模糊且不精準的。因此,面向開放科學的知識服務智能化在算法黑箱的影響下并沒有預期的那么“智能”,為破解這一新型“技術(shù)利維坦”困境,未來應重點關(guān)注以下兩個方面。
一方面,關(guān)注知識服務智能化的技術(shù)支撐,深化人工智能加持區(qū)塊鏈下的“知識服務鏈”的研究。區(qū)塊鏈被視為價值互聯(lián)網(wǎng)的核心技術(shù)群,本質(zhì)是通過鏈式時間戳、共識算法、智能合約等一系列技術(shù),形成鏈上節(jié)點之間的信任和共識機制[26],這有助于在交易流通中塑造一種新型的生產(chǎn)關(guān)系,實現(xiàn)數(shù)據(jù)的安全存儲、可信傳輸及共同生產(chǎn),從而充分調(diào)動科研人員參與知識服務的積極性。因此,基于區(qū)塊鏈技術(shù)的知識服務智能化如何實現(xiàn)值得深入研究。
另一方面,關(guān)注知識服務智能化的結(jié)果使用,進一步探索如何科學解讀人工智能的分析結(jié)果并從中獲益的問題。人工智能的開放性在塑造知識服務共同體的同時,也在知識生產(chǎn)和產(chǎn)權(quán)占有之間制造了分歧,即客觀上存在“開放悖論”的困境[27]。未來研究可以嘗試,將知識產(chǎn)權(quán)保護機制引入知識服務智能化,建構(gòu)一個適合知識服務的知識版權(quán)開放、共享與使用的監(jiān)管機制。知識產(chǎn)權(quán)的清晰化有助于科研人員不再滿足于人工智能所呈現(xiàn)的相關(guān)分析結(jié)果,而是投入更多的時間、精力和智力去探究現(xiàn)象之間的因果關(guān)系。