王佳瑩,吳 麗,張肖會(huì)
(江蘇省科學(xué)技術(shù)情報(bào)研究所 江蘇南京210042)
在科技計(jì)劃項(xiàng)目管理過程中會(huì)產(chǎn)生諸多科研過程相關(guān)的信息數(shù)據(jù),包括科學(xué)數(shù)據(jù)、科技檔案數(shù)據(jù)、科技報(bào)告、科技成果、科研經(jīng)費(fèi)等,在上述科研信息數(shù)據(jù)中,科技檔案、科技成果登記、科技報(bào)告產(chǎn)生于科研過程的不同階段,能夠在某一方面集中反映科技創(chuàng)新過程與成果。
科學(xué)技術(shù)檔案是在科學(xué)研究中形成的應(yīng)當(dāng)保存的文件材料,是記錄科技創(chuàng)新過程的有效載體;科技成果登記是對(duì)已經(jīng)形成的科技成果全面而概括的數(shù)據(jù)集合,是科技成果的數(shù)據(jù)描述形態(tài);科技報(bào)告是對(duì)科學(xué)、技術(shù)研究結(jié)果或研究進(jìn)展的記錄,是記錄科技創(chuàng)新過程和經(jīng)驗(yàn)教訓(xùn)的有效載體[1]。
1.2.1 科技報(bào)告與科技檔案的區(qū)別
科技報(bào)告是科技檔案的重要組成部分,由于沒有相關(guān)的制度約束,科技檔案中關(guān)于技術(shù)內(nèi)容的描述十分欠缺??萍紙?bào)告是文獻(xiàn)化的科技檔案,在一定程度上是科技檔案的一種補(bǔ)充,豐富了科技檔案的內(nèi)容。
1.2.2 科技報(bào)告與科技文獻(xiàn)的區(qū)別
專利與論文都屬于科技文獻(xiàn),是科研項(xiàng)目的產(chǎn)出形式,均有專門的公開發(fā)行渠道[2]。學(xué)術(shù)論文是經(jīng)過同行評(píng)審的公開出版物,對(duì)內(nèi)容的獨(dú)創(chuàng)性有嚴(yán)格要求,篇幅受到限制,對(duì)研究方法、實(shí)驗(yàn)過程、中間結(jié)果等描述較為簡(jiǎn)單。專利是科技活動(dòng)中創(chuàng)新部分的提煉,科技報(bào)告中既包含成功的經(jīng)驗(yàn),也包含失敗的教訓(xùn),但只有成功的經(jīng)驗(yàn)才能申請(qǐng)專利。與科技檔案一樣,科技報(bào)告的內(nèi)容是對(duì)已發(fā)表的學(xué)術(shù)論文、專利的重要補(bǔ)充[3]。
1.2.3 科技報(bào)告與科技成果登記的區(qū)別
科技成果登記是通過眾多著錄項(xiàng)以數(shù)字的形式描述的科技成果,其作用是反映我國(guó)科技成果的屬性,主要是面向科技決策者服務(wù);科技報(bào)告則是通過文字的形式描述科技成果,其主要是為科研工作者提供前人研究的經(jīng)驗(yàn),兩者相互補(bǔ)充。
1.2.4 科技報(bào)告與科學(xué)數(shù)據(jù)的區(qū)別
科學(xué)數(shù)據(jù)是在科學(xué)實(shí)驗(yàn)、測(cè)試等過程中獲得的原始數(shù)據(jù)記錄,其本身并不是科技報(bào)告。對(duì)科學(xué)數(shù)據(jù)通過歸納分析,從中總結(jié)科學(xué)規(guī)律與結(jié)論后方能形成科技報(bào)告??茖W(xué)數(shù)據(jù)是科技報(bào)告的基本素材。
科技報(bào)告分為科技報(bào)告輯要頁和科技報(bào)告正文,其中科技報(bào)告輯要頁的信息來源于計(jì)劃項(xiàng)目管理系統(tǒng),包含項(xiàng)目完成單位信息、完成人信息、項(xiàng)目名稱、關(guān)鍵詞等信息;科技報(bào)告正文一般是word格式,分段介紹項(xiàng)目概述、研究方法、試驗(yàn)/實(shí)驗(yàn)過程與數(shù)據(jù)、研究結(jié)果。在科技報(bào)告正文中實(shí)際上是包含一部分科學(xué)數(shù)據(jù)的,也就是前文說到的試驗(yàn)/實(shí)驗(yàn)數(shù)據(jù)??萍紙?bào)告自建立之初從國(guó)家層面就建立了完善的體系,省里的科技報(bào)告體系也是照搬國(guó)家,甚至系統(tǒng)都是一致的,在一定程度上有效解決了科技報(bào)告數(shù)據(jù)標(biāo)準(zhǔn)與利用的問題,這是科技報(bào)告的一大優(yōu)勢(shì),也是后期我們可以利用的一大優(yōu)勢(shì)[3]。
科技計(jì)劃項(xiàng)目檔案的主要組成內(nèi)容為項(xiàng)目合同(原件)、驗(yàn)收材料、驗(yàn)收證書(部分)。我們認(rèn)為科技檔案項(xiàng)目的精華在于驗(yàn)收材料,材料中包含驗(yàn)收申請(qǐng)表、項(xiàng)目合同復(fù)印件、研發(fā)工作總結(jié)、研發(fā)技術(shù)報(bào)告、項(xiàng)目經(jīng)費(fèi)決算表[4]、研究成果、驗(yàn)收委員會(huì)名單與驗(yàn)收意見,從上述材料中可以得到大量信息。
①驗(yàn)收申請(qǐng)表:項(xiàng)目承擔(dān)單位的信息(包含所在地區(qū)、通信地址、聯(lián)系人、聯(lián)系方式),項(xiàng)目起止時(shí)間,驗(yàn)收形式,專利、論文等成果體現(xiàn)形式,承擔(dān)人員信息,項(xiàng)目經(jīng)費(fèi)實(shí)際到位與支出情況,獲獎(jiǎng)情況,技術(shù)指標(biāo)完成情況,經(jīng)濟(jì)指標(biāo)完成情況,建設(shè)任務(wù)完成情況,主要研究?jī)?nèi)容與研究成果,項(xiàng)目完成人員信息。
②研發(fā)工作總結(jié):比對(duì)項(xiàng)目合同中的實(shí)施進(jìn)程詳細(xì)闡述項(xiàng)目各階段完成情況,詳細(xì)介紹項(xiàng)目取得的成果、人才培養(yǎng)情況,總結(jié)項(xiàng)目實(shí)施過程中存在的問題和得到的經(jīng)驗(yàn),并提出相關(guān)建議。
③研發(fā)技術(shù)報(bào)告:項(xiàng)目的國(guó)內(nèi)情況對(duì)比,在實(shí)施過程中研究方法的選取,試驗(yàn)/實(shí)驗(yàn)過程、數(shù)據(jù)、經(jīng)驗(yàn)總結(jié)等描述,對(duì)項(xiàng)目的研究對(duì)象、研究方法、研究過程、研究結(jié)果進(jìn)行系統(tǒng)的闡述。研發(fā)技術(shù)報(bào)告?zhèn)戎赜诩夹g(shù)層面的數(shù)據(jù)描寫,2015年后其性質(zhì)與科技報(bào)告類似,但科技報(bào)告對(duì)格式的要求更加嚴(yán)格。
④項(xiàng)目經(jīng)費(fèi)決算表(審計(jì)報(bào)告):是項(xiàng)目實(shí)施期間經(jīng)費(fèi)的決算清單,揭示項(xiàng)目的資金來源與走向。
⑤研究成果:項(xiàng)目完成后形成的論文、專利、實(shí)務(wù)產(chǎn)品或?qū)嶋H技術(shù)運(yùn)用的描寫。
⑥驗(yàn)收委員會(huì):行業(yè)專家信息。
⑦驗(yàn)收意見:對(duì)項(xiàng)目完成后成果的評(píng)價(jià)與建議,以及該項(xiàng)成果在國(guó)際或國(guó)內(nèi)所處的水平與下一步研究方向的建議。
我們從上述構(gòu)成中可以發(fā)現(xiàn),在一份科技計(jì)劃項(xiàng)目的驗(yàn)收材料中蘊(yùn)含著非常豐富的資源信息,科技活動(dòng)的幾大要素(人、錢、事、物)在其中都可以找到非常準(zhǔn)確的信息。
科技成果登記與科技檔案的性質(zhì)不同,與科技報(bào)告自上而下的體系也不同,它既是自上而下的一項(xiàng)工作,但又缺乏完善的信息系統(tǒng)支持??萍汲晒怯浿邪男畔⒂谐晒Q、起始時(shí)間、成果簡(jiǎn)介、所屬行業(yè)、成果體現(xiàn)形式、支撐成果的計(jì)劃項(xiàng)目情況、產(chǎn)出專利情況、成果轉(zhuǎn)移情況、第一完成單位情況、合作完成單位情況、完成人情況、評(píng)價(jià)委員會(huì)(行業(yè)專家)名單和意見。
科技報(bào)告中涉及的項(xiàng)目名稱可能是科技檔案中的項(xiàng)目名稱或是科技成果登記中支撐成果的計(jì)劃項(xiàng)目名稱,某一個(gè)計(jì)劃項(xiàng)目的完成人可能是某一個(gè)成果評(píng)價(jià)委員會(huì)的專家。筆者承擔(dān)科技獎(jiǎng)勵(lì)工作時(shí)每一年都會(huì)比對(duì)當(dāng)年獲獎(jiǎng)的成果與科技成果轉(zhuǎn)化項(xiàng)目,重合率接近60%。所以在本文的開頭介紹過科技檔案、科技報(bào)告與科技成果登記在科技管理的不同階段,三者相互關(guān)聯(lián)又相互補(bǔ)充。我們截取了共有關(guān)鍵詞(完成單位、領(lǐng)域關(guān)鍵詞,第一完成人、驗(yàn)收委員會(huì))進(jìn)行聯(lián)想分析。
如圖1所示,從完成單位的角度來說,我們可以結(jié)合三者的信息分析單位性質(zhì)、產(chǎn)業(yè)分布領(lǐng)域、區(qū)域分布和單位優(yōu)勢(shì)領(lǐng)域。
圖1 完成單位角度的信息分析Fig.1 Information analysis from unit perspective
①單位性質(zhì):對(duì)完成單位性質(zhì)進(jìn)行區(qū)分,將其分為“高等院校”“科研院所”和“企業(yè)”,可以通過分析不同主體在不同計(jì)劃類別中所占的份額得出不同計(jì)劃類別針對(duì)不同單位的結(jié)論。
②產(chǎn)業(yè)領(lǐng)域分布:通過科技計(jì)劃項(xiàng)目的產(chǎn)業(yè)領(lǐng)域分布可以看出當(dāng)年江蘇省熱點(diǎn)產(chǎn)業(yè)引導(dǎo)方向,結(jié)合科技成果中的成果領(lǐng)域分布可以分析出全省產(chǎn)業(yè)引導(dǎo)形成的實(shí)際成果和全省產(chǎn)業(yè)引導(dǎo)趨勢(shì)、熱點(diǎn)產(chǎn)業(yè)分布。
③區(qū)域領(lǐng)域:通過不同單位主體所獲得的科技計(jì)劃項(xiàng)目得出的科技成果可以分析出全省各類產(chǎn)業(yè)的基本分布圖;結(jié)合專利分析可以繪制江蘇省產(chǎn)業(yè)分布區(qū)域;甚至可以通過截取某一個(gè)時(shí)間段分析出某一區(qū)域在某個(gè)時(shí)間段內(nèi)產(chǎn)業(yè)的走勢(shì),為產(chǎn)業(yè)區(qū)域規(guī)劃提供支撐。
④單位優(yōu)勢(shì)領(lǐng)域:通過完成單位與涉及領(lǐng)域之間的關(guān)系可以進(jìn)一步了解每個(gè)承擔(dān)單位的優(yōu)勢(shì)所在,如結(jié)合對(duì)高校承擔(dān)的科技計(jì)劃項(xiàng)目與產(chǎn)出的科技成果,分析高校重點(diǎn)學(xué)科、學(xué)科建設(shè)方向和該高校的優(yōu)勢(shì) 領(lǐng)域。
如圖2所示,選取某一個(gè)具體領(lǐng)域,我們可以從申報(bào)單位、研究主題、研究成果、研究層次4個(gè)角度進(jìn)行分析。
圖2 某一領(lǐng)域角度的信息分析Fig.2 Information analysis from a domain perspective
根據(jù)申報(bào)單位的性質(zhì)不同,可以分析出不同的單位在該領(lǐng)域的分布特點(diǎn);根據(jù)該領(lǐng)域的研究主題結(jié)合第一單位分析,可以得到該領(lǐng)域的優(yōu)勢(shì)單位信息;從研究成果的表現(xiàn)形式(專利、論文、經(jīng)濟(jì)效益)、成果轉(zhuǎn)化情況和專利分析與傳統(tǒng)文獻(xiàn)相結(jié)合得到科技計(jì)劃項(xiàng)目的產(chǎn)出分析,并得出科技成果的轉(zhuǎn)化情況;根據(jù)科技計(jì)劃項(xiàng)目驗(yàn)收時(shí)專家意見與成果評(píng)價(jià)得出該領(lǐng)域成果在國(guó)內(nèi)外所處的水平,以期為成果轉(zhuǎn)化和產(chǎn)業(yè)規(guī)劃提供支撐。
人員信息是最容易匹配的,標(biāo)引人員信息進(jìn)行配對(duì)就可以得到第一完成人、參與完成人、驗(yàn)收委員會(huì)、評(píng)價(jià)委員會(huì)的人員信息,如圖3所示,可以分析出某一領(lǐng)域?qū)W科帶頭人與行業(yè)專家的信息,以及某一個(gè)完成人在某一領(lǐng)域的發(fā)展歷程和所處的位置,甚至其核心團(tuán)隊(duì)信息都能一并解析得出。
圖3 人員信息角度的信息分析Fig.3 Information analysis from perspective of personnelinformation
通過數(shù)據(jù)挖掘、整合與分析建立科技成果數(shù)據(jù)采集與發(fā)布系統(tǒng),聚焦科技創(chuàng)新過程中形成的科技資源數(shù)據(jù),結(jié)合科技大數(shù)據(jù)中心建設(shè)整合現(xiàn)有的科技報(bào)告、科技成果登記與科技檔案數(shù)字化后的數(shù)據(jù),充分利用知識(shí)管理與知識(shí)庫信息技術(shù)和AI智能工具對(duì)數(shù)據(jù)進(jìn)行深度挖掘、分類整理與多維度分析,按年度、地區(qū)、產(chǎn)業(yè)、知識(shí)產(chǎn)權(quán)分布、政府指南導(dǎo)向等不同分類形成科技成果信息服務(wù)系統(tǒng)。該系統(tǒng)可服務(wù)于政府科技管理決策咨詢、高新技術(shù)園區(qū)科技成果轉(zhuǎn)化、科研院所信息研究和企業(yè)行業(yè)競(jìng)爭(zhēng)情報(bào)等不同需求的對(duì)象。
梳理并分析科技報(bào)告、科技檔案與科技成果登記數(shù)據(jù)的數(shù)量、結(jié)構(gòu)和存儲(chǔ)方式,借鑒知識(shí)管理、服務(wù)等理念,利用大數(shù)據(jù)、云計(jì)算、人工智能等新一代信息技術(shù)對(duì)上述三者現(xiàn)階段的工作流程、運(yùn)行系統(tǒng)、存量數(shù)和增量數(shù)據(jù)進(jìn)行摸排與分析,并對(duì)上述數(shù)據(jù)進(jìn)行了規(guī)范、標(biāo)準(zhǔn)化的整合加工處理,最終建成了3種資源集聚的基礎(chǔ)庫。
針對(duì)基礎(chǔ)庫的資源建立涵蓋數(shù)據(jù)采集處理、質(zhì)量保證、安全管理、隱私保護(hù)、數(shù)據(jù)集成應(yīng)用等在內(nèi)的數(shù)據(jù)加工聚合。制定數(shù)據(jù)管理規(guī)范、共享規(guī)則與數(shù)據(jù)標(biāo)準(zhǔn)目錄。通過對(duì)資源基礎(chǔ)庫中數(shù)據(jù)進(jìn)行解析、識(shí)別、轉(zhuǎn)換、清洗等操作構(gòu)建主題詞表、分類詞表、編碼規(guī)則、開放規(guī)則等,合理利用知識(shí)抽取、機(jī)器學(xué)習(xí)等信息處理技術(shù)將整合的資源數(shù)據(jù)挖掘有價(jià)值的信息,實(shí)現(xiàn)不同主題、行業(yè)、專家、科研機(jī)構(gòu)等多維度的數(shù)據(jù)動(dòng)態(tài)關(guān)聯(lián)和數(shù)據(jù)有效整合與集中管理,進(jìn)而提升數(shù)據(jù)服務(wù)價(jià)值。
利用新一代大數(shù)據(jù)平臺(tái)管理系統(tǒng),在實(shí)現(xiàn)資源基礎(chǔ)庫與數(shù)據(jù)聚合管理的基礎(chǔ)上利用數(shù)據(jù)標(biāo)準(zhǔn)與機(jī)器學(xué)習(xí)建立算子,并利用算子的拖拽實(shí)現(xiàn)不同維度的數(shù)據(jù)關(guān)聯(lián)展示,面向產(chǎn)業(yè)跟蹤、決策支持、知識(shí)服務(wù)等需求提供產(chǎn)業(yè)實(shí)時(shí)跟蹤檢測(cè)、區(qū)域產(chǎn)業(yè)分析對(duì)比、統(tǒng)計(jì)數(shù)據(jù)、行業(yè)快報(bào)、科技政策、產(chǎn)業(yè)趨勢(shì)、人才推送與評(píng)價(jià)、招商引智等服務(wù)。