吳穎文,紀楊建,顧新建
(浙江大學 機械工程學院浙江省先進制造技術重點研究實驗室,浙江 杭州 310027)
根據(jù)我國科學技術部在國家科技支撐計劃中對共性技術的定義,共性技術是指在不同領域、不同行業(yè)或不同區(qū)域能夠廣泛共享應用,對經(jīng)濟和社會發(fā)展產(chǎn)生普遍推動作用的技術[1]。當前產(chǎn)業(yè)與科技的競爭日趨激烈,產(chǎn)業(yè)競爭已經(jīng)從市場化階段的技術競爭走向競爭前技術的競爭。作為競爭前技術,產(chǎn)業(yè)共性技術創(chuàng)新不僅能夠推動新興產(chǎn)業(yè)的形成和培育,支撐其他多個產(chǎn)業(yè)實現(xiàn)技術突破,還能夠促進我國有限的科技資源實現(xiàn)高效分配與共享[2]。各國政府高度重視共性技術研發(fā)活動,如美國的先進技術計劃(Advanced Technology Program, ATP)、日本的研究聯(lián)合體(Very Large Scale Integration, VLSI)、歐洲信息技術研究發(fā)展戰(zhàn)略計劃(ESPRIT計劃)等。我國政府同樣支持共性技術研發(fā)活動,其中科技攻關計劃、科技支撐計劃、國家工程研究中心、國家工程技術中心和行業(yè)技術開發(fā)基地都明確提出加快產(chǎn)業(yè)共性技術的研發(fā)和推廣工作[3-5]。優(yōu)先組織和實施戰(zhàn)略性共性技術研發(fā)的基礎是依據(jù)未來產(chǎn)業(yè)和技術發(fā)展方向前瞻性地選擇出擬重點支持的共性技術,從而進行超前部署,因此產(chǎn)業(yè)共性技術選擇是共性技術研究領域的重點之一。
目前,國內(nèi)外對產(chǎn)業(yè)共性技術選擇的研究主要可分為基于德爾菲法的選擇方法、基于技術路線圖的選擇方法和基于文獻計量的選擇方法。從德爾菲法的角度,Ronde[6]提出在德爾菲調(diào)查中引入“專家對技術的熟悉程度”指標,建立“技術—專家熟悉度”二維矩陣以及不同技術關聯(lián)度矩陣,再通過因子分析法判別產(chǎn)業(yè)共性技術。劉波等[7]基于技術預見視角,使用德爾菲法構(gòu)建了共性技術初步篩選的指標體系,并根據(jù)優(yōu)劣解距離法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)舉例篩選共性技術的課題。從技術路線圖的角度,王倩等[8]、賀正楚等[9]分別以大數(shù)據(jù)產(chǎn)業(yè)和生物醫(yī)藥產(chǎn)業(yè)為例,采用專利地圖法遴選中國大數(shù)據(jù)產(chǎn)業(yè)和生物醫(yī)藥產(chǎn)業(yè)的共性技術,歸納出幾種典型的技術發(fā)展模式,繪制了兩大產(chǎn)業(yè)在近期、中期、長期的共性技術路線圖。從文獻計量的角度,Hall等[10]以美國專利商標局的專利數(shù)據(jù)為基礎,借助技術共性度、引文數(shù)量、引文滯后以及專利分類增長等指標對共性技術進行了識別,并指出共性技術多為信息和通信方面的技術。張鵬等[11]結(jié)合專利計量分析的相關理論和方法,構(gòu)建了專利引文網(wǎng)絡和專利技術領域共現(xiàn)網(wǎng)絡,分別進行K-核分析和搜索路徑連接統(tǒng)計值(Search Path Link Count,SPLC)主路徑分析,得出全球定位系統(tǒng)(Global Positioning System,GPS)產(chǎn)業(yè)共性技術發(fā)展演化的規(guī)律和趨勢。
總的來說,基于德爾菲法和技術路線圖的選擇方法屬于定性研究方法,很大程度上依賴于專家的主觀判斷及對技術領域的了解程度,缺乏一定的客觀性。而基于文獻計量的選擇方法雖然是一種定量研究,但識別出的其實是事后共性技術[12],無法解決大量競爭前共性技術的識別問題。因此,本文提出基于專利技術共現(xiàn)動態(tài)網(wǎng)絡的產(chǎn)業(yè)共性技術預測方法,從定量的角度解決事前共性技術[12]選擇問題。
專利技術共現(xiàn)網(wǎng)絡是專利分析中常用的一種方法,可用于挖掘技術的特點、發(fā)展路徑、關聯(lián)關系等。劉鳳朝等[13]基于專利技術共現(xiàn)網(wǎng)絡分析方法,利用國際專利分類號(International Patent Classification, IPC)構(gòu)建了納米技術演化路徑分析框架,考察了納米技術與相關技術領域融合發(fā)展的實現(xiàn)模式。沈君[14]從專利的標題和摘要中提取技術術語,并以此構(gòu)建專利技術共現(xiàn)網(wǎng)絡,利用卡龍的共詞分析方法和原則對專利技術主題結(jié)構(gòu)進行分析。動態(tài)網(wǎng)絡主要用于揭示網(wǎng)絡的演化過程及規(guī)律。李登杰等[15]基于動態(tài)網(wǎng)絡對技術創(chuàng)新網(wǎng)絡演化機制進行了系統(tǒng)分析,并驗證了該方法在刻畫技術創(chuàng)新網(wǎng)絡演化方面的有效性??紤]到專利技術共現(xiàn)復雜網(wǎng)絡和動態(tài)網(wǎng)絡在技術分析中的有效性,本文將這兩種網(wǎng)絡進行結(jié)合,作為產(chǎn)業(yè)共性技術預測方法的基礎。
據(jù)世界知識產(chǎn)權(quán)組織調(diào)查,專利文獻中包含世界上90%~95%的最新發(fā)明成果和技術情報,且約有70%的成果未在非專利文獻上發(fā)表。專利文獻涵蓋著全球最新創(chuàng)新成果,可以作為技術的預測性競爭情報來源[16-18]。因此,本文選擇專利文獻作為共性技術預測的研究對象。
如果一項專利涉及兩個或兩個以上的技術領域,則稱為專利技術共現(xiàn)。一個專利集包含的技術領域之間的共現(xiàn)關系可以通過復雜網(wǎng)絡表現(xiàn)出來。在專利技術共現(xiàn)復雜網(wǎng)絡中,網(wǎng)絡節(jié)點代表技術領域,邊代表所連接的兩個技術領域之間存在共現(xiàn)關系。根據(jù)共性技術具有的基礎性、廣泛性、關聯(lián)性等特征[3-4],本文認為在共現(xiàn)網(wǎng)絡中一項技術與其他越多的技術共現(xiàn),表明越多的技術需要依賴該技術以實現(xiàn)技術突破,則該技術是共性技術的可能性越大,即技術的共性度越大;一項技術與其他技術之間的共現(xiàn)頻次越高,表明該技術對其他技術所起的技術支撐作用越大,則該技術的共性度越大。基于該思想,提出共現(xiàn)廣度和共現(xiàn)強度兩個技術共性度衡量指標,共性技術則是這兩個指標值都比較大的一類技術。
對于事前共性技術選擇來說,需要識別的是未來一段時間內(nèi)技術共性度較大的一類技術。隨著專利文獻的不斷增長,專利技術共現(xiàn)網(wǎng)絡在不斷變化,網(wǎng)絡中每一項技術的共現(xiàn)廣度和共現(xiàn)強度也在不斷變化。技術共性度的變化是有規(guī)律的,有些技術在現(xiàn)階段的共性度較小,但共性度的增長十分迅速,這類技術很可能成為未來的共性技術;而有些技術雖然在現(xiàn)階段的共性度較大,但共性度的增長十分緩慢,這類技術可能不具備發(fā)展為共性技術的潛力。因此,基于技術共現(xiàn)廣度和共現(xiàn)強度隨時間的變化規(guī)律,運用相關的數(shù)據(jù)預測模型,可預測出該技術在未來時間點的共現(xiàn)廣度和共現(xiàn)強度,從而確定未來技術共性度較大的技術并將此作為日后重點研發(fā)的共性技術。
基于以上分析,提出產(chǎn)業(yè)共性技術預測方法,其過程如圖1所示。具體步驟為:①建立專利技術共現(xiàn)動態(tài)網(wǎng)絡;②確定衡量技術共性度的網(wǎng)絡指標,這里定義了共現(xiàn)廣度和共現(xiàn)強度兩個指標;③計算動態(tài)網(wǎng)絡中每項技術在各個時間點的技術共性度;④預測技術在未來時間點的技術共性度,這里采用基于差異化階數(shù)的多項式回歸模型;⑤選擇共現(xiàn)廣度和強度都比較大的技術作為預測出的未來共性技術。
Gt(Vt,Et,Wt)=g0∪g1∪g2∪…∪gt。
在目前的研究中,一般用專利分類號來表征技術領域[20-21],本文采用IPC國際專利分類號,因此專利技術共現(xiàn)即IPC分類號共現(xiàn)。
專利技術共現(xiàn)動態(tài)網(wǎng)絡Gt(Vt,Et,Wt)表示不同時間t技術領域之間的共現(xiàn)關系及共現(xiàn)頻次,其中:Vt表示0~t時間段內(nèi)存在的IPC分類號,Et表示0~t時間段內(nèi)u和v兩個分類號之間存在共現(xiàn)關系,Wt表示0~t時間段內(nèi)u和v兩個分類號之間的共現(xiàn)頻次,反映了分類號所代表的技術領域間的關聯(lián)程度。
根據(jù)共性技術的定義,本文提出共現(xiàn)廣度和共現(xiàn)強度這兩個技術共性度衡量指標。
(1)共現(xiàn)廣度Ri專利技術共現(xiàn)網(wǎng)絡中與節(jié)點i相連的其他節(jié)點的個數(shù),即與技術i出現(xiàn)共現(xiàn)的其他技術的個數(shù),表示技術i所能影響的技術范圍。
當技術i與其他技術共現(xiàn)之后,若在一段時間內(nèi)沒有再次發(fā)生共現(xiàn),則該技術的共性度不應該等同于初始時刻,而應隨著時間變化減弱,即技術共性活躍度下降。因此,使用技術活躍因子對技術共性度指標進行修正。
(1)
式中:t為專利公開后經(jīng)歷的時間,T為專利半衰期,α為技術共性度的活躍因子。
基于技術共性度的活躍因子,將技術共性度指標修正為:
(2)
(3)
根據(jù)構(gòu)建的專利技術共現(xiàn)動態(tài)網(wǎng)絡以及定義的技術共性度衡量指標,可得到每個技術領域在0到t時間段內(nèi)共現(xiàn)廣度和共現(xiàn)強度隨時間變化的時序數(shù)據(jù),基于這些時序數(shù)據(jù),運用相關模型即可預測相應技術在未來時間點的技術共性度,從而預測未來的共性技術。本文使用多項式回歸模型展開預測。
在一元回歸分析中,如果因變量y與自變量x的關系是非線性的,但是又找不到適當?shù)暮瘮?shù)來擬合,通常采用一元多項式回歸,一元m次多項式回歸方程為:
f(x)=a0+a1x+a2x2+…+amxm。
(4)
多項式回歸的最大優(yōu)點是可以通過增加x的高次項對實測點進行逼近,直到得到滿意的結(jié)果。研究證明,任何連續(xù)函數(shù)都能使用某個高次冪的多項式以任何預先指定的精確度一致地近似表示。由于技術領域的特點及發(fā)展差異,其共現(xiàn)廣度和共現(xiàn)強度隨時間變化的規(guī)律不同,很難找到同一個函數(shù)對所有技術領域進行回歸分析,而多項式回歸的優(yōu)點恰巧可以解決這個問題。
多項式回歸模型一般利用最小二乘法求解,其準則是求出f(x)的各個系數(shù)ak,使得各歷史數(shù)據(jù)(xi,yi)對應的點到f(xi)距離的平方和最小[23]。記距離函數(shù)
(5)
要使式(5)最小,需滿足
(6)
即以下線性方程組:
(7)
則方程可表示為:
RTRA=RTY。
(8)
式(8)存在唯一解:
A=(RTR)-1RTY。
(9)
根據(jù)式(9)即可求出擬合曲線函數(shù)f(x)中所有系數(shù)ak。
對于多項式回歸模型,一般m越大擬合的精度越高,但階數(shù)過大可能會造成過擬合,從而使模型的預測效果較差,因此重點是確定式中階數(shù)m的大小。對本文研究的技術共性度來說,由于技術領域的特點及發(fā)展差異,適用于每個技術領域多項式回歸模型的階數(shù)不同,因此提出差異化階數(shù)法,即對不同技術領域的模型確定不同的階數(shù),具體流程如圖4所示。
圖中R-squared為決定系數(shù),也稱為擬合優(yōu)度,是對回歸模型的評價指標,T是對決定系數(shù)設定的一個閾值,
(10)
對于某技術領域共性度的一組數(shù)據(jù),首先將多項式回歸模型的階數(shù)設定為1,計算出擬合模型的R-squared,若R-squared大于閾值T,則確定此時的階數(shù)為該技術領域共性度預測回歸模型的階數(shù),若小于T,則將階數(shù)加1,重新計算擬合模型的R-squared,直到R-squared大于閾值T。確定多項式回歸模型的階數(shù)后,即可擬合出每個技術領域共性度的函數(shù)關系,并對未來的共性度進行預測。
本案例以美的集團、格力電器、青島海爾3家家電領跑企業(yè)的專利數(shù)據(jù)為樣本,研究家電行業(yè)的共性技術。分別以“美的集團”、“格力電器”、“青島海爾”為申請人關鍵詞搜索萬方數(shù)據(jù)庫,截至本文檢索時間2018年5月30日,共收集52 848條專利數(shù)據(jù)。然后,對專利數(shù)據(jù)進行清洗,去除數(shù)據(jù)中申請人名稱與這3家家電企業(yè)相近的其他企業(yè)的數(shù)據(jù),最終得到47 740條有效數(shù)據(jù),其中28 241個專利文獻中存在IPC分類號共現(xiàn),因此以這28 241條數(shù)據(jù)為研究對象。經(jīng)統(tǒng)計,數(shù)據(jù)中共涉及到5 983個技術領域分類號。
以月為單位,建立專利技術共現(xiàn)動態(tài)網(wǎng)絡,動態(tài)網(wǎng)絡共有296個時間點。從動態(tài)網(wǎng)絡中可以觀察到隨著時間的推移,共現(xiàn)的技術領域越來越多,領域之間共現(xiàn)的頻次也越來越多。圖5展示了6個時間點的共現(xiàn)網(wǎng)絡圖。
基于296個時間點的專利技術共現(xiàn)網(wǎng)絡,利用式(2)和式(3)可計算每個技術領域在每個時間點的共現(xiàn)廣度和共現(xiàn)強度,從而得到5 983個技術領域的共性度隨時間演化的情況。目前采用的最普遍、最有效的科技文獻半衰期計量方法是引文分析法[24],即將科技文獻半衰期定義為被引文獻中最新的一半文獻是在最近多少時間內(nèi)發(fā)表的,利用該方法計算得出式中專利半衰期T為5.9。
圖6選取了其中20個技術領域在20個時間點的數(shù)據(jù)進行展示,圖中點的大小表示技術的共現(xiàn)廣度,點的深淺表示技術的共現(xiàn)強度。
基于技術領域共性度隨時間變化的數(shù)據(jù),可進行共性技術預測研究。本文基于1993年~2017年5月的數(shù)據(jù)對2018年5月的技術領域共性度進行預測。
首先,分別統(tǒng)計2017年5月5 983個技術領域共現(xiàn)廣度和共現(xiàn)強度的分布情況,如圖7所示,其中橫坐標表示共性度的值,縱坐標表示技術領域的個數(shù)。由圖可知技術領域的共現(xiàn)廣度和共現(xiàn)強度均服從冪律分布,即絕大部分技術領域的共性度都很小,極小部分技術領域的共性度較大。對共性技術預測來說,關注的是在未來有潛力成為共性技術的技術,因此選取現(xiàn)時間點共性度較大的那一小部分技術進行預測,在這里選取共現(xiàn)廣度和強度分別占前1%的60個技術領域進行預測。
基于差異化階數(shù)的多項式回歸模型分別對現(xiàn)時刻共現(xiàn)廣度和強度最大的60個技術進行預測,分別將R-squared的閾值T設定為0.97,0.98,0.99,預測結(jié)果誤差如表1所示。
表1 不同閾值T下的預測誤差
由表1可知,當閾值T等于0.98時,無論是共現(xiàn)廣度還是共現(xiàn)強度,其預測誤差最小,分別為5.27%和3.48%。此時預測結(jié)果中廣度和強度最大的12個技術的回歸曲線圖如圖8和圖9所示。根據(jù)所定義的共性技術測度標準,共性技術是共現(xiàn)廣度和強度都比較大的一類技術,因此確定如下6個技術領域為2018年5月的共性技術,如表2所示。
將預測結(jié)果與實際進行對比,如表3所示,由表可知共現(xiàn)廣度預測值前12位與實際值前12位的技術領域共有10個相同,共現(xiàn)強度預測值前12位與實際值前12位的技術領域共有11個相同。共性技術的預測結(jié)果誤差如表4所示,由表可知2018年5月的共性技術領域共8個,其中預測了6個,由此可知該共性技術預測模型的準確度較好,但覆蓋率還有待提高。
表2 2018年5月預測共性技術
表3 預測和實際共性度對比
表4 預測和實際共性技術對比
續(xù)表4
為了檢驗該產(chǎn)業(yè)共性技術預測模型的適用性,將專利數(shù)據(jù)樣本從3家家電企業(yè)擴大至8家,加入奧克斯集團、海信電器、TCL集團、四川長虹、小天鵝5家企業(yè)的專利數(shù)據(jù)。數(shù)據(jù)檢索與清洗方式與前述一致,最終得到26 451條有效數(shù)據(jù),其中12 401個專利文獻中存在IPC分類號共現(xiàn),加上前述3家企業(yè)的28 241條數(shù)據(jù),總計獲得40 642條數(shù)據(jù)作為研究對象。
按照前述方法對數(shù)據(jù)進行分析,得到不同閾值下共現(xiàn)廣度與共現(xiàn)強度的預測誤差,如表5所示。由表可知,當閾值T=0.98時,無論是共現(xiàn)廣度還是共現(xiàn)強度,其預測誤差最小,分別為7.49%和5.04%。該數(shù)據(jù)集的共性技術預測結(jié)果與小數(shù)據(jù)集的預測結(jié)果對比如表6所示,由表6可知兩個數(shù)據(jù)集下所預測的共性技術基本一致,由此可知該共性技術預測模型具有較好的適用性。
表5 不同閾值T下的預測誤差
表6 不同數(shù)據(jù)集預測結(jié)果對比
產(chǎn)業(yè)共性技術選擇是組織和實施共性技術研發(fā)的基礎,通過產(chǎn)業(yè)共性技術預測實現(xiàn)對未來共性技術的有效選擇有利于帶動產(chǎn)業(yè)的戰(zhàn)略升級,支撐眾多相關技術突破,提升自主創(chuàng)新能力及核心競爭力。本文基于專利的技術共現(xiàn)現(xiàn)象進行了產(chǎn)業(yè)共性技術預測的方法研究。具體包括以下工作:
(1)構(gòu)建了專利動態(tài)復雜網(wǎng)絡,以作為共性技術預測的研究對象。通過動態(tài)網(wǎng)絡表示出不同時間點技術領域之間的共現(xiàn)關系和共現(xiàn)頻次。
(2)確定了技術共性度衡量指標。基于專利技術共現(xiàn)網(wǎng)絡定義了共現(xiàn)廣度和共現(xiàn)強度兩個指標,并計算出動態(tài)網(wǎng)絡中各個節(jié)點在每個時間點的指標值。
(3)建立了共性技術預測模型。以共現(xiàn)廣度和共現(xiàn)強度的時間序列數(shù)據(jù)為基礎,采用差異化階數(shù)的多項式回歸模型,預測未來共性度比較大的技術以作為擬研發(fā)的共性技術。
(4)以家電行業(yè)為例進行實證研究,進一步驗證了共性技術預測方法的可行性。以2017年5月之前的專利數(shù)據(jù)為基礎,預測出該行業(yè)2018年5月的共性技術,并與實際共性技術進行對比,證明了模型的預測效果。
未來的研究方向主要包括兩個方面:①更深入地探究技術共性度指標,以實現(xiàn)產(chǎn)業(yè)共性技術更精準的預測;②改進產(chǎn)業(yè)共性技術預測模型,提高模型預測精度。