馮立杰,尤鴻宇,王金鳳
(1.鄭州大學(xué)管理工程學(xué)院,鄭州 450001;2.上海海事大學(xué)經(jīng)濟(jì)管理學(xué)院,上海 201306)
精準(zhǔn)識(shí)別技術(shù)創(chuàng)新機(jī)會(huì),是企業(yè)乃至國家獲得競爭優(yōu)勢、以不斷提升核心競爭力的重要手段[1]。在技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別中,專利作為一種重要的信息來源被人們廣泛運(yùn)用,但囿于承載專利信息的專利文獻(xiàn)數(shù)據(jù)量龐大,如何在海量專利文獻(xiàn)中快速、準(zhǔn)確地識(shí)別技術(shù)創(chuàng)新機(jī)會(huì)顯得尤為重要。
傳統(tǒng)的基于專家經(jīng)驗(yàn)的專利文獻(xiàn)分析主要側(cè)重于定性方法,但隨著科技創(chuàng)新不斷向縱深發(fā)展,受專家的知識(shí)、經(jīng)驗(yàn)及其占有資料所限,難以保證分析結(jié)果的客觀性和準(zhǔn)確性,導(dǎo)致識(shí)別的技術(shù)創(chuàng)新機(jī)會(huì)受專家主觀影響較大的弊端日益凸顯[2]。因此,有些學(xué)者嘗試結(jié)合定量分析方法,基于大數(shù)據(jù)驅(qū)動(dòng)開展技術(shù)創(chuàng)新機(jī)會(huì)的識(shí)別。例如,Park等[3]借助IPC國際專利分類號(hào)計(jì)算了不同企業(yè)的技術(shù)組合得分,進(jìn)而用于識(shí)別具有較高實(shí)用性和發(fā)展?jié)摿Φ募夹g(shù)創(chuàng)新機(jī)會(huì);Rodriguez等[4]和Kim等[5]提出了基于專利引文網(wǎng)絡(luò)離群值識(shí)別高價(jià)值專利,并獲取潛在的技術(shù)創(chuàng)新機(jī)會(huì);Yoon等[6]運(yùn)用SAO語義及技術(shù)功能相似度分析法,研究了如何從已有產(chǎn)品或技術(shù)中獲取技術(shù)創(chuàng)新機(jī)會(huì);王金鳳等[7]在融合專利挖掘和形態(tài)分析方法建立的形態(tài)矩陣基礎(chǔ)上,構(gòu)建了技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑。由此可見,國內(nèi)外學(xué)者已提出了諸多較為成熟的定量識(shí)別技術(shù)創(chuàng)新機(jī)會(huì)方法,為本文從專利信息驅(qū)動(dòng)下的技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑的研究提供了重要的參考思路,但存在以下兩個(gè)問題:第一,雖然部分研究雖然解決了如何量化技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別的問題,但需要相關(guān)專家事先參與并進(jìn)行大量的專利信息篩選,由此可能增加企業(yè)的技術(shù)創(chuàng)新成本,而且受主觀因素影響較大;第二,現(xiàn)有針對(duì)具體領(lǐng)域的技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別問題的研究,大多采用較為單一的分析評(píng)價(jià)方法,缺乏客觀數(shù)據(jù)的支撐,難以指導(dǎo)企業(yè)精準(zhǔn)開展具象的技術(shù)創(chuàng)新活動(dòng)。
專利作為尋求技術(shù)創(chuàng)新機(jī)會(huì)的一種重要載體,承載著大量的高價(jià)值信息[8]。其中,專利的新穎性在表征技術(shù)創(chuàng)新機(jī)會(huì)的同時(shí),經(jīng)由人們普遍的認(rèn)可和推廣,能夠?yàn)槠髽I(yè)帶來普適性的技術(shù)創(chuàng)新機(jī)會(huì)[9]。企業(yè)可在計(jì)算技術(shù)創(chuàng)新方案新穎性的基礎(chǔ)上,得到各潛在創(chuàng)新機(jī)會(huì)的排序,為企業(yè)高效開展技術(shù)創(chuàng)新活動(dòng)提供科學(xué)的決策依據(jù)。Lee等[10]結(jié)合文本挖掘和局部異常因子算法,應(yīng)用專利文獻(xiàn)數(shù)量和專利引文數(shù)量衡量專利的新穎程度;Wang等[11]通過計(jì)算各專利文獻(xiàn)的異常因子,衡量專利的新穎性;吳菲菲等[12]綜合考慮專利和科技文獻(xiàn)的時(shí)間特征,以引用時(shí)間衡量專利的新穎性;任海英等[13]在對(duì)專利標(biāo)題和摘要構(gòu)建的專利知識(shí)網(wǎng)絡(luò)基礎(chǔ)上,進(jìn)行了文本相似度分析,以此測量專利的新穎性。不難看出,目前對(duì)專利新穎性評(píng)價(jià)的文獻(xiàn)多聚焦于專利引文的角度開展相關(guān)研究。
有鑒于此,本文提出了在海量的專利信息驅(qū)動(dòng)下,融合多維技術(shù)創(chuàng)新圖譜、LDA(latent Dirichlet allocation,LDA)主題模型與TextRank-IDF專利新穎性評(píng)價(jià)的技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑。本文通過專利信息檢索及預(yù)處理,運(yùn)用LDA模型從海量的專利文獻(xiàn)中提取技術(shù)創(chuàng)新要素及主題,利用多維技術(shù)創(chuàng)新圖譜探究潛在的技術(shù)創(chuàng)新機(jī)會(huì),進(jìn)而運(yùn)用Tex‐tRank-IDF新穎性評(píng)價(jià)指標(biāo)對(duì)潛在的技術(shù)創(chuàng)新方案進(jìn)行新穎性排序,識(shí)別出具有較高創(chuàng)新價(jià)值的創(chuàng)新路徑,實(shí)現(xiàn)最大限度地減少因?qū)<胰斯ずY選大量專利信息所帶來的效率和準(zhǔn)確性問題,為企業(yè)科學(xué)選擇創(chuàng)新方案、不斷提升創(chuàng)新效率提供有益的參考。
多維技術(shù)創(chuàng)新圖譜是借助多個(gè)創(chuàng)新維度進(jìn)行創(chuàng)新要素提取并歸類,結(jié)合多個(gè)創(chuàng)新法則對(duì)創(chuàng)新維度進(jìn)行迭代變換,以構(gòu)建技術(shù)創(chuàng)新方案的一種創(chuàng)新方法。其實(shí)質(zhì)是一種基于9類創(chuàng)新元素的分類與獲取,并運(yùn)用9種創(chuàng)新法則變換重組,從而形成創(chuàng)新方案的技術(shù)創(chuàng)新方法。9個(gè)創(chuàng)新維度和9種創(chuàng)新法則的列表,分別如表1和表2所示[14]。
表1 創(chuàng)新維度表[14]
截至目前,多維技術(shù)創(chuàng)新圖譜已經(jīng)在軟件產(chǎn)品研發(fā)、智能手機(jī)、煤層氣、潛水電泵等多領(lǐng)域得到了廣泛應(yīng)用,并驗(yàn)證了該方法的可行性,能夠有效提升技術(shù)創(chuàng)新的效率和效果[14-15]。
表2 創(chuàng)新法則表[14]
LDA主題模型在專利挖掘領(lǐng)域中已得到廣泛運(yùn)用,眾多學(xué)者運(yùn)用LDA模型提取海量專利文獻(xiàn)的關(guān)鍵詞,實(shí)現(xiàn)自動(dòng)識(shí)別專利文本主題[16-17]。然而,LDA算法在面對(duì)海量專利文本信息時(shí),存在主題及主題詞難以解釋的缺陷[17]。因此,本研究將利用多維技術(shù)創(chuàng)新圖譜理論,通過具象的創(chuàng)新維度對(duì)主題詞進(jìn)行二次歸類,以構(gòu)建具有實(shí)用價(jià)值的創(chuàng)新路徑。
LDA主題模型是一種基于三層貝葉斯結(jié)構(gòu)的文本分析模型,包括文檔、主題和詞項(xiàng)三層結(jié)構(gòu)。其中,文檔是各主題詞項(xiàng)的集合,核心是利用狄利克雷分布,從文檔生成主題并抽取詞項(xiàng),對(duì)高維向量空間表示的文檔降維表達(dá),以實(shí)現(xiàn)對(duì)文檔和詞項(xiàng)的高效聚類。利用LDA模型生成文檔的具體流程如下:
(1)假設(shè)每篇專利文獻(xiàn)d的主題生成過程相互獨(dú)立,文檔d主題生成服從狄利克雷先驗(yàn)分布θd~Dir(α),生成各專利文獻(xiàn)d中的第i個(gè)詞項(xiàng)主題Zdi~Multinomial(θd),則可構(gòu)建文檔-主題矩陣。
(2)對(duì)各主題k生成對(duì)應(yīng)的詞項(xiàng)分布φk~Dir(β),即從該分布中采樣生成專利文獻(xiàn)d中的第i個(gè)詞項(xiàng)wdi~Multinomial(φzdi),此階段對(duì)應(yīng)的主題-詞項(xiàng)矩陣。
反復(fù)進(jìn)行上述過程,直至生成所有文檔的主題及主題詞。其中,LDA模型的聯(lián)合概率分布為[18]
為保障更好的分類效果,LDA主題模型的核心是設(shè)置主題數(shù)量參數(shù)[19]。Blei將表述某個(gè)主題不確定性程度的困惑度(perplexity)作為模型的評(píng)價(jià)指標(biāo)。一般而言,隨著主題數(shù)K的增加,該指標(biāo)會(huì)相應(yīng)降低。低困惑度模型能夠達(dá)到更好的聚類效果,針對(duì)M個(gè)文本數(shù)據(jù)集的困惑度值計(jì)算公式為:
其中,Nd表示文本d所有詞項(xiàng)的總數(shù);p(wd)表示文本集中各文檔的產(chǎn)生概率。
本文提出了一種改進(jìn)TextRank-IDF方法來衡量技術(shù)創(chuàng)新機(jī)會(huì)在一定范圍文本集的新穎性。Tex‐tRank算法是在對(duì)文本去除停用詞后,根據(jù)文本N中詞項(xiàng)間的共現(xiàn)關(guān)系,將文本中詞項(xiàng)作為圖中節(jié)點(diǎn),以鏈入節(jié)點(diǎn)數(shù)量決定各詞項(xiàng)的權(quán)重,通過公式
計(jì)算詞圖網(wǎng)絡(luò)的各節(jié)點(diǎn)權(quán)重,迭代至穩(wěn)定后權(quán)重較高的詞項(xiàng),即關(guān)鍵詞。其中,W為初始權(quán)重;Vi為入鏈集合;Vj為出鏈集合;S表示TextRank的重;Wji表示第j行、第i列對(duì)應(yīng)的權(quán)重;k表示第i列之前的列數(shù)。本文設(shè)置阻尼系數(shù)d表示跳轉(zhuǎn)到詞圖網(wǎng)絡(luò)其他節(jié)點(diǎn)的概率,防止權(quán)重計(jì)算的值為0。
傳統(tǒng)的TF-IDF算法作為一種常用的特征提取方法被廣泛運(yùn)用,其中逆文本頻率IDF的主要思路是分布在少量文本中的特征詞更重要,即在文本集中包含詞項(xiàng)w的文檔越少,IDF的值就越大。
因此,本文提出了計(jì)算潛在技術(shù)創(chuàng)新方案新穎性指標(biāo)的TextRank-IDF算法。
(1)運(yùn)用TextRank算法對(duì)某個(gè)潛在技術(shù)方案(potential technical opportunity,PTO)PTOi提取關(guān)鍵詞,繼而得到關(guān)鍵詞w集合:S={w1,…,wq},其中q為關(guān)鍵詞個(gè)數(shù)。
(2)用IDF值評(píng)價(jià)關(guān)鍵詞w在專利文本庫中的重要程度,其中n(w)為專利文本集中包含關(guān)鍵詞w的專利數(shù),N為專利文本總數(shù),則有
(3)以IDF(pto)值表示技術(shù)方案在專利文本庫中的重要程度,IDF(pto)值越高,表示技術(shù)方案的新穎性越強(qiáng),有
最終可得到各潛在技術(shù)創(chuàng)新機(jī)會(huì)新穎性的排序,為企業(yè)開展技術(shù)創(chuàng)新提供科學(xué)決策依據(jù)。
本文將基于海量專利信息的驅(qū)動(dòng),依托多維技術(shù)創(chuàng)新圖譜,通過專利信息檢索及預(yù)處理、技術(shù)創(chuàng)新機(jī)會(huì)生成模型構(gòu)建、潛在技術(shù)創(chuàng)新方案評(píng)價(jià)等步驟,探究技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑。其中,除確定主題數(shù)、主題篩選及多維技術(shù)創(chuàng)新圖譜構(gòu)建環(huán)節(jié)需要專家篩選外,其余工作均可通過計(jì)算機(jī)Python編程來實(shí)現(xiàn),以最大限度地減少識(shí)別技術(shù)創(chuàng)新機(jī)會(huì)受主觀因素影響的弊端。具體研究路徑如圖1所示。
圖1 潛水電機(jī)技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別研究路徑
專利信息檢索及預(yù)處理主要包括:首先,確定與技術(shù)創(chuàng)新對(duì)象有關(guān)的檢索關(guān)鍵詞,開展專利檢索并提取專利信息摘要;其次,為提高中文的分詞效果,需通過查閱具體研究領(lǐng)域的特定術(shù)語,構(gòu)建對(duì)應(yīng)技術(shù)創(chuàng)新領(lǐng)域的用戶詞典,并濾除專利信息中的噪聲信息,去除停用詞;最后,基于分詞后各詞項(xiàng)的詞頻,采用清洗后的專利信息摘要構(gòu)建專利的文檔-詞項(xiàng)分布矩陣,使專利文本向量化。
技術(shù)創(chuàng)新機(jī)會(huì)生成模型構(gòu)建流程主要包括:首先,確定LDA主題模型的主題數(shù)和迭代次數(shù);其次,運(yùn)行LDA主題模型探究技術(shù)創(chuàng)新領(lǐng)域關(guān)鍵詞的主題分布,并篩除與技術(shù)創(chuàng)新無關(guān)的主題;再次,利用多維技術(shù)創(chuàng)新圖譜將關(guān)鍵詞進(jìn)行維度劃分,對(duì)各創(chuàng)新維度重組,以獲得新的關(guān)鍵詞組合;最后,與相關(guān)創(chuàng)新法則耦合,構(gòu)建多維技術(shù)創(chuàng)新圖譜,生成系列潛在技術(shù)創(chuàng)新方案。
潛在技術(shù)創(chuàng)新方案評(píng)價(jià)階段主要包括:首先,參照現(xiàn)有專利形式,標(biāo)準(zhǔn)化表達(dá)潛在技術(shù)創(chuàng)新方案;其次,運(yùn)用TextRank算法提取技術(shù)創(chuàng)新方案中的關(guān)鍵詞,并計(jì)算各關(guān)鍵詞的IDF值;最后,根據(jù)技術(shù)創(chuàng)新方案新穎性計(jì)算公式,得出各潛在技術(shù)創(chuàng)新機(jī)會(huì)的新穎性排序,為企業(yè)開展技術(shù)創(chuàng)新活動(dòng)提供科學(xué)的決策參考依據(jù)。
潛水電機(jī)在影響國民經(jīng)濟(jì)發(fā)展的一些重要領(lǐng)域,如井下或江河湖泊取水、井工礦井排水、農(nóng)田灌溉及礦山搶險(xiǎn)救災(zāi)等領(lǐng)域,均得到了廣泛應(yīng)用,在我國國民經(jīng)濟(jì)發(fā)展中發(fā)揮著不可替代的作用[20]。但工作環(huán)境的特殊性使得潛水電機(jī)對(duì)絕緣、冷卻散熱、密封等性能有較高的要求,亟需開展技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別,以找出具體的創(chuàng)新路徑指導(dǎo)相關(guān)企業(yè)開展創(chuàng)新活動(dòng)。
4.1.1 潛水電機(jī)專利信息的檢索
本研究的專利信息來源于國家知識(shí)產(chǎn)權(quán)局專利檢索及分析平臺(tái)(http://pss-system.cnipa.gov.cn)。在進(jìn)行專利信息檢索前,需要首先對(duì)專家訪談以確定檢索的表達(dá)式,如表3所示。
表3 潛水電機(jī)專利檢索表達(dá)式
通過檢索獲得與潛水電機(jī)有關(guān)的專利信息5560條,初步去重后剩余4873條。
4.1.2 潛水電機(jī)專利信息的預(yù)處理
在LDA主題模型運(yùn)行之前,本研究應(yīng)對(duì)專利信息進(jìn)行中文分詞和文檔向量化處理。
首先,為提高分詞效果,防止錯(cuò)誤劃分技術(shù)術(shù)語,一般需要對(duì)多位該領(lǐng)域相關(guān)專家進(jìn)行訪談,結(jié)合查閱的相關(guān)文獻(xiàn)資料,確定潛水電機(jī)的特有專業(yè)技術(shù)術(shù)語,構(gòu)建用戶自定義詞典。
其次,應(yīng)用正則表達(dá)式濾除非文字符號(hào),同時(shí)導(dǎo)入常用停用詞表,去除量詞、語氣詞、低質(zhì)量文本等噪聲信息。在對(duì)專利進(jìn)行文本處理后,使用Python的jieba工具包分詞。
最后,基于詞項(xiàng)、詞頻進(jìn)行特征提取,構(gòu)建文檔-詞項(xiàng)分布矩陣。
4.2.1 潛水電機(jī)LDA模型的參數(shù)設(shè)定
在潛水電機(jī)LDA模型運(yùn)行前需要進(jìn)行參數(shù)設(shè)定,其中重要參數(shù)包括超參數(shù)α和β,以及主題數(shù)K。超參數(shù)α和β可設(shè)定為0.01[18]。通過計(jì)算主題數(shù)由2到50模型的困惑度值可得,當(dāng)主題數(shù)取值36時(shí),困惑度值最小,但此時(shí)存在大量的無意義主題。除去主題數(shù)36,模型得到最小困惑度的主題數(shù)可取值19,為使主題間的技術(shù)邊界更加清晰兼具代表性,本研究將主題數(shù)確定為19,如圖2所示。
另外,迭代次數(shù)同樣是影響模型學(xué)習(xí)效果的重要因素之一[21]。如圖3所示,但當(dāng)?shù)螖?shù)增加至400次后,模型的效果提升有限,故本研究將迭代次數(shù)定為400。
4.2.2 潛水電機(jī)LDA模型的運(yùn)行結(jié)果分析
本文利用Python的scikit-learn庫進(jìn)行LDA主題模型計(jì)算,得到潛水電機(jī)的主題和關(guān)鍵詞分布信息。
根據(jù)關(guān)鍵詞分詞結(jié)果,結(jié)合相關(guān)技術(shù)領(lǐng)域的專家意見,在濾除包含水下養(yǎng)殖、船舶技術(shù)、水下清淤等潛水電機(jī)延伸應(yīng)用領(lǐng)域的9個(gè)主題聚類后,得到篩選的10個(gè)技術(shù)領(lǐng)域。各主題代表的技術(shù)領(lǐng)域清晰,有較好的聚類效果,故可根據(jù)各主題關(guān)鍵詞內(nèi)容進(jìn)行命名,具體如表4所示。
圖2 潛水電機(jī)主題數(shù)對(duì)應(yīng)的困惑度值
圖3 迭代次數(shù)對(duì)模型效果的影響
表4 潛水電機(jī)主題和關(guān)鍵詞列表
基于LDA創(chuàng)新元素提取得到的分類結(jié)果,不僅體現(xiàn)了潛水電機(jī)設(shè)計(jì)和制造的關(guān)鍵點(diǎn)(即技術(shù)創(chuàng)新的“痛點(diǎn)”),而且聚焦了相關(guān)技術(shù)領(lǐng)域的常用改進(jìn)手段,故以此來整合現(xiàn)有技術(shù)的關(guān)鍵要素能夠滿足企業(yè)識(shí)別關(guān)鍵技術(shù)創(chuàng)新機(jī)會(huì)的需要。
4.2.3 潛水電機(jī)的多維技術(shù)創(chuàng)新圖譜構(gòu)建
將上述關(guān)鍵詞進(jìn)行創(chuàng)新元素歸類并劃分維度,應(yīng)用多維技術(shù)創(chuàng)新圖譜可以構(gòu)建技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑,具體包括創(chuàng)新維度劃分、多維技術(shù)創(chuàng)新圖譜構(gòu)建和技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別三方面內(nèi)容。
1)創(chuàng)新維度的劃分
根據(jù)多維技術(shù)創(chuàng)新圖譜對(duì)創(chuàng)新維度的定義,結(jié)合專家給出的具體意見,將制約潛水電機(jī)創(chuàng)新的要素按維度劃分為功能維、結(jié)構(gòu)維、機(jī)理維和材料維四類,具體如表5所示。其中,功能維是從滿足潛水電機(jī)各項(xiàng)技術(shù)性能要求角度提取的創(chuàng)新要素,包含潛水電機(jī)正常運(yùn)轉(zhuǎn)所需的各方面具象技術(shù)(如控制、檢測、過濾等);結(jié)構(gòu)維是創(chuàng)新要素中涉及潛水電機(jī)技術(shù)的構(gòu)件(如電機(jī)、殼體、葉輪等);機(jī)理維是從實(shí)現(xiàn)潛水電機(jī)各具體功能基本原理角度提取的創(chuàng)新要素(如密封、驅(qū)動(dòng)、導(dǎo)流等);而材料維則是考慮潛水電機(jī)部件的材料構(gòu)成及相態(tài)等的創(chuàng)新要素(如樹脂、剛性、聚酰亞胺等)。
2)多維技術(shù)創(chuàng)新圖譜構(gòu)建
通過對(duì)創(chuàng)新要素的歸類,潛水電機(jī)的關(guān)鍵技術(shù)要素聚焦在功能維、結(jié)構(gòu)維、機(jī)理維和材料維等4個(gè)維度。創(chuàng)新的目的是滿足某些特定的功能需求,那么功能維就是識(shí)別潛水電機(jī)技術(shù)創(chuàng)新機(jī)會(huì)的主要導(dǎo)向,并且潛水電機(jī)技術(shù)需求的實(shí)現(xiàn)與其構(gòu)件密切相關(guān),故本文選取功能維和結(jié)構(gòu)維作為識(shí)別技術(shù)創(chuàng)新機(jī)會(huì)的主要導(dǎo)向。在確定創(chuàng)新維度后,依次將每個(gè)維度與多維技術(shù)創(chuàng)新圖譜的創(chuàng)新法則迭代耦合,即可構(gòu)建潛水電機(jī)的技術(shù)創(chuàng)新地圖,從而得到多個(gè)技術(shù)創(chuàng)新方案。
表5 潛水電機(jī)創(chuàng)新維度表
3)技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別
首先,本研究聚焦于功能維、結(jié)構(gòu)維和機(jī)理維3個(gè)維度,依次與各創(chuàng)新法則迭代耦合,并保留能夠通過耦合得到技術(shù)創(chuàng)新方案的創(chuàng)新法則。將上述3個(gè)創(chuàng)新維度和組合與集成、局部優(yōu)化、自服務(wù)等創(chuàng)新法則構(gòu)建多維技術(shù)創(chuàng)新圖譜,識(shí)別潛在的技術(shù)創(chuàng)新機(jī)會(huì),并進(jìn)行規(guī)范化表達(dá),如圖4所示。
①內(nèi)水循環(huán)冷卻系統(tǒng)技術(shù)創(chuàng)新機(jī)會(huì)確定。冷卻系統(tǒng)是潛水電機(jī)正常運(yùn)轉(zhuǎn)的基本保證,合理的冷卻結(jié)構(gòu)設(shè)計(jì)能夠延長電機(jī)的使用壽命[22]。在傳統(tǒng)設(shè)計(jì)中,潛水電機(jī)運(yùn)行產(chǎn)生的熱量由冷卻液在電機(jī)內(nèi)腔與外導(dǎo)管之間循環(huán)流動(dòng)散發(fā),外導(dǎo)管的設(shè)置不僅增加了成本和空間,電機(jī)定子的散熱效果也不夠理想。因此,運(yùn)用組合與集成、局部優(yōu)化法則,考慮定子結(jié)構(gòu)的局部優(yōu)化及轉(zhuǎn)子結(jié)構(gòu)的組合與集成分析發(fā)現(xiàn),可采用內(nèi)水循環(huán)冷卻系統(tǒng)技術(shù)創(chuàng)新(表6)。
②增設(shè)自動(dòng)保護(hù)技術(shù)系統(tǒng)的技術(shù)創(chuàng)新機(jī)會(huì)確定。潛水電機(jī)的工作環(huán)境大多較為惡劣,必要的自動(dòng)保護(hù)技術(shù)至關(guān)重要。常見故障中,電機(jī)內(nèi)缺水會(huì)導(dǎo)致導(dǎo)軸承、推力軸承嚴(yán)重?fù)p壞,需要增設(shè)貧水傳感器;繞組過熱燒毀需要實(shí)時(shí)進(jìn)行溫度檢測[23];占比較大的絕緣失效[24],同樣需要對(duì)潛水電機(jī)的絕緣監(jiān)測實(shí)施自動(dòng)保護(hù)技術(shù)。因此,運(yùn)用組合與集成、自服務(wù)創(chuàng)新法則分析發(fā)現(xiàn),可采用增設(shè)貧水保護(hù)裝置、溫度檢測保護(hù)裝置以及電阻檢測絕緣檢測裝置,以實(shí)現(xiàn)潛水電機(jī)的智能控制和自我保護(hù)(表6)。
③增設(shè)甩砂結(jié)構(gòu)的技術(shù)創(chuàng)新機(jī)會(huì)確定。潛水電機(jī)長期在惡劣的環(huán)境運(yùn)行,單純的機(jī)械密封無法滿足較差水質(zhì)和大含砂量條件下的密封需求[25]。因此,運(yùn)用局部優(yōu)化法則分析發(fā)現(xiàn),在潛水電機(jī)機(jī)械密封基礎(chǔ)上增設(shè)甩砂結(jié)構(gòu),能夠有效防止軸承和軸瓦結(jié)構(gòu)的磨損(表6)。
另外,以材料維要素替換機(jī)理維要素,考慮功能維、結(jié)構(gòu)維和材料維等3個(gè)維度的創(chuàng)新要素,進(jìn)而與智慧化、自服務(wù)和局部優(yōu)化等法則耦合,同時(shí)進(jìn)行規(guī)范化表達(dá),同樣可挖掘潛在的技術(shù)創(chuàng)新機(jī)會(huì)。
④在軸承座底端過濾器增設(shè)磁性吸附裝置的技術(shù)創(chuàng)新機(jī)會(huì)確定。潛水電機(jī)的內(nèi)部以鐵為基礎(chǔ)的雜質(zhì)占65%以上,且多為硬顆粒,由此容易造成潛水電機(jī)軸承的磨損。對(duì)此,運(yùn)用局部優(yōu)化法則和智慧化法則分析發(fā)現(xiàn),在軸承座底端過濾器增設(shè)磁性吸附裝置,能夠?qū)崿F(xiàn)過濾裝置的局部優(yōu)化和智慧化(表7)。
⑤改變潛水電機(jī)推力軸承承磨材料配對(duì)的技術(shù)創(chuàng)新機(jī)會(huì)確定。潛水電機(jī)推力軸承受到熱交變影響會(huì)產(chǎn)生推力軸承盤碎裂、龜裂等嚴(yán)重故障[26]。為保障潛水電機(jī)的長期可靠運(yùn)行,運(yùn)用局部優(yōu)化法則分析發(fā)現(xiàn),改變潛水電機(jī)推力軸承承磨材料的配對(duì),能夠改善軸承材料的剛性以減少系列相關(guān)故障(表7)。
圖4 潛水電機(jī)多維技術(shù)創(chuàng)新圖譜
⑥采用F102潤滑軸承和特殊軸瓦材料的技術(shù)創(chuàng)新機(jī)會(huì)確定。潛水電機(jī)常用的設(shè)備運(yùn)行方式包含立式、斜式和臥式運(yùn)行,以適于不同的工作環(huán)境。開發(fā)立臥兩用潛水電機(jī)能提高產(chǎn)品的復(fù)用性以滿足不同的工況要求,但潛水電機(jī)臥式運(yùn)行易受軸向力影響引起軸瓦結(jié)構(gòu)磨損從而導(dǎo)致電機(jī)無法運(yùn)轉(zhuǎn)[27]??紤]機(jī)理維的剛性要素,運(yùn)用自服務(wù)法則分析發(fā)現(xiàn),采用F102潤滑軸承和特殊軸瓦材料能夠保障材料的剛性(表7)。
表7 結(jié)合材料維的潛水電機(jī)潛在技術(shù)創(chuàng)新機(jī)會(huì)
4.3.1 潛水電機(jī)技術(shù)創(chuàng)新機(jī)會(huì)的新穎性評(píng)價(jià)
為了對(duì)上述標(biāo)準(zhǔn)化表達(dá)的潛在技術(shù)創(chuàng)新機(jī)會(huì)做出初步評(píng)價(jià),應(yīng)通過潛水電機(jī)的技術(shù)新穎性指標(biāo)計(jì)算并排序,輔助企業(yè)進(jìn)行創(chuàng)新機(jī)會(huì)抉擇。具體步驟如下:
(1)提取潛水電機(jī)的技術(shù)創(chuàng)新機(jī)會(huì)關(guān)鍵詞。借助jieba工具包對(duì)所得技術(shù)方案結(jié)果進(jìn)行分詞和詞性標(biāo)注處理,引入本研究建立的潛水電機(jī)技術(shù)領(lǐng)域用戶詞典,濾除對(duì)技術(shù)創(chuàng)新機(jī)會(huì)代表性較低的關(guān)鍵詞,僅保留其中的動(dòng)詞與名詞部分,采用TextRank算法對(duì)各潛在技術(shù)創(chuàng)新機(jī)會(huì)方案提取出關(guān)鍵詞,具體如表8所示。
(2)計(jì)算潛水電機(jī)技術(shù)創(chuàng)新方案的技術(shù)新穎性評(píng)價(jià)值。根據(jù)公式(4)計(jì)算上述各關(guān)鍵詞的IDF值,然后根據(jù)公式(5)計(jì)算潛水電機(jī)的技術(shù)創(chuàng)新方案新穎性,得到每個(gè)方案的評(píng)價(jià)指標(biāo)值。
表8 潛水電機(jī)潛在技術(shù)創(chuàng)新機(jī)會(huì)技術(shù)新穎性指標(biāo)
由表8可知,技術(shù)方案新穎性指標(biāo)值的比較結(jié)果為⑥>⑤>②>③>①>④。即采用F102潤滑軸承和特殊軸瓦材料的技術(shù)創(chuàng)新機(jī)會(huì)>改變潛水電機(jī)推力軸承承磨材料配對(duì)的技術(shù)創(chuàng)新機(jī)會(huì)>增設(shè)自動(dòng)保護(hù)技術(shù)系統(tǒng)的技術(shù)創(chuàng)新機(jī)會(huì)>增設(shè)甩砂結(jié)構(gòu)的技術(shù)創(chuàng)新機(jī)會(huì)>內(nèi)水循環(huán)冷卻系統(tǒng)技術(shù)創(chuàng)新機(jī)會(huì)>在軸承座底端過濾器增設(shè)磁性吸附裝置的技術(shù)創(chuàng)新機(jī)會(huì)。
4.3.2 潛水電機(jī)技術(shù)創(chuàng)新方案分析結(jié)果驗(yàn)證
為驗(yàn)證上述結(jié)果的有效性,本文將上述各技術(shù)創(chuàng)新方案所對(duì)應(yīng)創(chuàng)新維度的創(chuàng)新元素作為專利檢索的關(guān)鍵詞,由潛水電機(jī)領(lǐng)域的專家對(duì)檢索結(jié)果進(jìn)行篩選,剔除與潛水電機(jī)技術(shù)無關(guān)的專利信息,專利信息庫中對(duì)應(yīng)的專利數(shù)量越少,表明該技術(shù)創(chuàng)新方案的新穎性越高[28]。本次專利檢索平臺(tái)為國家知識(shí)產(chǎn)權(quán)局的專利檢索及分析平臺(tái)(http://pss-system.cni‐pa.gov.cn),檢索時(shí)間為2019年11月25日。
檢索結(jié)果表明(表9),本文提出的各技術(shù)創(chuàng)新方案的新穎性從高到低的排序依次為⑥、⑤、②、③、①、④,這與實(shí)際專利信息庫中的分布趨勢相符,從而驗(yàn)證了該技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑的有效性。
本文首先利用LDA主題模型進(jìn)行了專利挖掘,以快速提取關(guān)鍵技術(shù)創(chuàng)新要素;其次,在此基礎(chǔ)上,結(jié)合多維技術(shù)創(chuàng)新圖譜,構(gòu)建了從海量專利信息中獲取技術(shù)創(chuàng)新方案的路徑;再次,通過Tex‐tRank-IDF專利新穎性指標(biāo),對(duì)提出的技術(shù)創(chuàng)新方案進(jìn)行了創(chuàng)新機(jī)會(huì)識(shí)別評(píng)價(jià);最后,以潛水電機(jī)的技術(shù)創(chuàng)新為例,驗(yàn)證了該技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑的可行性,為企業(yè)高效開展技術(shù)創(chuàng)新活動(dòng)提供了科學(xué)的決策依據(jù)。
本文的學(xué)術(shù)貢獻(xiàn)主要體現(xiàn)在以下兩個(gè)層面。
一是在技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別階段。本文將LDA主題模型與多維技術(shù)創(chuàng)新圖譜有機(jī)融合,能夠快速在海量專利信息中通過主題聚類提取影響技術(shù)創(chuàng)新的關(guān)鍵要素,從而與創(chuàng)新法則迭代變換以識(shí)別潛在的技術(shù)創(chuàng)新機(jī)會(huì)。這不僅解決了以往主要依賴專家進(jìn)行海量專利篩選受主觀因素影響較大的弊端以及效率較低等問題,而且彌補(bǔ)了單一使用LDA主題模型難以深入挖掘技術(shù)創(chuàng)新機(jī)會(huì)的不足。
二是在技術(shù)創(chuàng)新機(jī)會(huì)評(píng)價(jià)階段。本文提出了基于新穎性的技術(shù)創(chuàng)新機(jī)會(huì)評(píng)價(jià)方法,綜合應(yīng)用Tex‐tRank-IDF新穎性評(píng)價(jià)方法,對(duì)標(biāo)準(zhǔn)化表達(dá)后的潛在技術(shù)創(chuàng)新機(jī)會(huì)的新穎性排序,驗(yàn)證了本文構(gòu)建評(píng)價(jià)方法的有效性,為企業(yè)更加客觀地開展技術(shù)創(chuàng)新活動(dòng)提供了有益的參考和啟發(fā)。
然而,本文以潛水電機(jī)為例構(gòu)建的技術(shù)創(chuàng)新機(jī)會(huì)識(shí)別路徑存在以下局限。
第一,有待于更為全面地考慮技術(shù)關(guān)鍵詞的選取問題??茖W(xué)技術(shù)的日新月異使得各具體技術(shù)領(lǐng)域的細(xì)分日趨繁雜,急需領(lǐng)域?qū)<覙?gòu)建對(duì)應(yīng)的用戶詞典,建立更加完善的領(lǐng)域特征詞表,以避免遺漏專業(yè)術(shù)語(技術(shù)關(guān)鍵詞)現(xiàn)象的發(fā)生。因此,未來研究需要在更為完整的語料庫進(jìn)行,以不斷提高研究結(jié)論的準(zhǔn)確性。
第二,有待于更為全面地考慮技術(shù)創(chuàng)新機(jī)會(huì)的評(píng)價(jià)指標(biāo)問題。雖然專利的新穎性是技術(shù)創(chuàng)造性和實(shí)用性的基礎(chǔ),但并非衡量專利價(jià)值的唯一指標(biāo)。因此,構(gòu)建技術(shù)創(chuàng)新機(jī)會(huì)評(píng)價(jià)指標(biāo)不能僅局限于新穎性,后續(xù)研究還應(yīng)結(jié)合專利引文網(wǎng)絡(luò)分析,從實(shí)用性和經(jīng)濟(jì)性等角度探究衡量潛在技術(shù)創(chuàng)新機(jī)會(huì)的系列指標(biāo)。
表9 潛水電機(jī)創(chuàng)新要素檢索和相關(guān)專利