吳娜 劉超
摘要:專利信息智能輔助檢索系統(tǒng)中的自動檢索以語義檢索為特點,對所推選出的結(jié)果進行相關(guān)度排序,利用該模式下的文本檢索、干預(yù)檢索和推薦導(dǎo)航三個模塊,可對自動檢索結(jié)果進行人工干預(yù),提升檢索效率。本文結(jié)合實際案例的檢索過程,探討了人工干預(yù)對自動檢索結(jié)果的影響,以及檢索中進行人工干預(yù)的具體策略。
關(guān)鍵詞:自動檢索;人工干預(yù);文本檢索;干預(yù)檢索;推薦導(dǎo)航
中圖分類號:G354.2文獻標(biāo)識碼:A 文章編號:1003-5168(2020)21-00087-03
1 引言
專利信息智能輔助檢索系統(tǒng)是國家知識產(chǎn)權(quán)局在人工智能信息檢索方面探索的重要成果[1],為堅決打贏這場提質(zhì)增效攻堅戰(zhàn)起到了重要作用。
本文基于實際案例,旨在分享使用專利信息智能輔助檢索系統(tǒng)(以下簡稱“智能輔助檢索系統(tǒng)”)的相關(guān)經(jīng)驗。
2 智能輔助檢索系統(tǒng)中的自動檢索及人工干預(yù)
專利信息智能輔助檢索系統(tǒng)是基于專利信息智能語義檢索系統(tǒng)進行的智能化改造項目。目前系統(tǒng)提供了智能信息推送、導(dǎo)引檢索、智能檢索、自動檢索和相似度瀏覽五大功能模塊,實現(xiàn)了專利信息智能語義檢索系統(tǒng)從傳統(tǒng)檢索模式的工具性被動調(diào)用向智能化檢索模式的主動推送的轉(zhuǎn)變。
其中,自動檢索是指系統(tǒng)根據(jù)案卷信息,通過后臺算法自動檢索結(jié)果集,并將結(jié)果按照相似度進行排序。
自動檢索是一種全文語義檢索模式,其根據(jù)技術(shù)方案中詞條相互之間詞義上的關(guān)系,對詞條的集合進行處理,自動抽取語義形成關(guān)鍵詞[2],并加工成N維空間內(nèi)的一個向量,檢索時計算各文獻所形成向量的向量內(nèi)積得到語義相關(guān)度。這種檢索模式存在檢索范圍大、不能有效提取發(fā)明構(gòu)思、無法使用精確分類[3]等缺陷,因此,僅僅采用基于申請?zhí)柕淖詣訖z索在某些情況下并不能快速高效地獲得最優(yōu)對比文件,此時往往需要適當(dāng)?shù)娜斯じ深A(yù),以改善上述不足。
人工干預(yù)是在系統(tǒng)中檢索時,將語義檢索命令與關(guān)鍵詞和/或分類號等,采用布爾算符構(gòu)建成檢索式進行檢索,使用者可以自己調(diào)整關(guān)鍵詞或分類號等信息[2]。自動檢索模式下,還具有文本檢索、干預(yù)檢索和推薦導(dǎo)航三個模塊,其為人工干預(yù)提供了很好的途徑。
3 具體案例分析
基于申請?zhí)柕淖詣訖z索在某些情況下并不能快速高效的獲得最優(yōu)對比文件,而文本檢索可根據(jù)輸入的文本進行更有針對性的檢索,干預(yù)檢索可對基于申請?zhí)柕淖詣訖z索結(jié)果進行干預(yù),推薦導(dǎo)航可進一步擴展分類號,那將文本檢索、干預(yù)檢索和推薦導(dǎo)航與自動檢索進行結(jié)合,又會對檢索結(jié)果帶來哪些影響呢,本文通過具體的案例進行展示。
3.1 人工干預(yù)提高檢索效率
發(fā)明名稱:氯氧鎂涂層鋼筋混凝土及其制備方法
常溫下,用改性環(huán)氧樹脂涂層均勻的涂覆在鋼筋表面。
當(dāng)僅基于申請?zhí)枌υ搶@暾堖M行自動檢索時發(fā)現(xiàn):在沒有干擾,僅看現(xiàn)有技術(shù)的情況下,可作為對比文件1的目標(biāo)文件排在第47位,相似度為57%。
當(dāng)利用干預(yù)檢索進行干預(yù)時,在干預(yù)檢索中加入“防腐”這個關(guān)鍵詞,即用“防腐”這個關(guān)鍵詞去干預(yù)基于申請?zhí)柕淖詣訖z索結(jié)果集,同樣在僅看現(xiàn)有技術(shù)的情況下發(fā)現(xiàn),可作為對比文件1的目標(biāo)文件排在第2位,相似度上升為92%。
當(dāng)利用文本檢索模塊將權(quán)利要求1的內(nèi)容導(dǎo)入文本檢索框后進行檢索,同樣在僅看現(xiàn)有技術(shù)的情況下,發(fā)現(xiàn)可作為對比文件1的目標(biāo)文件排在第2位,相似度上升為88%。
通過利用干預(yù)檢索和文本檢索后發(fā)現(xiàn),目標(biāo)文件的排序均向前提升,相較于僅僅基于申請?zhí)柕淖詣訖z索,能更快地獲得對比文件。基于申請?zhí)柕淖詣訖z索是一種完全自動的檢索模式,可作為智能檢索的初探;而干預(yù)檢索通過其輸入的關(guān)鍵詞和/或分類號對自動檢索結(jié)果進行干預(yù),在一定程度上可以理解為一種自動檢索+干預(yù)的檢索模式,在干預(yù)檢索時,添加有效的關(guān)鍵詞和/或分類號,會明顯提升檢索效率,同時其相對于傳統(tǒng)的檢索方式,不需用戶構(gòu)建檢索式,更加快捷、簡便。相較于自動檢索和干預(yù)檢索,文本檢索是基于輸入的新的文本進行語義檢索,其可以理解為一種半自動的檢索模式,用戶可根據(jù)具體案情對技術(shù)方案、技術(shù)特征、技術(shù)問題和技術(shù)效果進行重點檢索,結(jié)合使用分類號,檢索結(jié)果更優(yōu)。
3.2 利用文本檢索可快速獲取準(zhǔn)確分類號
經(jīng)前述介紹可知,推薦導(dǎo)航中的技術(shù)領(lǐng)域統(tǒng)計功能可幫助獲取分類號信息,同時其統(tǒng)計結(jié)果根據(jù)檢索對象的變化而變化。檢索實踐發(fā)現(xiàn),基于申請?zhí)柕淖詣訖z索存在領(lǐng)域擴展不足的問題。而相較于基于申請?zhí)柕淖詣訖z索,文本檢索可進行更有針對性的檢索,對領(lǐng)域擴展不足的問題進行彌補。
在上述案例中,其權(quán)利要求1技術(shù)方案中記載了“步驟三:常溫下,用改性環(huán)氧樹脂涂層均勻的涂覆在鋼筋表面”,而所檢索到的對比文件1所用的涂層材料為久美特涂層,且是高溫涂覆,現(xiàn)針對于上述內(nèi)容,需要繼續(xù)檢索。
在沒有干擾,僅僅基于申請?zhí)枌υ搶@暾堖M行自動檢索的情況下,發(fā)現(xiàn)沒有可作為給出啟示的對比文件2的目標(biāo)文件。而利用干預(yù)檢索加入關(guān)鍵詞“防腐”及“環(huán)氧樹脂”對基于申請?zhí)柕淖詣訖z索結(jié)果進行干預(yù),也沒找到所需目標(biāo)文件。通過分析發(fā)現(xiàn),基于申請?zhí)栕詣訖z索結(jié)果多側(cè)重于與主題名稱相關(guān)的文獻,這可能也是基于案卷信息自動檢索領(lǐng)域擴展不盡完美的地方。這就提醒使用者根據(jù)檢索結(jié)果以及發(fā)明點,適時調(diào)整檢索方向。
針對本案例,通過分析原始文件所給分類號以及自動檢索結(jié)果所涉及分類號可知,其檢索的領(lǐng)域側(cè)重于混凝土——C04B,與鋼筋防腐不直接相關(guān),且未擴展到與改性環(huán)氧樹脂涂層相關(guān)的信息。干預(yù)檢索時雖加入了“環(huán)氧樹脂”這個關(guān)鍵詞,但是從所得文獻技術(shù)領(lǐng)域統(tǒng)計結(jié)果來看,其相較于自動檢索的結(jié)果,變化不大。這就進一步提醒用戶要根據(jù)技術(shù)領(lǐng)域統(tǒng)計結(jié)果,適時調(diào)整檢索方向。
基于此可知,獲取該案例對比文件2的關(guān)鍵是突破領(lǐng)域限制,獲取有效分類號。
而文本檢索是根據(jù)文本內(nèi)容進行的檢索,其檢索對象是由輸入的文本內(nèi)容確定的。此時,可借助文本檢索來擴展分類號,以彌補本案例自動檢索領(lǐng)域擴展不足的問題。
對于該案例,所尋找的目標(biāo)文件其側(cè)重點在于用改性環(huán)氧樹脂涂層涂覆在鋼筋表面來防腐,因而,在利用文本檢索獲取分類號時,其輸入的文本應(yīng)是涉及改性環(huán)氧樹脂的有效文本。在具體操作時,考慮到權(quán)利要求3的附加技術(shù)特征對改性環(huán)氧樹脂涂層的具體組分進行了重點描述,同時說明書技術(shù)方案中可準(zhǔn)確提取所需目標(biāo)文件的相關(guān)關(guān)鍵詞,因而采用在文本框中輸入“權(quán)利要求3的附加技術(shù)特征+干預(yù)關(guān)鍵詞:混凝土,鋼筋,防腐,腐蝕,室溫,常溫,固化”的方法,進行檢索后借助推薦導(dǎo)航中的技術(shù)領(lǐng)域統(tǒng)計功能確定與改性環(huán)氧樹脂相關(guān)的分類號。
通過上述方法找到了“C09D163/00”這個分類號,其表示基于環(huán)氧樹脂的涂料組合物,基于環(huán)氧樹脂衍生物的涂料組合物,是與改性環(huán)氧樹脂相關(guān)的準(zhǔn)確分類號。分析發(fā)現(xiàn):相較于在專利信息智能語義檢索系統(tǒng)中通過/mems/ic命令統(tǒng)計分析來擴展分類號的方法,利用文本檢索與推薦導(dǎo)航相結(jié)合的方法來擴展分類號,不用通過布爾運算構(gòu)建檢索式,更加方便、快捷。
隨后,通過利用干預(yù)檢索輸入分類號“C09D163/00”及關(guān)鍵詞“環(huán)氧樹脂、鋼筋、室溫、常溫”對基于原始案卷信息的自動檢索結(jié)果進行干預(yù),在給出文獻的第4位便找到了給出啟示的目標(biāo)文件,相似度為75%。
3.3 合理編輯文本,提高文本檢索效率
文本檢索利用其文本框中文本可編輯的特點結(jié)合分類號可進行更有針對性的檢索,合理編輯文本,對提高檢索效率,獲得更準(zhǔn)確的目標(biāo)文件起到了舉足輕重的作用。
本文針對該案例,通過在文本檢索的基礎(chǔ)上加入分類號“C09D163/00”進行檢索,以對文本編輯問題進行以下嘗試:
首先,由于該案例所尋找對比文件2其側(cè)重點應(yīng)在于用改性環(huán)氧樹脂涂層涂覆在鋼筋表面來防腐,其申請文件的摘要從技術(shù)手段、技術(shù)問題、技術(shù)效果等方面對該關(guān)鍵技術(shù)手段進行了描述,能較準(zhǔn)備表達所需目標(biāo)文件信息。因而首先通過在文本框中輸入摘要及關(guān)鍵詞“混凝土,鋼筋,防腐,腐蝕,室溫,常溫,固化,環(huán)氧樹脂”,同時在分類號過濾欄中輸入分類號“C09D163/00”,但是,本文未找到給出結(jié)合啟示的目標(biāo)文件。
隨后,考慮到智能檢索其實質(zhì)是從文獻中提取關(guān)鍵詞并構(gòu)成N維空間的向量,與其他文獻的N維空間向量計算向量內(nèi)積得到語義相關(guān)度的模式,本文采取直接提取關(guān)鍵詞的方法在文本框中輸入“混凝土,鋼筋,防腐,腐蝕,室溫,常溫,固化,環(huán)氧樹脂”進行檢索,同時輸入分類號“C09D163/00”進行限定,本文在給出文獻列表的第29位找到了給出啟示的目標(biāo)文件,相似度為68.65%。
通過上述的檢索過程,本文發(fā)現(xiàn),在利用文本檢索進行針對性檢索時,直接輸入能準(zhǔn)確表達發(fā)明點的關(guān)鍵詞比輸入整段文本具有更高的效率。分析原因:直接提取關(guān)鍵詞輸入文本框中,相較于輸入相關(guān)語段,可避免在檢索過程中因關(guān)鍵詞提取不準(zhǔn)確或者不適當(dāng)而帶來的誤差,降低了無關(guān)信息對檢索結(jié)果的干擾。
4 結(jié)語
專利信息智能輔助檢索系統(tǒng)是提高檢索效率的有力武器,而自動檢索無疑是智能輔助檢索系統(tǒng)中最方便、最高效、最易上手的模塊。在利用自動檢索的同時,借助其文本檢索、干預(yù)檢索和推薦導(dǎo)航三個功能,可更快鎖定目標(biāo)文件。其中,干預(yù)檢索可通過輸入分類號或關(guān)鍵詞對自動檢索結(jié)果進行干預(yù),文本檢索可通過在文本框中輸入編輯后的文字,并配合分類號進行檢索,干預(yù)檢索和文本檢索均能更好的彌補自動檢索領(lǐng)域擴展不足的問題。而準(zhǔn)確添加文本內(nèi)容,可以提高文本檢索的效率;合理利用推薦導(dǎo)航中的技術(shù)領(lǐng)域統(tǒng)計功能,可幫助用戶進一步擴展分類號。
參考文獻:
[1] 楊宏章,付靜.利用專利文本結(jié)構(gòu)化特征構(gòu)建專利信息智能語義檢索系統(tǒng)的方法[J].情報理論與實踐,2015(4):98、136-138.
[2] 郭嘉,史凱.淺析在PATENTICS檢索系統(tǒng)中的專利檢索應(yīng)用[J].審查實踐與研究,2017(8):123-127.
[3] 丁冉.PATENTICS的不同干預(yù)方式在電路領(lǐng)域中的檢索應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2019(23):180-181、184.