国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

借助智能化檢索系統(tǒng)提高專利申請的檢索效能

2023-02-23 18:43:05黃云雪孫瑞生
河南科技 2023年1期
關(guān)鍵詞:檢索系統(tǒng)排序預(yù)設(shè)

黃云雪 孫瑞生

(國家知識(shí)產(chǎn)權(quán)局專利局專利審查協(xié)作天津中心,天津 300304)

0 引言

專利審查過程中,審查員需要通過關(guān)鍵詞、分類號(hào)匹配的方式來進(jìn)行檢索。但是在檢索時(shí),對于方法的具體步驟、步驟與步驟之間的邏輯關(guān)系、結(jié)構(gòu)部件的位置描述、結(jié)構(gòu)與結(jié)構(gòu)之間的邏輯關(guān)系等經(jīng)常出現(xiàn)難以提煉關(guān)鍵詞、關(guān)鍵詞擴(kuò)展不全面、分類號(hào)不準(zhǔn)確等情形,給檢索帶來較大困難。而且,傳統(tǒng)的檢索工具是S系統(tǒng),使用S系統(tǒng)進(jìn)行檢索獲得檢索結(jié)構(gòu)后,通常需要進(jìn)行全文瀏覽來獲取對比文件,瀏覽檢索結(jié)果獲取對比文件的時(shí)間較長,不能較快地找到可用的對比文件。

近些年隨著人工智能和大數(shù)據(jù)技術(shù)的發(fā)展,智能化檢索應(yīng)運(yùn)而生,例如廣泛使用的PATENTICS智能檢索平臺(tái)[1-2]。智能化檢索是指在檢索過程中,平臺(tái)不再拘泥于用戶所輸入請求語句的字面本身,而是透過現(xiàn)象看本質(zhì),準(zhǔn)確地捕捉用戶輸入語句后面的真正意圖,自動(dòng)將用戶輸入的內(nèi)容進(jìn)行同義詞、近義詞以及其他語種擴(kuò)展,并以此進(jìn)行搜索,從而更準(zhǔn)確地向用戶反饋?zhàn)罘掀湫枰乃阉鹘Y(jié)果[3]。

1 智能化檢索系統(tǒng)的功能

基于智能化檢索的理念,國家知識(shí)產(chǎn)權(quán)局于2022年7月上線了智能化檢索系統(tǒng),為專利申請的檢索帶來了很大的便利。

新的智能化檢索系統(tǒng)以語義檢索為核心,以“快、準(zhǔn)、全”為目標(biāo),對文獻(xiàn)數(shù)據(jù)資源進(jìn)行重新整合并新增智能檢索功能。在對專利文獻(xiàn)進(jìn)行整合時(shí),將文摘數(shù)據(jù)庫和全文數(shù)據(jù)庫進(jìn)行整合避免轉(zhuǎn)庫操作,同時(shí),將外文數(shù)據(jù)庫的數(shù)據(jù)翻譯為中文,審查員可使用中文進(jìn)行檢索并瀏覽中文檢索結(jié)果,避免了由于語言障礙導(dǎo)致外文專利數(shù)據(jù)庫檢索不充分的問題。新增智能檢索功能包括融合檢索功能,通過簡易的人機(jī)交互界面實(shí)現(xiàn)選庫、檢索、概覽、輔助工具一體化;在融合檢索時(shí),用戶只要輸入案件的申請?zhí)柣蛳嚓P(guān)文本就可以進(jìn)行純語義檢索并將檢索結(jié)果基于語義相關(guān)度進(jìn)行排序輸出,并且還提供先布爾檢索后語義排序以及先語義檢索后布爾篩選的檢索方式,將語義檢索和人工干預(yù)相結(jié)合,進(jìn)一步提高了檢索效能;此外,新的智能化檢索系統(tǒng)還具有特色功能——一站式瀏覽功能,一站式檢索功能在獲得檢索結(jié)果后可以基于技術(shù)特征畫像實(shí)現(xiàn)對比文件的快速瀏覽及篩選,幫助審查員在眾多檢索結(jié)果中快速命中相關(guān)對比文件。

本研究通過三個(gè)實(shí)際案例在國家知識(shí)產(chǎn)權(quán)局自主開發(fā)的智能化檢索系統(tǒng)中的檢索過程,探究如何通過智能化檢索系統(tǒng)提高專利申請的檢索效能。

2 智能化檢索系統(tǒng)在檢索中的應(yīng)用

2.1 利用純語義檢索結(jié)果擴(kuò)展關(guān)鍵詞進(jìn)行人工干預(yù)

當(dāng)使用智能化檢索系統(tǒng)進(jìn)行檢索時(shí),除了最簡單地通過申請?zhí)栠M(jìn)行純語義檢索之外,還需要充分利用人工干預(yù)手段來提高檢索效率。由于智能化檢索系統(tǒng)在純語義檢索時(shí),將本申請與數(shù)據(jù)庫中的文獻(xiàn)進(jìn)行全文相似度計(jì)算,其排名在前的文獻(xiàn)與本申請技術(shù)方案的相關(guān)度較大,因而,可利用相關(guān)度較大的文獻(xiàn)中所記載的內(nèi)容對關(guān)鍵詞進(jìn)行擴(kuò)展,降低關(guān)鍵詞表達(dá)的難度。

案例一。本案例的權(quán)利要求1請求保護(hù)一種信息推薦方法。其特征在于,根據(jù)目標(biāo)用戶的目標(biāo)用戶標(biāo)簽,確定多個(gè)推薦信息;確定所述多個(gè)推薦信息中每個(gè)推薦信息的預(yù)設(shè)優(yōu)先級(jí)和預(yù)測優(yōu)先級(jí);根據(jù)所述預(yù)設(shè)優(yōu)先級(jí)和所述預(yù)測優(yōu)先級(jí),確定所述每個(gè)推薦信息的加權(quán)優(yōu)先級(jí);根據(jù)所述多個(gè)推薦信息和所述每個(gè)推薦信息的加權(quán)優(yōu)先級(jí),向所述目標(biāo)用戶進(jìn)行信息推薦。

本案針對現(xiàn)有推薦方法獲得的推薦信息轉(zhuǎn)化率不高的問題,提出基于推薦信息的預(yù)設(shè)優(yōu)先級(jí)和預(yù)測優(yōu)先級(jí)確定推薦信息的加權(quán)優(yōu)先級(jí)進(jìn)行推薦,從而有效提高推薦信息的轉(zhuǎn)化率。在說明書中具體說明了預(yù)設(shè)優(yōu)先級(jí)為:運(yùn)營人員基于特定營銷需求和/或運(yùn)營人員的營銷經(jīng)驗(yàn),設(shè)置排序規(guī)則,進(jìn)而營銷推薦系統(tǒng)根據(jù)預(yù)設(shè)排序規(guī)則,為信息數(shù)據(jù)庫中的信息確定預(yù)設(shè)優(yōu)先級(jí);對預(yù)測優(yōu)先級(jí)的定義為:為目標(biāo)用戶確定多個(gè)推薦信息之后,營銷推薦系統(tǒng)根據(jù)每個(gè)推薦信息的歷史點(diǎn)擊數(shù)據(jù),確定每個(gè)推薦信息的預(yù)測點(diǎn)擊率,進(jìn)而根據(jù)每個(gè)推薦信息的預(yù)測點(diǎn)擊率,通過預(yù)設(shè)排序算法,實(shí)時(shí)計(jì)算每個(gè)推薦信息的預(yù)測優(yōu)先級(jí)。根據(jù)權(quán)利要求記載的技術(shù)方案以及說明書中所記載的內(nèi)容可知,本申請的關(guān)鍵技術(shù)手段為通過預(yù)設(shè)優(yōu)先級(jí)和預(yù)測優(yōu)先級(jí)確定推薦信息的加權(quán)優(yōu)先級(jí)進(jìn)行推薦,因而,可以提煉出“預(yù)測優(yōu)先級(jí)、預(yù)設(shè)優(yōu)先級(jí),推薦,加權(quán)”等關(guān)鍵詞作為檢索要素。然而,由于“預(yù)測優(yōu)先級(jí)”和“預(yù)設(shè)優(yōu)先級(jí)”并非本領(lǐng)域常用的表達(dá)方式,并且“推薦”和“加權(quán)”帶來的檢索噪聲十分大,因而,本案在檢索時(shí)的難點(diǎn)在于對“預(yù)測優(yōu)先級(jí)”和“預(yù)設(shè)優(yōu)先級(jí)”如何擴(kuò)展以及檢索噪聲大的問題。

利用智能化檢索系統(tǒng)對本案進(jìn)行檢索,檢索過程如下。

第一步:進(jìn)行純語義檢索,檢索結(jié)果默認(rèn)設(shè)置為400篇;對檢索結(jié)果進(jìn)行初步瀏覽發(fā)現(xiàn)多篇對比文件中公開了對多種推薦方式的推薦結(jié)果進(jìn)行融合獲得推薦結(jié)果,本案中將預(yù)測優(yōu)先級(jí)和預(yù)設(shè)優(yōu)先級(jí)進(jìn)行加權(quán)也是一種融合的方式。

第二步:對關(guān)鍵詞進(jìn)行擴(kuò)展,利用關(guān)鍵詞“加權(quán),融合”對初步語義檢索結(jié)果進(jìn)行布爾篩選,在前10個(gè)檢索結(jié)果中獲得可評(píng)述本申請創(chuàng)造性的兩篇對比文件CN107729542A、CN106997374A,整個(gè)檢索過程不需要對“預(yù)測優(yōu)先級(jí)”和“預(yù)設(shè)優(yōu)先級(jí)”進(jìn)行擴(kuò)展,檢索過程簡單高效。

2.2 改寫發(fā)明構(gòu)思進(jìn)行語義檢索

智能化檢索系統(tǒng)在使用申請?zhí)栠M(jìn)行純語義檢索時(shí),系統(tǒng)基于申請文件的全文進(jìn)行語義匹配,語義排序的結(jié)果取決于提取的關(guān)鍵詞的質(zhì)量,如果關(guān)鍵技術(shù)手段的描述重點(diǎn)和篇幅不夠突出時(shí),語義排序的結(jié)果可能受到方案中其他不是關(guān)鍵技術(shù)手段的技術(shù)特征的影響,導(dǎo)致檢索結(jié)果不佳。智能化檢索系統(tǒng)在進(jìn)行語義檢索時(shí),除了可以使用申請?zhí)栕鳛檎Z義排序基準(zhǔn),還可以使用文本作為語義排序基準(zhǔn),通過改寫發(fā)明構(gòu)思作為語義檢索的基礎(chǔ),排除其他無關(guān)技術(shù)特征的影響。

案例二。本案例涉及一種信息推薦方法。其特征在于,包括:接收到針對信息項(xiàng)集合的推薦指令;響應(yīng)于所述推薦指令,從所述信息項(xiàng)集合包含的多個(gè)信息項(xiàng)中篩選出至少兩個(gè)信息項(xiàng),其中,所述推薦指令中未對所述至少兩個(gè)信息項(xiàng)進(jìn)行指定;對所述至少兩個(gè)信息項(xiàng)進(jìn)行對比,得到對比信息;將所述對比信息和所述至少兩個(gè)信息項(xiàng)作為推薦結(jié)果進(jìn)行展示。

本案針對現(xiàn)有在進(jìn)行推薦結(jié)果顯示時(shí),需要用戶分別點(diǎn)擊查看多個(gè)列表項(xiàng)的具體內(nèi)容進(jìn)行查看來選擇最終的推薦信息,該過程耗費(fèi)用戶大量精力且效率較低,因而本申請?zhí)岢鐾ㄟ^點(diǎn)擊預(yù)定按鈕等簡單操作下達(dá)針對列表的推薦指令,自動(dòng)為用戶篩選出兩個(gè)列表項(xiàng)進(jìn)行對比得到對比信息,再將至少兩個(gè)列表項(xiàng)和對比信息作為推薦結(jié)果展示給用戶以減少用戶選擇的精力和提高效率。通過上述對技術(shù)方案的理解,可以確定其關(guān)鍵技術(shù)手段為篩選推薦結(jié)果進(jìn)行比較得到比較信息進(jìn)行顯示。

本案的檢索難點(diǎn)在于:描述本申請關(guān)鍵技術(shù)手段篩選、信息項(xiàng)、對比的表達(dá)方式太多且不準(zhǔn)確,在進(jìn)行檢索時(shí)擴(kuò)展的關(guān)鍵詞難以做到全面,并且涉及推薦的分類號(hào)有多個(gè),例如G06F17/30、G06Q30的下位點(diǎn)組等,可預(yù)估若使用關(guān)鍵詞和分類號(hào)進(jìn)行檢索,檢索噪聲將會(huì)比較大,很難獲得合適的對比文件。

利用智能化檢索系統(tǒng)對本案進(jìn)行檢索的過程如下。

第一步:進(jìn)行純語義檢索,檢索結(jié)果默認(rèn)設(shè)置為400篇,考慮到本案申請日為2016年,申請時(shí)間較早且在其后推薦類相關(guān)申請數(shù)量較大,因而采用申請日限定進(jìn)行初步語義檢索。通過閱讀前40條檢索結(jié)果均為對推薦信息顯示的技術(shù)方案,均沒有公開本申請中的選擇信息項(xiàng)進(jìn)行對比。

第二步:為了提高命中效率,使用“對比”的同義詞“對比、比較、相比”進(jìn)行人工干預(yù),獲得82條檢索結(jié)果,然而也并未獲得本申請中選擇信息項(xiàng)進(jìn)行對比的對比文件。

第三步:對檢索結(jié)果進(jìn)行分析并調(diào)整檢索思路,未檢索到可用對比文件的原因一方面可能是本申請技術(shù)方案在描述時(shí)由于涉及推薦信息篩選顯示,而只要是與推薦信息相關(guān)的案件,大多都會(huì)有篩選推薦信息進(jìn)行顯示的過程,即使使用“對比、比較、相比”進(jìn)行布爾篩選,由于上述詞語在專利文件中普遍存在,因而也無法在眾多對比文件中篩選出可用對比文件;另一方面考慮在進(jìn)行語義檢索時(shí),是否能準(zhǔn)確表達(dá)關(guān)鍵技術(shù)手段十分關(guān)鍵,由于中文語法表達(dá)的多樣化以及一詞多義性,直接基于申請文件中的表達(dá)方式進(jìn)行機(jī)器檢索,使得語義檢索不能很好地對關(guān)鍵技術(shù)手段進(jìn)行有效的檢索,導(dǎo)致檢索結(jié)果不理想。此時(shí),可以對技術(shù)方案進(jìn)行重新表達(dá),使得技術(shù)方案的表達(dá)方式更容易讓機(jī)器理解;針對本案,將其方案表達(dá)為:自動(dòng)為用戶篩選出兩個(gè)結(jié)果,以及對至少兩個(gè)結(jié)果進(jìn)行對比,得到對比信息,再將所述至少兩個(gè)結(jié)果和對比信息作為推薦結(jié)果展示給用戶;檢索獲得兩篇對比文件CN105469274A、CN104699843A,均公開了本申請中從推薦結(jié)果中選擇至少兩個(gè)信息項(xiàng)進(jìn)行比較獲得比較結(jié)果并顯示。

2.3 中文外文庫聯(lián)合檢索

S檢索系統(tǒng)在外文庫進(jìn)行檢索時(shí),需要將中文關(guān)鍵詞翻譯為英文關(guān)鍵詞,由于語言文化的不同,經(jīng)常出現(xiàn)英文關(guān)鍵詞表達(dá)不準(zhǔn)確、英文文獻(xiàn)閱讀困難等問題;智能化檢索系統(tǒng)對專利文獻(xiàn)數(shù)據(jù)進(jìn)行了整合,將外文專利翻譯為中文,使得審查員在檢索時(shí)可以跨越語言障礙,提高外文文件檢出率。并且,智能化檢索系統(tǒng)支持同時(shí)檢索多個(gè)數(shù)據(jù)庫,減少跨庫操作。

案例三。本案例涉及一種指紋識(shí)別的方法,其特征在于,包括:獲取目標(biāo)按壓指紋傳感器的指紋圖像;對所述指紋圖像進(jìn)行處理,得到所述指紋圖像的梯度信息;根據(jù)所述指紋圖像的梯度信息,確定所述目標(biāo)是否為真實(shí)手指。

本案針對現(xiàn)有技術(shù)區(qū)分真假指紋的方法是在指紋傳感器外增加額外傳感器的缺陷,提出一種能夠不增加額外傳感器的情況下,根據(jù)指紋圖像的梯度信息,確定按壓指紋傳感器的手指是否為真實(shí)手指的方法,具體方案如權(quán)利要求1所記載的部分。提煉本案關(guān)鍵為通過指紋圖像的梯度信息判斷手指是否為真實(shí)手指,關(guān)鍵詞為“指紋、圖像、梯度、手指、梯度、真實(shí)”。

本案的檢索難點(diǎn)在于:本案涉及的是指紋識(shí)別方法,中文和外文庫均可能存在對比文件,而關(guān)于指紋識(shí)別的外文文獻(xiàn)數(shù)據(jù)量大,且“真實(shí)”屬于功能性限定,關(guān)鍵詞難以擴(kuò)展,且外文文獻(xiàn)量大時(shí)瀏覽效率較低。

利用智能化檢索系統(tǒng)對本案進(jìn)行檢索,步驟如下。

第一步:選取CNTXT和USTXTC兩個(gè)數(shù)據(jù)庫,使用“梯度S(指紋or手指)S(真or假)”進(jìn)行布爾檢索,檢索到較多計(jì)算計(jì)算指紋梯度的方案。第二步:為了提高命中效率,即獲得計(jì)算手指梯度信息是用于判斷目標(biāo)手指是真實(shí)手指,使用權(quán)利要求1的技術(shù)方案作為語義排序基準(zhǔn)進(jìn)行排序,檢索獲得X對比文件US2018129857A。

3 結(jié)論

本研究通過三個(gè)案例的檢索過程,闡述了在檢索過程中如何利用智能檢索系統(tǒng)提高檢索效能。在利用智能檢索系統(tǒng)進(jìn)行檢索時(shí),需要審查員充分利用其純語義檢索、先語義檢索后布爾篩選、先布爾篩選后語義排序、語義改寫等功能,并基于檢索結(jié)果調(diào)整檢索策略。檢索工具并非萬能的,檢索能力的提高過程也并非一蹴而就,審查員需要針對各個(gè)領(lǐng)域的案件特點(diǎn)充分利用智能檢索系統(tǒng)提供的各項(xiàng)功能,不斷積累檢索經(jīng)驗(yàn)和技巧,進(jìn)一步提高檢索效能。

猜你喜歡
檢索系統(tǒng)排序預(yù)設(shè)
排序不等式
恐怖排序
節(jié)日排序
收錄《信號(hào)處理》的檢索系統(tǒng)及數(shù)據(jù)庫
收錄《信號(hào)處理》的檢索系統(tǒng)及數(shù)據(jù)庫
本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
問題是預(yù)設(shè)與生成間的橋
論幽默語境中的預(yù)設(shè)觸發(fā)語
德江县| 英吉沙县| 嘉禾县| 蓝田县| 澳门| 安阳县| 炎陵县| 锦州市| 娱乐| 巴东县| 沈阳市| 日照市| 黄平县| 滦南县| 嘉定区| 曲阜市| 临夏市| 河津市| 平谷区| 万荣县| 襄城县| 广昌县| 大厂| 绵竹市| 太康县| 莱西市| 蚌埠市| 石家庄市| 榆林市| 汨罗市| 南平市| 固原市| 东阿县| 平定县| 潢川县| 黄陵县| 金乡县| 都匀市| 安多县| 沾益县| 登封市|