陳云華
(國家知識產權局專利審查協(xié)作北京中心,北京 100190)
利用互聯(lián)網資源對生物交叉領域進行圖文檢索研究
陳云華
(國家知識產權局專利審查協(xié)作北京中心,北京 100190)
文章以生物交叉領域(C12M)的領域特點為切入點,總結了該領域的檢索、瀏覽的難點,結合三個具體的案例,描述了三個圖文檢索資源的特點、檢索和瀏覽方法以及它們的優(yōu)缺點,并且探討了將圖文檢索的方法從生物交叉領域擴展到其他涉及裝置的領域進行檢索的可行性。
C12M裝置;圖文檢索;生物交叉領域;互聯(lián)網資源;生物裝置
生物交叉領域是一個特殊的小類,是生物與機械、光電、電學等交叉領域領,主要涉及生物裝置,與生物相關的裝置基本都會劃分到該分類號下,如光反應器、微流控芯片、發(fā)酵裝置、其他如細胞分離裝置、細胞電刺激器、培養(yǎng)皿等,可以看出該分類號下裝置所涉及的裝置類型很多、很雜,裝置無論從結構上還是領域上跨度均很大,分類號不好用,關鍵詞不易提取,也無專門數據庫可供檢索,因而檢索起來一直很困難。而現(xiàn)有對裝置的檢索主要是基于S系統(tǒng)的專利數據庫,然而僅依靠S系統(tǒng)是不夠的,如對于微流控芯片,很多研究者通常都是發(fā)表論文,并不申請專利,由于論文標題和摘要通常都是對方法的描述,裝置名稱或結構一般不會出現(xiàn)在標題和摘要中,因此檢索、瀏覽結果都很麻煩。此外,雖然已有檢索人員利用CPC分類號對本領域進行檢索,然而由于本領域中新的專利申請的CPC分類并沒有全面覆蓋,中文專利庫中過檔文獻的CPC分類也沒有全部完成,因而利用CPC分類進行檢索時提取CPC分類號也并不是那么順利。本文將討論如何充分利用互聯(lián)網檢索資源快速、有效地檢索以及直觀、高效地進行結果瀏覽。
Patentics智能化專利搜搜和分析系統(tǒng)(以下稱“Patentics”)通過智能語義搜索,將檢索結果通過相關度排序呈現(xiàn)給檢索者。輸入檢索條件后,系統(tǒng)會自動抽取語義,只要涵義相同的專利就會自動圖文并茂地呈現(xiàn)給檢索者,而不必考慮文本中是否包含了該檢索詞,同時Patentics也提供傳統(tǒng)的布爾檢索、通配符、位置算符和截詞符檢索。由此可以看出,對于生物裝置領域關鍵詞難以提取、難以表達的問題,Patentics自動提取語義的功能避免了人工提取關鍵詞帶來的漏檢;生物裝置一般通過以部件和部件間的連接關系所體現(xiàn)的,而Patentics的語義檢索時由于各詞條之間具有詞義上的關系,一定程度上可以體現(xiàn)人工難以表達的連接關系;再者,其圖文檢索界面可以便于檢索者更直觀地看到裝置的結構和連接關系。
案例1:CN201410300855.6。
權利要求1:一種血液單核細胞分離的輔助部件,其特征在于,是一個起到半隔離作用,用于對加液進行速度限制,防止滴加液體時速度過快的緩沖塊,該緩沖塊由圓柱形緩沖底座,圓錐形操作結構及無菌吊繩孔組成,其中圓柱形緩沖底座、圓錐形操作結構為一個整體,所述圓柱形緩沖底座的直徑比離心管內壁直徑小1~3mm,保證血液能從圓柱形緩沖底座與離心管之間流到下面,圓錐形操作結構的母線與底面夾角為55°~65°,無菌吊繩孔上系一根用于移動緩沖塊的無菌吊繩;所述的緩沖塊和無菌吊繩的材料,是任何具有疏水性、無細胞毒性、密度小于淋巴細胞分離液、水及血液的材料。
圖1 案例1的附圖1和附圖4
可以看出權利要求1的結構較為簡單,雖然較長,但多是功能性的描述,檢索時關鍵詞難以描述,分類號C12M1/00檢索時并不好用,常規(guī)檢索時利用輔助部件、圓錐、緩沖、密度梯度、隔離、速度、沉降等關鍵詞進行檢索得不到理想的結果。
在Patentics圖文檢索界面(www.patentics.com/scn.htm)中輸入檢索條件“R/CN201410300855 AND DI/CN201410300855”,在中國申請庫中沒有得到理想的對比文件。接下來在美國申請和美國專利庫中檢索,檢索結果選擇每頁100條,在第2頁發(fā)現(xiàn)可用對比文件1 US2002/042335A1,可作為X類文件用來評述本申請的創(chuàng)造性,發(fā)現(xiàn)其IPC分類號為B04B11/00,也就是將其分入了離心機項下。同時從該對比文件1中提取到關鍵詞float??紤]到檢索結果較為靠后,上述檢索條件進一步與關鍵詞“float*”做“與”的檢索。檢索如圖2。瀏覽檢索結果后發(fā)現(xiàn),在結合關鍵詞float*進行檢索后,對比文件1的結果頁面的位置大大提前,已經位于第1頁。同時發(fā)現(xiàn)對比文件2 US2011266206A1,并提取到關鍵詞buoy,其與float均為“浮”的意思,也就是輔助部件起到分離血液單核細胞作用的原理。對比文件2的IPC分類號為B01D35/05,即被分入了過濾裝置項下。
圖2 案例1在Patentics美國申請和美國專利庫中檢索截圖
小結:由上述檢索過程可以發(fā)現(xiàn),之所以常規(guī)檢索時難以檢索得到對比文件1和對比文件2,首先在于本申請的結構過于簡單,難以用關鍵詞表述;分類號不準確,同樣作為分離血細胞用的輔助部件,對比文件1和對比文件2分別將其分離至離心機和過濾裝置項下;而Patentics對于裝置結構過于簡單,關鍵詞不好表述,分類號不太精確的案例具有較好的檢索效果。同時Patentics在結果瀏覽時可以同時瀏覽摘要及多篇附圖,便于檢索者更直觀地了解對比文件的裝置,同時Patentics對于檢索結果中的關鍵詞的高亮功能、圖片比對功能,摘要中譯英等功能均有助于檢索者的檢索和瀏覽。
GOOGLE包括作為綜合搜索引擎的網頁搜索(Google Web Search)以及專利搜索引擎(Google Patents)、學術搜索引擎(Google Scholar)、圖片搜索引擎(Google Images)等多個專門的搜索引擎。雖然前期筆者利用Google搜索取得了較好的檢索結果,然而在瀏覽檢索結果時卻需要點擊檢索標題鏈接后,將期刊打開或下載后才能看到裝置的圖片,瀏覽起來不便。而Google圖片庫之巨大其他搜索引擎很難與之相比,且在完成搜索后,點擊圖片即可查看原始網頁,便于檢索者下載期刊類對比文件。Google圖片搜索時可以進行相似搜索和關鍵詞搜索,前者通過將待檢索的圖片上傳后進行檢索,后者通過檢索者自己構建關鍵詞等檢索條件進行 檢索,以下也將通過案例2對關鍵詞搜索進行舉例說明。
案例2:CN201510281722.3。
權利要求1:基于腸細胞融合層用于監(jiān)測鈣轉運的微流體控制芯片,其特征是由兩個獨立的模制/微圖案化的PDMS層制成,稱為“頂”和“基底”兩層;這兩層夾著一個孔徑為0.4微米的聚對苯二甲酸乙酯PET膜,該芯片裝配在兩個聚甲基丙烯酸甲酯PMMA層之間,并用牢固的機械方式夾緊,以防止流體滲漏;聚甲基丙烯酸甲酯的嵌合還便于插入跨上皮電阻探針以及在芯片連接到外部流體裝置用于細胞的裝入和培養(yǎng)基的連續(xù)輸注。
圖3 案例2的附圖1
經過分析可以總結出相應的英文檢索關鍵詞為:ca(ca2+或calcium),transport,microfluidic。
為了更直觀地瀏覽檢索結果,選擇Google Images進行檢索,將檢索詞ca、transport以及microfluidic輸入檢索框后進行檢索,在檢索結果頁第一行圖片即可發(fā)現(xiàn)與本申請一模一樣的圖片,將鼠標放在圖片上,單擊左鍵,即可出現(xiàn)訪問網頁的選項,點擊后即可跳轉至下載頁面,即可獲得對比文件1:“Microfluidic chip for monitoring Ca2+transport through a confluent layer of intestinal cells”, C.Huang等,RSC Adv.,第4期,第52887-52891頁。其可作為X類文件用來評價本申請的新穎性。
圖4 案例2的GOOGLE圖片檢索結果頁面
小結:由上述檢索過程可以發(fā)現(xiàn),Google圖片基于其強大的搜索引擎以及巨大的圖片庫,在構建后檢索詞后通??梢钥焖俚拿袡z索結果,同時在瀏覽檢索結果時,相對于谷歌學術和谷歌網頁搜索更直觀。雖然目前國內使用Google類產品很不穩(wěn)定,搜索時較有難度,檢索者通常會使用其他搜索引擎替代谷歌圖片進行搜索,如必應圖片搜索、百度圖片搜索以及雅虎圖片搜索等,然而筆者經過檢索發(fā)現(xiàn),利用相同的檢索條件(ca、transport以及microfluidic)在上述三個圖片庫中進行檢索時,均無法獲得對比文件1。而且必應圖片搜索在瀏覽檢索結果時,也不能對原始網頁進行鏈接,因而即使檢索到了對比文件的圖片,在獲取對比文件的來源時仍然不是那么直接、順暢;百度圖片搜索在檢索到的圖片上進行鼠標懸停時仍可以進行“圖片搜索”,這種檢索模式有利于檢索者獲得與本申請相似的圖片時,直接進行相似檢索,省略了檢索者自己上傳圖片的步驟,用戶體驗非常人性化。
CNKI學術圖片庫中的圖片主要來源于中國學術期刊網絡出版總庫、中國優(yōu)秀碩士學位論文全文庫、中國博士學位論文全文庫、中國重要會議論文全文庫、中國工具書網絡出版總庫等,訪問網址為image.cnki.net,具有圖片搜索、相似搜索兩種方式,圖片搜索需要輸入檢索詞在主題中進行檢索,相似搜索需要上傳圖片進行檢索,并提供檢索結果與原圖的比對功能,獲得檢索結果后可通過查看圖片來源獲取對比文件。如袁麗利用CNKI學術圖片庫針對檢測分析領域的裝置進行檢索獲得了理想的檢索結果,說明CNKI學術圖片庫在檢索裝置、瀏覽檢索結果時具有優(yōu)勢,然而檢索者在利用其進行檢索時仍然需要注意其在檢索時的優(yōu)缺點,以下將通過案例3說明。
案例3:CN201310702873.2。
權利要求1:一種PCR儀溫度校準系統(tǒng),包括PCR儀裝置,其特征在于:還包括順序相連的感溫元件、數據采集卡電路、PC裝置。
圖5 案例3的附圖1
可以看出檢索結構非常簡單,總結出其檢索關鍵詞為:PCR,溫度校準。
圖6 案例3在CNKI圖片庫中的檢索結果
通過瀏覽檢索結果發(fā)現(xiàn),雖然檢索結果較少,但是檢索結果中的兩張圖均與本申請權利要求1相關。通過點擊圖片,獲得圖片來源為:“基因擴增儀(PCR儀)溫度校準裝置的研究,張麗萍,中國優(yōu)秀碩士學位論文全文數據庫基礎科技輯,第8期,2014年8月15日。”雖然其公開日在本申請的申請日之后,不能用來評價本申請的新穎性和創(chuàng)造性,但是通過閱讀該文獻的參考文獻部分,可發(fā)現(xiàn)多篇與PCR儀溫度校準相關的期刊和操作規(guī)范,其中參考文獻[5]“王宇松,張德偉.PCR溫度控制系統(tǒng)設計[J].生命科學儀器,2009,(8):89-90”可以作為X類文件用來評述本申請的創(chuàng)造性。
小結:通過以上檢索結果可知,CNKI圖片庫檢索較為簡單,瀏覽結果很直觀,然而檢索結果較少。如,利用相同的檢索條件(PCR,溫度校準)在CNKI數字出版物超市中,可直接檢索到對比文件1:“薛生虎,等.基于多傳感器融合技術的PCR儀溫度校準系統(tǒng)[J].儀器儀表學報,2011,32(6):1232-1237”以及上述張麗萍的碩士學位論文,其中對比文件1可作為X類文件評述本申請的新穎性。由此也可以看出,CNKI圖片庫所收錄的文獻來源遠遠小于CNKI數字出版物超市,然而鑒于其瀏覽結果的直觀性,可以作為初步檢索手段,在檢索結果不理想時進一步通過CNKI數字出版物超市進行檢索。
本文主要討論了利用Patentics的圖文界面檢索進行專利檢索以及Google圖片、CNKI對于外文、中文期刊圖片搜索。然而,可用于檢索的搜索引擎越來越多,比如微軟必應、百度、搜狗等,而不同的搜索引擎也各有其特點。目前來說,雖然Google檢索功能強大,但是國內環(huán)境使用起來很不穩(wěn)定,需要檢索人員選擇其他適合的搜索引擎。Bing與Google、百度同時作為三大綜合搜索引擎,與其他兩者主體功能上較為接近,然而Bing能檢索的語言比Google少,高級檢索時也不能進行時間的限定;百度搜索收錄的大部分是中文網頁,就中文網頁的收錄量而言,百度遠大于Google和Bing,同時百度百科可以幫助檢索人員快速了解現(xiàn)有技術,百度學術也同時鏈接了多種期刊數據庫,百度文庫則收錄了一些非期刊類,因此在檢索時應充分考慮這些資源,使檢索更全面。
在對于生物交叉領域進行檢索時,筆者首先考慮的是檢索要快捷、全面,結果瀏覽要直觀,文獻來源獲取要便捷,因而根據自身的領域特點選擇以上3種檢索手段進行互聯(lián)網圖文檢索。本文中主要討論了生物交叉領域裝置的圖文檢索方法,對于其他領域的裝置,如食品領域的食品加工器械、釀酒裝置,化工領域的化工裝置,雖然領域不同,然而裝置結構的表征多是通過部件的結構和部件間的連接關系,因而同樣可以借鑒本文的檢索方法以達到事半功倍的效果。
[1]吳漾,紀圓圓,朱曉樂,等.基于生物交叉領域初探CPC分類系統(tǒng)[J].中國發(fā)明與專利,2014,(12).
[2]魏強,王芳.遷徙染整設備專利申請?zhí)攸c及其檢索策略研究[J].廣東化工,2015,42(10).
[3]張占江,張建生,劉化然,等.提升檢索能力,促進專利質量提升[A].2014年中華全國代理人協(xié)會年會第五屆知識產權論壇論文集(第二部分)[C].2014.
[4]劉宏磊.飲料制備裝置領域CPC分類的應用[J].中國發(fā)明與專利,2015,(8).
[5]陳云華,李友,劉東吉.從審查角度看生物裝置領域的發(fā)明專利的檢索查新[A].2014年中華全國代理人協(xié)會年會第五屆知識產權論壇論文集(第三部分)[C].2014.
[6]袁麗,趙景煥,皇銳,等.檢測分析領域中非專利資源庫圖片檢索研究[J].河南科技,2016,(4).
[7]國家知識產權局專利審查協(xié)作中心.利用搜索引擎檢索現(xiàn)有技術[M].北京:知識產權出版社,2011.
(責任編輯:黃銀芳)
TP212
1009-2374(2017)07-0020-03
10.13535/j.cnki.11-4406/n.2017.07.009
陳云華(1985-),女,北京人,國家知識產權局專利審查協(xié)作北京中心研究實習員,碩士。
A