国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型研究

2024-10-29 00:00:00陳隆葵
圖書(shū)館學(xué)刊 2024年9期

[摘 要]在對(duì)表示學(xué)習(xí)、圖書(shū)館專(zhuān)利信息、圖書(shū)館專(zhuān)利信息語(yǔ)義融合、基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合相關(guān)研究進(jìn)行概述的基礎(chǔ)上,分析表示學(xué)習(xí)在圖書(shū)館專(zhuān)利信息語(yǔ)義融合中的優(yōu)勢(shì),通過(guò)對(duì)圖書(shū)館專(zhuān)利信息語(yǔ)義實(shí)體描述,從專(zhuān)利實(shí)體類(lèi)、機(jī)構(gòu)類(lèi)、人員類(lèi)、事件類(lèi)、內(nèi)容類(lèi)及各類(lèi)的核心屬性5個(gè)維度構(gòu)建了基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型,旨在促進(jìn)圖書(shū)館為用戶提供專(zhuān)業(yè)的專(zhuān)利信息語(yǔ)義檢索服務(wù)。

[關(guān)鍵詞]表示學(xué)習(xí) 圖書(shū)館專(zhuān)利信息 語(yǔ)義融合模型

[分類(lèi)號(hào)]G205

表示學(xué)習(xí)(Representation learning)是人工智能學(xué)科與圖情專(zhuān)業(yè)研究的新熱點(diǎn),作為圖情信息數(shù)據(jù)實(shí)現(xiàn)語(yǔ)義檢索和智慧學(xué)習(xí)的新技術(shù)、新方法,其主要功能是將復(fù)雜信息數(shù)據(jù)中的語(yǔ)義實(shí)體、核心屬性與關(guān)系表示到低維向量空間,通過(guò)向量空間的語(yǔ)義測(cè)量工具測(cè)試語(yǔ)義實(shí)體間的距離,由智能系統(tǒng)學(xué)習(xí)語(yǔ)義實(shí)體的分布式表示狀態(tài),從而實(shí)現(xiàn)知識(shí)數(shù)據(jù)的深層次關(guān)聯(lián)和序列化表示,并借助語(yǔ)義結(jié)構(gòu)可視化圖譜進(jìn)行可視化顯示,進(jìn)而為用戶提供專(zhuān)業(yè)的智慧語(yǔ)義檢索服務(wù)。美國(guó)科學(xué)數(shù)據(jù)研究中心(Center for Scientific Data Research of America,CSDRA)是國(guó)外較早開(kāi)展表示學(xué)習(xí)的科學(xué)專(zhuān)利數(shù)據(jù)語(yǔ)義融合機(jī)構(gòu),在實(shí)現(xiàn)跨學(xué)科、跨機(jī)構(gòu)的科學(xué)專(zhuān)利數(shù)據(jù)語(yǔ)義融合中采用表示學(xué)習(xí)技術(shù)已取得初步成效[1]。而國(guó)內(nèi)圖書(shū)館專(zhuān)利信息語(yǔ)義融合領(lǐng)域?qū)Ρ硎緦W(xué)習(xí)的實(shí)踐應(yīng)用尚處于空白,針對(duì)基于表示學(xué)習(xí)的專(zhuān)利信息語(yǔ)義融合模型構(gòu)建更為少見(jiàn)。因此,筆者在剖析表示學(xué)習(xí)、圖書(shū)館專(zhuān)利信息及表示學(xué)習(xí)在圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型相關(guān)研究的基礎(chǔ)上,通過(guò)對(duì)圖書(shū)館專(zhuān)利信息進(jìn)行語(yǔ)義描述、構(gòu)建語(yǔ)義實(shí)體及核心屬性的方式設(shè)計(jì)了圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型,為圖書(shū)館提供專(zhuān)業(yè)專(zhuān)利信息語(yǔ)義檢索服務(wù)提供參考和借鑒。

1 相關(guān)研究概述

1.1 表示學(xué)習(xí)的內(nèi)涵

表示學(xué)習(xí)在人工智能領(lǐng)域也稱(chēng)為“學(xué)習(xí)表示”,主要被應(yīng)用在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域,“表示”是指通過(guò)模型參數(shù)、應(yīng)用何種形式、何種方式表示模型輸入的觀測(cè)樣本X[2]。表示學(xué)習(xí)是指智能系統(tǒng)或者學(xué)習(xí)模型對(duì)觀測(cè)樣本X的有效表示[3]。簡(jiǎn)單而言,表示學(xué)習(xí)是通過(guò)機(jī)器訓(xùn)練獲取深度學(xué)習(xí)特征的技術(shù)集合,是將多源異構(gòu)化數(shù)據(jù)轉(zhuǎn)變?yōu)槟鼙粰C(jī)器識(shí)別、獲取、使用和學(xué)習(xí)的結(jié)構(gòu)化數(shù)據(jù)的一種方式,賦予了智能系統(tǒng)“學(xué)習(xí)如何學(xué)習(xí)”的能力[4]。

1.2 圖書(shū)館專(zhuān)利信息內(nèi)涵及類(lèi)型

1.2.1 圖書(shū)館專(zhuān)利信息內(nèi)涵

圖書(shū)館專(zhuān)利信息是指圖書(shū)館以專(zhuān)利產(chǎn)權(quán)信息、專(zhuān)利資源信息、專(zhuān)利知識(shí)成果、專(zhuān)利文獻(xiàn)為基礎(chǔ),通過(guò)分解、加工、整合、標(biāo)引、統(tǒng)計(jì)、分析、轉(zhuǎn)化等一系列信息處理手段,并綜合應(yīng)用多種信息處理方式構(gòu)建形成與專(zhuān)利技術(shù)、專(zhuān)利文獻(xiàn)及專(zhuān)利知識(shí)成果有關(guān)的各種信息集合[5]。圖書(shū)館面向用戶提供專(zhuān)利信息服務(wù),包括專(zhuān)利查新、專(zhuān)利檢索、專(zhuān)利信息使用現(xiàn)狀分析、專(zhuān)利資源分布統(tǒng)計(jì)、專(zhuān)項(xiàng)知識(shí)產(chǎn)權(quán)分析、企業(yè)專(zhuān)利應(yīng)用現(xiàn)狀分析、特殊技術(shù)領(lǐng)域?qū)@治?、?zhuān)利技術(shù)成果分析與預(yù)警服務(wù)等[6]。

1.2.2 圖書(shū)館專(zhuān)利信息類(lèi)型

圖書(shū)館專(zhuān)利信息按照內(nèi)容、來(lái)源可以劃分為技術(shù)信息、法律信息、經(jīng)濟(jì)信息、著錄信息和戰(zhàn)略信息。(1)技術(shù)信息是指在實(shí)用新型專(zhuān)利、外觀設(shè)計(jì)專(zhuān)利、發(fā)明專(zhuān)利的專(zhuān)利說(shuō)明書(shū)、權(quán)利要求書(shū)、圖表、摘要、介紹等專(zhuān)利文獻(xiàn)中闡述的與技術(shù)有關(guān)的信息,或是通過(guò)專(zhuān)利文獻(xiàn)檢索匯總形成專(zhuān)利報(bào)告及其他文獻(xiàn)提供與專(zhuān)利有關(guān)的技術(shù)信息。(2)法律信息是指在專(zhuān)利的權(quán)利要求書(shū)、專(zhuān)利公報(bào)及登記簿等專(zhuān)利文獻(xiàn)中記載的與權(quán)利保護(hù)及有效性相關(guān)的信息。(3)經(jīng)濟(jì)信息是指在專(zhuān)利文獻(xiàn)中記錄與行業(yè)、組織和政府經(jīng)濟(jì)活動(dòng)具有密切聯(lián)系的信息。(4)著錄信息是指和專(zhuān)利文獻(xiàn)中著錄項(xiàng)目高度關(guān)聯(lián)的信息,如專(zhuān)利權(quán)人信息、發(fā)明人信息、專(zhuān)利申請(qǐng)?zhí)?、?guó)別信息等。(5)戰(zhàn)略信息是指通過(guò)對(duì)上述技術(shù)信息、法律信息、經(jīng)濟(jì)信息、著錄信息進(jìn)行聚合、分析、加工形成的具有戰(zhàn)略特征的技術(shù)信息或經(jīng)濟(jì)信息。如通過(guò)對(duì)專(zhuān)利文獻(xiàn)信息整合加工形成的技術(shù)評(píng)估報(bào)告、戰(zhàn)略決策報(bào)告等。

1.3 圖書(shū)館專(zhuān)利信息語(yǔ)義融合相關(guān)研究

圖書(shū)館專(zhuān)利信息語(yǔ)義融合的相關(guān)研究源于1990年后人工智能領(lǐng)域自然語(yǔ)言處理技術(shù)的發(fā)展。隨著近年來(lái)科學(xué)數(shù)據(jù)開(kāi)放運(yùn)動(dòng)(Scientific data open movement)的發(fā)展,一些科技大國(guó)在圖書(shū)館專(zhuān)利信息語(yǔ)義描述、語(yǔ)義關(guān)聯(lián)等方面研究進(jìn)展加快,并涌現(xiàn)出一批有代表性的研究成果,主要集中在以下兩個(gè)方面。

(1)圖書(shū)館專(zhuān)利信息語(yǔ)義模型的研究?;谟脩魧?zhuān)利信息使用需求構(gòu)建實(shí)現(xiàn)精準(zhǔn)檢索、大數(shù)據(jù)分析和精準(zhǔn)推薦的專(zhuān)利信息語(yǔ)義融合模型是實(shí)現(xiàn)圖書(shū)館專(zhuān)利信息語(yǔ)義融合的基礎(chǔ)。國(guó)外相關(guān)研究成果主要借助專(zhuān)利信息元數(shù)據(jù)語(yǔ)義描述、本體構(gòu)建、RDF Schema集成模型等語(yǔ)義技術(shù),通過(guò)對(duì)圖書(shū)館專(zhuān)利信息對(duì)象的關(guān)系識(shí)別、關(guān)系屬性描述、情境關(guān)系抓取、關(guān)聯(lián)結(jié)構(gòu)密封[7],實(shí)現(xiàn)專(zhuān)利信息對(duì)象、關(guān)聯(lián)關(guān)系的語(yǔ)義表達(dá),為圖書(shū)館專(zhuān)利信息資源整合構(gòu)建RDA、BIB等語(yǔ)義模型。

(2)圖書(shū)館專(zhuān)利信息語(yǔ)義關(guān)系的發(fā)現(xiàn)研究。實(shí)現(xiàn)圖書(shū)館專(zhuān)利信息的語(yǔ)義描述,并借助語(yǔ)義描述挖掘?qū)@畔?duì)象的語(yǔ)義關(guān)聯(lián)聯(lián)系,構(gòu)建語(yǔ)義融合模型,實(shí)現(xiàn)專(zhuān)利信息語(yǔ)義關(guān)聯(lián)關(guān)系的發(fā)現(xiàn)與識(shí)別。當(dāng)前,西方學(xué)者關(guān)注圖書(shū)館專(zhuān)利語(yǔ)義關(guān)聯(lián)關(guān)系算法工具與發(fā)現(xiàn)工具的應(yīng)用,如美國(guó)專(zhuān)利事務(wù)局為加州大學(xué)圖書(shū)館設(shè)計(jì)了專(zhuān)利信息識(shí)別和發(fā)現(xiàn)語(yǔ)義相似度算法,能夠精準(zhǔn)識(shí)別圖書(shū)館專(zhuān)利信息中的潛在語(yǔ)義關(guān)聯(lián)關(guān)系[8]。同時(shí),歐洲“Patent data integration”項(xiàng)目對(duì)圖書(shū)館開(kāi)放的專(zhuān)利數(shù)據(jù)云設(shè)計(jì)了可供用戶直接使用的語(yǔ)義關(guān)聯(lián)工具,用于發(fā)現(xiàn)不同主題專(zhuān)利信息的語(yǔ)義關(guān)聯(lián)關(guān)系[9]。

1.4 基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合研究

從當(dāng)前學(xué)界的研究趨勢(shì)來(lái)看,借助知識(shí)抽取、數(shù)據(jù)挖掘、語(yǔ)義抽取技術(shù)促進(jìn)專(zhuān)利信息融合是圖書(shū)館專(zhuān)利信息服務(wù)發(fā)展進(jìn)程中要解決的核心問(wèn)題。圖書(shū)館促進(jìn)專(zhuān)利信息語(yǔ)義融合的根本目的是促進(jìn)不同類(lèi)型、學(xué)科、領(lǐng)域、行業(yè)的專(zhuān)利信息資源聚合成為主題專(zhuān)利信息資源集,便于用戶精準(zhǔn)檢索并通過(guò)檢索結(jié)果進(jìn)行知識(shí)發(fā)現(xiàn)和技術(shù)創(chuàng)新,進(jìn)而將圖書(shū)館專(zhuān)利信息的價(jià)值最大程度發(fā)揮出來(lái)[10]。翟東升等認(rèn)為,表示學(xué)習(xí)應(yīng)用到圖書(shū)館專(zhuān)利信息中是將專(zhuān)利信息的語(yǔ)義信息表示成低維連續(xù)的向量,兩個(gè)專(zhuān)利信息對(duì)象的空間距離越近則說(shuō)明其語(yǔ)義相似度越高[11]。楊宏章等將表示學(xué)習(xí)應(yīng)用到圖書(shū)館專(zhuān)利信息語(yǔ)義聚合過(guò)程中發(fā)現(xiàn),表示學(xué)習(xí)是將圖書(shū)館專(zhuān)利信息的實(shí)體和關(guān)系嵌入低維連續(xù)向量空間,并學(xué)習(xí)這些專(zhuān)利信息實(shí)體與關(guān)系的分布式表示[12]。周雷等認(rèn)為,表示學(xué)習(xí)應(yīng)用到圖書(shū)館專(zhuān)利信息語(yǔ)義融合過(guò)程不僅能清晰度量實(shí)體、表示實(shí)體、揭示實(shí)體與關(guān)系間的語(yǔ)義關(guān)聯(lián),還能促進(jìn)學(xué)習(xí)模型提高計(jì)算效率,促進(jìn)異構(gòu)化專(zhuān)利信息數(shù)據(jù)融合[13]。綜上來(lái)看,基于表示學(xué)習(xí)促進(jìn)圖書(shū)館專(zhuān)利信息語(yǔ)義融合已成為圖情界學(xué)者的共識(shí),并成為圖書(shū)館實(shí)現(xiàn)精準(zhǔn)化專(zhuān)利信息服務(wù)的重要前提,應(yīng)用表示學(xué)習(xí)技術(shù)構(gòu)建科學(xué)有效的專(zhuān)利信息語(yǔ)義融合模型能推動(dòng)專(zhuān)利信息智慧分析、深度挖掘、精準(zhǔn)檢索,為用戶的專(zhuān)利決策和技術(shù)創(chuàng)新提供支持。

2 表示學(xué)習(xí)在圖書(shū)館專(zhuān)利信息語(yǔ)義融合中的優(yōu)勢(shì)作用

表示學(xué)習(xí)作為語(yǔ)義信息較為有效的表示方式,將信息數(shù)據(jù)表示成兩個(gè)可直接使用與參考的低維向量,通過(guò)對(duì)兩個(gè)對(duì)象空間距離測(cè)量,測(cè)試其語(yǔ)義相似度。因此,表示學(xué)習(xí)借助其技術(shù)優(yōu)勢(shì)可以為圖書(shū)館實(shí)現(xiàn)專(zhuān)利信息語(yǔ)義融合提供保障。

2.1 為圖書(shū)館專(zhuān)利信息語(yǔ)義融合提供統(tǒng)一標(biāo)準(zhǔn)

表示學(xué)習(xí)為信息數(shù)據(jù)存儲(chǔ)、管理、組織與標(biāo)準(zhǔn)化處理提供了簡(jiǎn)單、標(biāo)準(zhǔn)的技術(shù)機(jī)制,通常借助實(shí)體(Entity)、關(guān)系(Relation)以及相關(guān)屬性信息結(jié)構(gòu)化的符號(hào)表示形式描述信息資源的概念及相互關(guān)系,由知識(shí)三元組(頭實(shí)體、關(guān)系、尾實(shí)體)進(jìn)行可視化表達(dá),并將實(shí)體和關(guān)系嵌入低維連續(xù)向量空間學(xué)習(xí)它們的分布表示[14]。表示學(xué)習(xí)的基礎(chǔ)結(jié)構(gòu)是知識(shí)圖譜,而知識(shí)圖譜具有的知識(shí)三元組為圖書(shū)館專(zhuān)利信息標(biāo)識(shí)提供了基本方法,采用統(tǒng)一的標(biāo)記結(jié)構(gòu)標(biāo)識(shí)專(zhuān)利信息,創(chuàng)建具有唯一標(biāo)識(shí)且不可更改的對(duì)象名稱(chēng);表示學(xué)習(xí)中對(duì)語(yǔ)義信息向低維向量的轉(zhuǎn)化為圖書(shū)館專(zhuān)利信息提供了統(tǒng)一的表示模型,可以使不同結(jié)構(gòu)、不同形式的專(zhuān)利信息在表示模型上具有一致性,借助算法工具學(xué)習(xí)它們的分布式表示形式,而無(wú)需考慮其表示形式的轉(zhuǎn)化。OWL是表示學(xué)習(xí)中常用的本體描述語(yǔ)言,可以準(zhǔn)確對(duì)專(zhuān)利信息的語(yǔ)義實(shí)體及關(guān)聯(lián)關(guān)系進(jìn)行描述;HTTP協(xié)議是表示學(xué)習(xí)應(yīng)用的統(tǒng)一存取機(jī)制,是專(zhuān)利信息實(shí)體和關(guān)系嵌入低維向量空間的分布式表示的統(tǒng)一接口[15],使所有的程序訪問(wèn)具有統(tǒng)一的標(biāo)準(zhǔn),實(shí)現(xiàn)圖書(shū)館專(zhuān)利信息更深層次的開(kāi)放獲取。用戶在進(jìn)行專(zhuān)利信息檢索過(guò)程中,HTTP協(xié)議提供了統(tǒng)一的標(biāo)準(zhǔn)化訪問(wèn)接口,用戶可直接通過(guò)SPARQL查詢專(zhuān)利信息。

2.2 促進(jìn)圖書(shū)館專(zhuān)利信息整體融合

基于表示學(xué)習(xí)的專(zhuān)利信息語(yǔ)義網(wǎng)絡(luò)可以將不同來(lái)源的專(zhuān)利信息及其相關(guān)數(shù)據(jù)進(jìn)行融合,能將多種結(jié)構(gòu)、類(lèi)型、形態(tài)的分散的專(zhuān)利信息源融合關(guān)聯(lián),為用戶提供該項(xiàng)專(zhuān)利所有相關(guān)數(shù)據(jù)的知識(shí)圖譜,允許用戶在不同類(lèi)型專(zhuān)利信息源檢索瀏覽,并提供不同主題的專(zhuān)利信息數(shù)據(jù)集供用戶參考與決策,降低了圖書(shū)館融合多源專(zhuān)利信息數(shù)據(jù)的復(fù)雜性。同時(shí),基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合不僅可以融合同一主題的專(zhuān)利信息,還能對(duì)不同學(xué)科、不同領(lǐng)域的專(zhuān)利信息建立關(guān)聯(lián)關(guān)系,使專(zhuān)利發(fā)明人、專(zhuān)利名稱(chēng)、技術(shù)領(lǐng)域、專(zhuān)利說(shuō)明、專(zhuān)利權(quán)類(lèi)型、授權(quán)號(hào)、專(zhuān)利發(fā)布時(shí)間、專(zhuān)利權(quán)利范圍、專(zhuān)利申請(qǐng)國(guó)等信息融合在一起,真正實(shí)現(xiàn)圖書(shū)館專(zhuān)利信息的整體融合。

2.3 實(shí)現(xiàn)圖書(shū)館專(zhuān)利信息語(yǔ)義服務(wù)

首先,表示學(xué)習(xí)可以為圖書(shū)館分布式、異構(gòu)化的專(zhuān)利信息提供語(yǔ)義融合的可視化圖譜,專(zhuān)利產(chǎn)權(quán)人發(fā)布的專(zhuān)利信息可以通過(guò)統(tǒng)一的端口發(fā)布,用戶可以借助統(tǒng)一的操作界面登錄檢索查詢[16]。同時(shí),用戶可通過(guò)語(yǔ)義檢索的方式獲取圖書(shū)館專(zhuān)利信息,清晰探察專(zhuān)利信息語(yǔ)義本體,更精準(zhǔn)掌握專(zhuān)利信息的關(guān)聯(lián)結(jié)構(gòu)。其次,圖書(shū)館應(yīng)用表示學(xué)習(xí)實(shí)現(xiàn)專(zhuān)利信息語(yǔ)義融合還能將專(zhuān)利信息通過(guò)語(yǔ)義瀏覽和語(yǔ)義推薦的方式直接呈現(xiàn)給用戶,并對(duì)重點(diǎn)內(nèi)容做出解釋?zhuān)奖阌脩衾斫狻T俅?,基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合還能使專(zhuān)利發(fā)布者進(jìn)行分布式的內(nèi)容創(chuàng)建,語(yǔ)義融合模型能高效搜集發(fā)布者創(chuàng)建的內(nèi)容,并進(jìn)行統(tǒng)一存儲(chǔ),借助知識(shí)圖譜呈現(xiàn)給用戶[17]。最后,圖書(shū)館基于表示學(xué)習(xí)的語(yǔ)義門(mén)戶網(wǎng)站可以為專(zhuān)利產(chǎn)權(quán)人提供專(zhuān)業(yè)、共享、低成本的發(fā)布渠道,并實(shí)現(xiàn)專(zhuān)利產(chǎn)權(quán)的快速認(rèn)證和共享。

3 基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型構(gòu)建

基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型重視將專(zhuān)利信息中的語(yǔ)義實(shí)體與關(guān)系表示成為低維連續(xù)向量,并對(duì)兩個(gè)鄰近對(duì)象的空間距離進(jìn)行測(cè)量,探察二者語(yǔ)義相似度,同時(shí)學(xué)習(xí)它們的分布式表示。圖書(shū)館專(zhuān)利信息涉及較多的語(yǔ)義本體,在描述專(zhuān)利信息時(shí)要建立本體間的關(guān)系,將這些關(guān)系精準(zhǔn)描述并嵌入低維向量空間,構(gòu)建一個(gè)完整反映專(zhuān)利信息特征的語(yǔ)義融合模型,從而形成更完整的語(yǔ)義融合系統(tǒng)。

在語(yǔ)義融合模型構(gòu)建中,可能用到的詞匯表如表1所示,其中P-information(the Patent Information)是自定義詞匯表,用來(lái)擴(kuò)展現(xiàn)有詞匯表與本體無(wú)法滿足的圖書(shū)館專(zhuān)利信息詞匯。

將圖書(shū)館專(zhuān)利信息劃分為專(zhuān)利實(shí)體類(lèi)(cr:Patent)、機(jī)構(gòu)類(lèi)(foaf:Organization)、人員類(lèi)(foaf:Person)、事件類(lèi)(event:Event)和內(nèi)容類(lèi)(pi:Patent content)。根據(jù)圖書(shū)館專(zhuān)利信息類(lèi)別的不同,通過(guò)構(gòu)建圖書(shū)館各類(lèi)專(zhuān)利信息的屬性對(duì)應(yīng),最大程度應(yīng)用詞匯表中的詞匯與本體,從而構(gòu)建圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型。

(1)專(zhuān)利實(shí)體類(lèi)及核心屬性

專(zhuān)利實(shí)體是圖書(shū)館專(zhuān)利信息的基本構(gòu)成內(nèi)容,也是對(duì)專(zhuān)利實(shí)體特征的描述,可以建立與其他類(lèi)的關(guān)聯(lián)關(guān)系。專(zhuān)利實(shí)體類(lèi)的主要屬性包括專(zhuān)利名稱(chēng)、專(zhuān)利權(quán)人、技術(shù)領(lǐng)域、發(fā)明內(nèi)容、專(zhuān)利權(quán)類(lèi)型、授權(quán)號(hào)、發(fā)布時(shí)間、專(zhuān)利申請(qǐng)國(guó)、專(zhuān)利說(shuō)明9個(gè)核心屬性,如表2所示。

(2)機(jī)構(gòu)類(lèi)及核心屬性

我國(guó)專(zhuān)利機(jī)構(gòu)按照性質(zhì)和類(lèi)別的不同,主要分為專(zhuān)利代理機(jī)構(gòu)、科研院所機(jī)構(gòu)、科技成果轉(zhuǎn)化機(jī)構(gòu)、科技企業(yè)等。根據(jù)專(zhuān)利來(lái)源機(jī)構(gòu)名錄編制細(xì)則,專(zhuān)利機(jī)構(gòu)的核心屬性包括機(jī)構(gòu)名稱(chēng)、機(jī)構(gòu)類(lèi)型、地址、郵編、電話、網(wǎng)站、主要負(fù)責(zé)人7個(gè)核心屬性,如表3所示。

(3)人員類(lèi)及核心屬性

專(zhuān)利領(lǐng)域相關(guān)人員分為3類(lèi):一是專(zhuān)利發(fā)明者和相關(guān)專(zhuān)利權(quán)人、繼承者等;二是專(zhuān)利的研究人員、科研學(xué)者和技術(shù)專(zhuān)家;三是圖書(shū)館等信息機(jī)構(gòu)從事專(zhuān)利信息領(lǐng)域的工作人員。這些與圖書(shū)館專(zhuān)利信息相關(guān)的人員包括姓名、性別、出生日期、工作單位、專(zhuān)利研究類(lèi)型、籍貫、個(gè)人介紹、職稱(chēng)8個(gè)核心屬性,如表4所示。

(4)事件類(lèi)及核心屬性

事件類(lèi)是指與專(zhuān)利相關(guān)事件及專(zhuān)利使用等各種活動(dòng)具有密切關(guān)聯(lián)的事件,包括事件產(chǎn)生地點(diǎn)、事件發(fā)生時(shí)間、事件主題、事件描述、子事件、事件人物6個(gè)核心屬性,如表5所示。在圖書(shū)館專(zhuān)利信息語(yǔ)義融合中可以使用event表示事件及相關(guān)屬性,表示為event:Event類(lèi)。

(5)內(nèi)容類(lèi)及其核心屬性

圖書(shū)館專(zhuān)利信息內(nèi)容主要由技術(shù)信息、法律信息、經(jīng)濟(jì)信息、著錄信息、戰(zhàn)略信息組成,并且每種專(zhuān)利信息包括文本說(shuō)明、演示圖片、展示視頻、數(shù)字模型和音頻資料等。因此,每類(lèi)專(zhuān)利信息內(nèi)容的核心屬性類(lèi)型可以劃分為信息名稱(chēng)、信息類(lèi)型、存儲(chǔ)格式、表示內(nèi)容、發(fā)布時(shí)間、發(fā)明者、產(chǎn)權(quán)所屬人、保存機(jī)構(gòu)8個(gè)核心屬性,通過(guò)專(zhuān)利信息內(nèi)容屬性與專(zhuān)利實(shí)體進(jìn)行意義融合,如表6所示。

在對(duì)圖書(shū)館專(zhuān)利信息類(lèi)和核心屬性定義后,可以根據(jù)類(lèi)與核心屬性間的關(guān)聯(lián)關(guān)系建立語(yǔ)義融合模型??紤]到圖書(shū)館專(zhuān)利信息是由技術(shù)信息、經(jīng)濟(jì)信息、著錄信息、法律信息組成,則專(zhuān)利信息內(nèi)容類(lèi)還包括4個(gè)子類(lèi),分別是技術(shù)信息類(lèi)(pd:Patent" Technology)、經(jīng)濟(jì)信息類(lèi)(pd:Patent Economy)、著錄信息類(lèi)(pd:Patent Record)、法律信息類(lèi)(pd:Patent law)。其中對(duì)象屬性swrc:affiliation和swrc:leader建立了機(jī)構(gòu)類(lèi)和人員類(lèi)的語(yǔ)義關(guān)聯(lián);實(shí)體屬性foaf:organization和dc:patent release建立了專(zhuān)利機(jī)構(gòu)和專(zhuān)利實(shí)體間的語(yǔ)義關(guān)聯(lián);實(shí)體屬性Pi:content建立了專(zhuān)利實(shí)體類(lèi)和專(zhuān)利內(nèi)容類(lèi)間的語(yǔ)義關(guān)聯(lián);核心屬性event:agent建立起事件類(lèi)、人員類(lèi)和機(jī)構(gòu)類(lèi)間的語(yǔ)義關(guān)聯(lián);屬性dc:creator建立起人員類(lèi)和專(zhuān)利實(shí)體類(lèi)間的語(yǔ)義關(guān)聯(lián)。類(lèi)間的語(yǔ)義關(guān)聯(lián)是建立圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型的基礎(chǔ)。本研究所涉及的5個(gè)實(shí)體類(lèi)可以通過(guò)Place地點(diǎn)本體、Time時(shí)間本體和Patent information信息集與這5類(lèi)之外的其他類(lèi)融合,通過(guò)核心屬性event:place和swrc:address和地點(diǎn)(Place)建立語(yǔ)義關(guān)聯(lián);通過(guò)dc:Patent type與Patent information信息集建立語(yǔ)義關(guān)聯(lián);通過(guò)屬性event:time、dc:time和foaf:birthday與時(shí)間Time進(jìn)行語(yǔ)義融合,形成更為豐富的語(yǔ)義融合模型,并將專(zhuān)利信息中的語(yǔ)義實(shí)體與關(guān)系映射到低維向量空間進(jìn)行表示,由語(yǔ)義測(cè)量工具測(cè)量實(shí)體間的距離,展示語(yǔ)義相似度。智能系統(tǒng)學(xué)習(xí)實(shí)體與關(guān)系的分布表示方式,形成專(zhuān)利信息語(yǔ)義檢索圖譜,為用戶提供專(zhuān)業(yè)的專(zhuān)利信息語(yǔ)義檢索服務(wù),如圖1所示。

4 結(jié)語(yǔ)

筆者立足國(guó)內(nèi)圖書(shū)館專(zhuān)利信息語(yǔ)義融合建設(shè)及檢索的現(xiàn)實(shí)需求,概述表示學(xué)習(xí)、圖書(shū)館專(zhuān)利信息類(lèi)型、圖書(shū)館專(zhuān)利信息語(yǔ)義融合、表示學(xué)習(xí)應(yīng)用于圖書(shū)館專(zhuān)利信息語(yǔ)義融合的相關(guān)研究,辨析表示學(xué)習(xí)應(yīng)用于圖書(shū)館專(zhuān)利信息語(yǔ)義融合的優(yōu)勢(shì)作用,通過(guò)對(duì)圖書(shū)館專(zhuān)利信息進(jìn)行語(yǔ)義描述、構(gòu)建語(yǔ)義實(shí)體、挖掘核心屬性的方法建立了基于表示學(xué)習(xí)的圖書(shū)館專(zhuān)利信息語(yǔ)義融合模型。在理論和技術(shù)層面初步實(shí)現(xiàn)了基于表示學(xué)習(xí)的較為完整的專(zhuān)利信息語(yǔ)義融合,為圖書(shū)館解決專(zhuān)利信息語(yǔ)義融合及檢索問(wèn)題,實(shí)現(xiàn)更便捷高效的專(zhuān)利信息語(yǔ)義檢索服務(wù)提供了思路。

參考文獻(xiàn):

[1] 王慧妍,于明鶴,于戈.基于深度學(xué)習(xí)的異質(zhì)信息網(wǎng)絡(luò)表示學(xué)習(xí)方法綜述[J].計(jì)算機(jī)科學(xué),2023(5):103-114.

[2] 李松,等.融合文本描述和層次類(lèi)型的知識(shí)表示學(xué)習(xí)方法[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2023(5):911-920.

[3] 李雅婷,等.面向視覺(jué)數(shù)據(jù)處理與分析的解耦表示學(xué)習(xí)綜述[J].中國(guó)圖象圖形學(xué)報(bào),2023(4):903-934.

[4] 李志飛,趙月,張龑.基于表示學(xué)習(xí)的知識(shí)圖譜推理研究綜述[J].計(jì)算機(jī)科學(xué),2023(3):94-113.

[5] 常改.“雙一流”高校圖書(shū)館專(zhuān)利信息服務(wù)現(xiàn)狀及對(duì)策[J].四川圖書(shū)館學(xué)報(bào),2022(5):79-83.

[6] 張更平,等.高校圖書(shū)館專(zhuān)利信息服務(wù)能力影響因素研究[J].圖書(shū)館學(xué)研究,2022(3):41-51.

[7] Yun S,et al.Technological trend mining: identifying new technology opportunities using patent semantic analysis[J]. Information Processing and Management,2022(4):102993.

[8] Zhipeng Q,Zheng W. Technology Forecasting Based on Semantic and Citation Analysis of Patents:A Case of Robotics Domain[J]. IEEE Transactions on Engineering Management,2022(4):1216-1236.

[9] Orions Digital Systems Inc. Patent Issued for Tagonomy-A System And Method Of Semantic Web Tagging (USPTO 10146865)[J]. Information Technology Newsweekly,2018.

[10] 藺艷艷.面向?qū)@畔⑻幚淼恼Z(yǔ)義分析方法研究[D].鎮(zhèn)江:江蘇科技大學(xué),2019.

[11] 翟東升,等.基于圖形數(shù)據(jù)庫(kù)的專(zhuān)利語(yǔ)義知識(shí)庫(kù)構(gòu)建技術(shù)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2016(12):66-75.

[12] 楊宏章,付靜.利用專(zhuān)利文本結(jié)構(gòu)化特征構(gòu)建專(zhuān)利信息智能語(yǔ)義檢索系統(tǒng)的方法[J].情報(bào)理論與實(shí)踐,2015(4):136-138,98.

[13] 周雷,李穎,石崇德.面向技術(shù)機(jī)會(huì)發(fā)現(xiàn)TOD的專(zhuān)利信息抽取——韓國(guó)科學(xué)技術(shù)信息研究院KISTI語(yǔ)義服務(wù)[J].情報(bào)工程,2015(2):31-37.

[14] 梁艷琪.基于關(guān)聯(lián)數(shù)據(jù)的文物數(shù)字資源語(yǔ)義融合與服務(wù)研究[D].武漢:華中師范大學(xué),2017.

[15] 王萍,黃新平.基于關(guān)聯(lián)開(kāi)放數(shù)據(jù)的數(shù)字文化資源語(yǔ)義融合方法研究——?dú)W洲數(shù)字圖書(shū)館案例分析[J].圖書(shū)情報(bào)工作,2016(12):29-37.

[16] 曹志鵬,潘定,潘啟亮.基于表示學(xué)習(xí)的雙層知識(shí)網(wǎng)絡(luò)鏈路預(yù)測(cè)[J].情報(bào)學(xué)報(bào),2021(2):135-144.

[17] 劉菁婕.基于表示學(xué)習(xí)的跨語(yǔ)言相關(guān)專(zhuān)利推薦研究[D].南京:南京理工大學(xué),2020.

陳隆葵 男,1973年生。本科學(xué)歷,副研究館員。研究方向:圖書(shū)館管理與服務(wù)。

(收稿日期:2023-06-26;責(zé)編:劉清揚(yáng)。)

修文县| 砀山县| 固原市| 中牟县| 马龙县| 年辖:市辖区| 西安市| 蚌埠市| 阜康市| 海盐县| 祁东县| 崇文区| 西安市| 景泰县| 长岛县| 石台县| 高安市| 潜江市| 万源市| 武胜县| 遂川县| 永嘉县| 昌乐县| 屯门区| 上思县| 芮城县| 德令哈市| 安岳县| 阜城县| 茶陵县| 喀喇沁旗| 南投县| 公主岭市| 夏河县| 焦作市| 股票| 即墨市| 上思县| 辉县市| 凌源市| 英吉沙县|