国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識(shí)圖譜的標(biāo)準(zhǔn)知識(shí)管理研究

2024-01-12 14:28:45楊德相李劍鋒
標(biāo)準(zhǔn)科學(xué) 2023年4期
關(guān)鍵詞:知識(shí)管理知識(shí)圖譜標(biāo)準(zhǔn)

楊德相 李劍鋒

摘 要:行業(yè)標(biāo)準(zhǔn)化體系構(gòu)建過程中,隨著標(biāo)準(zhǔn)的種類與數(shù)量不斷更新,人工加載以及查詢的方式已經(jīng)難以滿足標(biāo)準(zhǔn)查新跟進(jìn),知識(shí)服務(wù)手段較為單一。知識(shí)圖譜技術(shù)為整合標(biāo)準(zhǔn)知識(shí)提供了一種全新的知識(shí)互聯(lián)思路,為完善標(biāo)準(zhǔn)化建設(shè)路徑、標(biāo)準(zhǔn)文件結(jié)構(gòu)化查詢提供了全新的方向。本文分析了標(biāo)準(zhǔn)體系構(gòu)建現(xiàn)存的問題,以食品安全國(guó)家標(biāo)準(zhǔn)為例搭建了以食品產(chǎn)品標(biāo)準(zhǔn)為中心的標(biāo)準(zhǔn)引用知識(shí)圖譜,基于該圖譜展示了其可視化檢索、標(biāo)準(zhǔn)重要性等應(yīng)用,進(jìn)一步分析知識(shí)圖譜這一知識(shí)管理形式在標(biāo)準(zhǔn)體系建設(shè)上的優(yōu)勢(shì),促進(jìn)標(biāo)準(zhǔn)知識(shí)智能服務(wù)與發(fā)展。標(biāo)準(zhǔn)領(lǐng)域知識(shí)圖譜強(qiáng)調(diào)對(duì)標(biāo)準(zhǔn)知識(shí)管理,有效集成各類標(biāo)準(zhǔn)文本知識(shí)、梳理標(biāo)準(zhǔn)信息,同時(shí)結(jié)構(gòu)化知識(shí)有益于精確標(biāo)準(zhǔn)查詢和關(guān)聯(lián)標(biāo)準(zhǔn)挖掘從而助力推動(dòng)標(biāo)準(zhǔn)的數(shù)字化發(fā)展。

關(guān)鍵詞:標(biāo)準(zhǔn),知識(shí)圖譜,知識(shí)管理

DOI編碼:10.3969/j.issn.1674-5698.2023.04.005

1 引 言

標(biāo)準(zhǔn)是在一定范圍內(nèi)獲得最佳秩序,對(duì)活動(dòng)或其結(jié)果規(guī)定共同的和重復(fù)使用的規(guī)則、導(dǎo)則或特性的文件。起到規(guī)范和約束行為的功能,在推動(dòng)行業(yè)和社會(huì)穩(wěn)定發(fā)展向前方面有著不可或缺的作用。隨著信息技術(shù)、人工智能以及大數(shù)據(jù)技術(shù)的持續(xù)發(fā)展和不斷變革,新興技術(shù)賦能更豐富的新應(yīng)用使數(shù)據(jù)呈現(xiàn)規(guī)模式增長(zhǎng)[1]。新興行業(yè)、新興技術(shù)需要新標(biāo)準(zhǔn)規(guī)范約束,原標(biāo)準(zhǔn)也需要順應(yīng)發(fā)展技術(shù)等因素不斷更新完善,因而標(biāo)準(zhǔn)智能化知識(shí)管理更加需要與時(shí)俱進(jìn)跟上行業(yè)飛速發(fā)展的步伐。知識(shí)圖譜提供了一種全新的知識(shí)互聯(lián)思路,為整合標(biāo)準(zhǔn)體系與完善標(biāo)準(zhǔn)化建設(shè)提供實(shí)現(xiàn)標(biāo)準(zhǔn)聯(lián)結(jié)、梳理標(biāo)準(zhǔn)框架和標(biāo)準(zhǔn)動(dòng)態(tài)更新的新方向。

知識(shí)圖譜本質(zhì)上是一種語義網(wǎng)絡(luò)知識(shí)庫,旨在描述客觀世界的概念、實(shí)體、事件及其間的關(guān)系,提供了一種讓用戶快速獲取相關(guān)知識(shí)及其邏輯關(guān)系的渠道。其核心要義是以圖形方式向用戶返回經(jīng)過加工和推理的知識(shí),揭示實(shí)體之間關(guān)系的語義網(wǎng)絡(luò)[2]。知識(shí)圖譜分為未聚焦于特定領(lǐng)域的開放知識(shí)圖譜和聚焦特定領(lǐng)域的垂直領(lǐng)域知識(shí)圖譜,前者追求知識(shí)廣泛度,深度較淺,后者則主要面向?qū)I(yè)領(lǐng)域,追求知識(shí)深度與準(zhǔn)確度。在垂直領(lǐng)域知識(shí)圖譜的研究中,知識(shí)圖譜通過表示領(lǐng)域內(nèi)部的知識(shí)聯(lián)系用以輔助復(fù)雜的分析,在生物醫(yī)學(xué)領(lǐng)域的智能問診[3 - 4]與金融領(lǐng)域的風(fēng)險(xiǎn)評(píng)估[5]、防欺詐[6]以及電商領(lǐng)域[7 ]等有較多的研究發(fā)展。在數(shù)據(jù)時(shí)代,知識(shí)圖譜通過對(duì)數(shù)據(jù)的整合與規(guī)范,向人們提供有價(jià)值的結(jié)構(gòu)化信息,已被廣泛應(yīng)用于信息搜索、自動(dòng)問答、決策分析等領(lǐng)域,是推動(dòng)數(shù)據(jù)價(jià)值挖掘和支撐智能信息服務(wù)的重要基礎(chǔ)技術(shù)[8]。

隨著社會(huì)、行業(yè)的進(jìn)步與發(fā)展,標(biāo)準(zhǔn)體系在不斷壯大,各種數(shù)字共享標(biāo)準(zhǔn)平臺(tái)層出不窮,但是檢索方式本質(zhì)上仍是單條目人工檢索,最終呈現(xiàn)的是單一的標(biāo)準(zhǔn),缺少標(biāo)準(zhǔn)之間的關(guān)聯(lián)和分析。使用知識(shí)圖譜技術(shù)管理標(biāo)準(zhǔn)知識(shí),一方面可以整合標(biāo)準(zhǔn)知識(shí),對(duì)于指定的信息給予精確查詢和關(guān)聯(lián)標(biāo)準(zhǔn)的鏈接呈現(xiàn),提高檢索的準(zhǔn)確性和效率,另一方面知識(shí)圖譜將文檔層次的粗粒度知識(shí)拆分為細(xì)粒度的切片化知識(shí),更有益于針對(duì)行業(yè)標(biāo)準(zhǔn)體系的構(gòu)建與完善。以標(biāo)準(zhǔn)知識(shí)圖譜作為知識(shí)庫為智能查詢等提供業(yè)務(wù)支持,為標(biāo)準(zhǔn)起草人員分析標(biāo)準(zhǔn)信息、檢索標(biāo)準(zhǔn)關(guān)聯(lián)、排查標(biāo)準(zhǔn)的重復(fù)等漏洞問題,也給各行業(yè)相關(guān)企業(yè)提供標(biāo)準(zhǔn)研讀與制定的信息參考。

本文分析了標(biāo)準(zhǔn)知識(shí)管理存在的問題,提出構(gòu)建標(biāo)準(zhǔn)領(lǐng)域知識(shí)圖譜實(shí)現(xiàn)標(biāo)準(zhǔn)知識(shí)管理與智能應(yīng)用。在食品安全國(guó)家標(biāo)準(zhǔn)上進(jìn)行實(shí)證,構(gòu)建了基于食品產(chǎn)品標(biāo)準(zhǔn)知識(shí)圖譜,實(shí)現(xiàn)了知識(shí)查詢和關(guān)聯(lián)分析。證明了知識(shí)圖譜這一知識(shí)管理形式在促進(jìn)標(biāo)準(zhǔn)體系智能化建設(shè)與知識(shí)服務(wù)上的優(yōu)勢(shì)。

2 標(biāo)準(zhǔn)知識(shí)管理現(xiàn)狀

2.1 標(biāo)準(zhǔn)制定存在信息差異

標(biāo)準(zhǔn)本身的分類中,國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)涉及的標(biāo)準(zhǔn)制定方不同。我國(guó)標(biāo)準(zhǔn)化工作開展較晚,不同標(biāo)準(zhǔn)委員會(huì)的信息不完全共享等情況會(huì)導(dǎo)致對(duì)于標(biāo)準(zhǔn)術(shù)語的定義、量度等可能有所不同,進(jìn)而導(dǎo)致在進(jìn)行追責(zé)時(shí)出現(xiàn)負(fù)責(zé)部門權(quán)責(zé)模糊、推諉懶政的現(xiàn)象。以食品安全標(biāo)準(zhǔn)為例:肖有明等[11]提出食品安全標(biāo)準(zhǔn)因涉及制定部門較多而導(dǎo)致追責(zé)困難,于航宇等[10]指出食品安全標(biāo)準(zhǔn)中對(duì)于尚無權(quán)威定義的食品品類,后續(xù)的標(biāo)準(zhǔn)制定工作無法高效開展。標(biāo)準(zhǔn)制定中的信息差異阻礙了標(biāo)準(zhǔn)化進(jìn)程與發(fā)展,不利于標(biāo)準(zhǔn)的知識(shí)整合與管理應(yīng)用。

2.2 標(biāo)準(zhǔn)資源獲取效率低下

標(biāo)準(zhǔn)覆蓋范圍廣、分類依據(jù)多。每個(gè)行業(yè)中涉及的標(biāo)準(zhǔn)數(shù)量龐大,近幾年標(biāo)準(zhǔn)文本進(jìn)入數(shù)字化管理時(shí)代,市面上已有較成熟完備的標(biāo)準(zhǔn)文本數(shù)據(jù)平臺(tái),對(duì)標(biāo)準(zhǔn)進(jìn)行存儲(chǔ)并實(shí)現(xiàn)簡(jiǎn)單單條目的查詢和下載。但各級(jí)標(biāo)準(zhǔn)化管理部門在進(jìn)行標(biāo)準(zhǔn)化工作時(shí)通過該方式獲取的標(biāo)準(zhǔn)相對(duì)分散,企業(yè)實(shí)際獲取標(biāo)準(zhǔn)過程中往往需要多渠道多次獲取,費(fèi)時(shí)費(fèi)力。部分標(biāo)準(zhǔn)詞匯并不局限于某一行業(yè),因此當(dāng)使用標(biāo)準(zhǔn)中的詞匯查詢時(shí)無法避免其他無關(guān)行業(yè)對(duì)于標(biāo)準(zhǔn)查詢的干擾,人工檢索的效率較低。

2.3 標(biāo)準(zhǔn)知識(shí)管理智能化受限

當(dāng)前新興產(chǎn)業(yè)和新興技術(shù)發(fā)展迅速,對(duì)應(yīng)的各級(jí)各類標(biāo)準(zhǔn)更新與維護(hù)會(huì)愈發(fā)頻繁?,F(xiàn)實(shí)情況是標(biāo)準(zhǔn)的編制單位和各專業(yè)標(biāo)準(zhǔn)化技術(shù)委員會(huì)分布于多家企業(yè),受到管理的局限性,往往不能做到實(shí)時(shí)更新,標(biāo)準(zhǔn)的發(fā)布相對(duì)滯后[12]。在標(biāo)準(zhǔn)的更新過程中,靠人工篩查重復(fù)或沖突的標(biāo)準(zhǔn)效率低、準(zhǔn)確性也難以保證。并且在該過程中,標(biāo)準(zhǔn)制定部門主要采取的手段仍是人工上載,在數(shù)據(jù)信息爆炸增長(zhǎng)的時(shí)代,面對(duì)大量的標(biāo)準(zhǔn)維護(hù)工作,非智能的信息維護(hù)手段給標(biāo)準(zhǔn)化建設(shè)和標(biāo)準(zhǔn)體系的構(gòu)建造成了較大的阻力。

另一方面如今標(biāo)準(zhǔn)化行業(yè)發(fā)展呈現(xiàn)多行業(yè)、多維度的全新局面。由于各專業(yè)標(biāo)準(zhǔn)化技術(shù)委員會(huì)相對(duì)獨(dú)立,有的專業(yè)劃分界線并不十分明確,導(dǎo)致部分專業(yè)交叉、工作重復(fù)、標(biāo)準(zhǔn)多頭歸口、體系交叉重復(fù)、技術(shù)指標(biāo)不一致等問題依然存在[13]。現(xiàn)有標(biāo)準(zhǔn)數(shù)據(jù)共享平臺(tái)建設(shè)過程中,其主要查詢方式缺陷在于無法獲得標(biāo)準(zhǔn)與標(biāo)準(zhǔn)的關(guān)聯(lián),無法直接獲取關(guān)聯(lián)標(biāo)準(zhǔn)的相關(guān)信息。在標(biāo)準(zhǔn)體系中標(biāo)準(zhǔn)與標(biāo)準(zhǔn)之間并非獨(dú)立,其標(biāo)準(zhǔn)建立過程存在清晰的邏輯思路,標(biāo)準(zhǔn)文檔直接堆疊整理并不能體現(xiàn)出標(biāo)準(zhǔn)體系搭建過程中的整體邏輯,當(dāng)前我國(guó)標(biāo)準(zhǔn)知識(shí)管理智能化有待深化。

3 標(biāo)準(zhǔn)知識(shí)圖譜架構(gòu)

3.1 標(biāo)準(zhǔn)知識(shí)圖譜整體框架

通過標(biāo)準(zhǔn)知識(shí)圖譜實(shí)現(xiàn)標(biāo)準(zhǔn)文本知識(shí)管理,即按照一定的規(guī)則對(duì)標(biāo)準(zhǔn)進(jìn)行知識(shí)重組和知識(shí)管理,以圖數(shù)據(jù)庫形式對(duì)標(biāo)準(zhǔn)進(jìn)行結(jié)構(gòu)化的整合與可視呈現(xiàn),挖掘標(biāo)準(zhǔn)與標(biāo)準(zhǔn)之間的關(guān)聯(lián)性,以實(shí)現(xiàn)標(biāo)準(zhǔn)的深層次信息處理和挖掘。標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建流程如圖1所示,從原始數(shù)據(jù)層逐步深入,本體概念層涉及知識(shí)的規(guī)則制定,實(shí)體數(shù)據(jù)層包含知識(shí)深加工與知識(shí)動(dòng)態(tài)更新需求,最后以此作為知識(shí)庫實(shí)現(xiàn)各類與標(biāo)準(zhǔn)知識(shí)相關(guān)的智能應(yīng)用。

標(biāo)準(zhǔn)知識(shí)圖譜的架構(gòu)主要包括概念層與數(shù)據(jù)層兩部分。概念層存儲(chǔ)的是概念化的結(jié)構(gòu)知識(shí),又稱為本體,這一部分是知識(shí)圖譜的概念基礎(chǔ)框架,所有存儲(chǔ)的數(shù)據(jù)以該層面定義的知識(shí)結(jié)構(gòu)來存儲(chǔ)。數(shù)據(jù)層則是根據(jù)概念層規(guī)則,在原始數(shù)據(jù)中提煉出的知識(shí)。知識(shí)應(yīng)區(qū)別于原始文本,是對(duì)標(biāo)準(zhǔn)文本進(jìn)行拆分細(xì)化后形成的“碎化”信息。高質(zhì)量的數(shù)據(jù)知識(shí)對(duì)于標(biāo)準(zhǔn)知識(shí)圖譜以及后續(xù)的智能應(yīng)用效果至關(guān)重要,因此原始數(shù)據(jù)的知識(shí)抽取與加工轉(zhuǎn)換為結(jié)構(gòu)化的知識(shí)元是搭建標(biāo)準(zhǔn)知識(shí)圖譜的關(guān)鍵步驟。

3.2 本體概念層

概念層設(shè)計(jì)就是本體設(shè)計(jì),是對(duì)最終呈現(xiàn)知識(shí)結(jié)構(gòu)的整體把控。本體的構(gòu)建應(yīng)以具體的項(xiàng)目領(lǐng)域和任務(wù)作為起點(diǎn),以便于進(jìn)行本體功能的描述和知識(shí)的獲取。本體構(gòu)建技術(shù)分為人工[14]、自動(dòng)[15]和半自動(dòng)[16 -17]3類,在自動(dòng)構(gòu)建本體方面,目前還極少有方法能夠得到覆蓋率和準(zhǔn)確率都表現(xiàn)良好的本體,并且沒有專門針對(duì)中文文檔知識(shí)的成熟方法。大多構(gòu)建本體過程都需要人工參與,考慮到標(biāo)準(zhǔn)的結(jié)構(gòu)一致性等特征,采取人工構(gòu)建本體中的七步法[18]作為標(biāo)準(zhǔn)領(lǐng)域知識(shí)圖譜本體構(gòu)建的主要方法。七步法本體構(gòu)建方法的流程包括:確定標(biāo)準(zhǔn)本體構(gòu)建領(lǐng)域及范圍、獲取并分析領(lǐng)域信息、定義本體概念和概念層次、定義概念的屬性和屬性約束、本體更新評(píng)估、本體實(shí)例化、文檔化說明。該過程中充分結(jié)合標(biāo)準(zhǔn)起草人的起草邏輯等專家知識(shí),參照標(biāo)準(zhǔn)編寫規(guī)則,對(duì)標(biāo)準(zhǔn)的內(nèi)容結(jié)構(gòu)以及特點(diǎn)進(jìn)行分析,借助工具方法定義本體概念以及屬性約束,并對(duì)處理后的標(biāo)準(zhǔn)本體進(jìn)行文檔化說明。

標(biāo)準(zhǔn)按照要素的類型和位置共分為4類:資料性概述要素、資料性補(bǔ)充要素、規(guī)范性一般要素和規(guī)范性技術(shù)要素。資料性概述要素包括標(biāo)準(zhǔn)封面、目次、引言以及前言中的內(nèi)容;資料性補(bǔ)充要素包括標(biāo)準(zhǔn)資料性附錄、參考文獻(xiàn)以及索引中的內(nèi)容;規(guī)范性一般要素包括標(biāo)準(zhǔn)的名稱、范圍和規(guī)范性引用文件中的內(nèi)容;規(guī)范性技術(shù)要素包括術(shù)語和定義、符號(hào)、代號(hào)和縮略語以及規(guī)范性附錄等內(nèi)容。結(jié)合標(biāo)準(zhǔn)編排要求,標(biāo)準(zhǔn)的一般內(nèi)容組成如圖2所示。

參照標(biāo)準(zhǔn)的一般結(jié)構(gòu),標(biāo)準(zhǔn)實(shí)體的基本屬性來源于資料性概述要素、資料性補(bǔ)充要素,包含標(biāo)準(zhǔn)的類型、名稱、發(fā)行時(shí)間、起草單位等信息,可以以此直接定義其基本屬性概念。規(guī)范性一般要素和規(guī)范性技術(shù)要素中涉及與行業(yè)緊密相關(guān)的術(shù)語、適用范圍以及細(xì)化的行業(yè)技術(shù)要素,并不適合直接使用其屬性概念,故而參照同行業(yè)的標(biāo)準(zhǔn)文件中存在必要的共同元素,以共同元素作為參考進(jìn)行本體設(shè)計(jì)。比如:在食品安全標(biāo)準(zhǔn)中,技術(shù)內(nèi)容包含:理化指標(biāo)要求、污染物限量等共同要素,則“污染物限量”可以作為一個(gè)關(guān)系概念用以指向該標(biāo)準(zhǔn)與引用標(biāo)準(zhǔn)之間的關(guān)系屬性。標(biāo)準(zhǔn)文件的專業(yè)特性與已有編著邏輯性,決定了其本體建模主要結(jié)合專業(yè)性知識(shí),以語義判斷為根本原理施行[19]。

3.3 實(shí)體數(shù)據(jù)層

標(biāo)準(zhǔn)知識(shí)管理應(yīng)注重標(biāo)準(zhǔn)的知識(shí)完整性、準(zhǔn)確性,唐爽等[13]提出標(biāo)準(zhǔn)知識(shí)庫應(yīng)具有信息時(shí)效性,趙丹[20]構(gòu)建企業(yè)標(biāo)準(zhǔn)體系時(shí)強(qiáng)調(diào)系統(tǒng)需保證標(biāo)準(zhǔn)體系的動(dòng)態(tài)更新確保標(biāo)準(zhǔn)體系對(duì)于企業(yè)的準(zhǔn)確指導(dǎo),均強(qiáng)調(diào)了對(duì)于標(biāo)準(zhǔn)知識(shí)的完整性與準(zhǔn)確性要求。因此標(biāo)準(zhǔn)實(shí)體數(shù)據(jù)層的知識(shí)質(zhì)量也決定了標(biāo)準(zhǔn)知識(shí)圖譜的整體質(zhì)量以及采信度。標(biāo)準(zhǔn)實(shí)體數(shù)據(jù)層主要包括知識(shí)抽取、知識(shí)融合、知識(shí)存儲(chǔ)以及更新。其中知識(shí)抽取是將標(biāo)準(zhǔn)文本中的必要關(guān)鍵信息進(jìn)行格式轉(zhuǎn)換后結(jié)合自然語言處理技術(shù)得到實(shí)體、關(guān)系屬性等信息,初步獲得結(jié)構(gòu)化知識(shí)實(shí)現(xiàn)。從而實(shí)體間語義鏈接。知識(shí)融合需要對(duì)冗余的知識(shí)進(jìn)一步處理簡(jiǎn)化,對(duì)三元組在統(tǒng)一框架標(biāo)準(zhǔn)下進(jìn)行整合、消歧,簡(jiǎn)化知識(shí)體系,形成標(biāo)準(zhǔn)知識(shí)網(wǎng)絡(luò)。知識(shí)存儲(chǔ)環(huán)節(jié)采取開源Neo4j圖數(shù)據(jù)庫作為工具,導(dǎo)入精簡(jiǎn)化后的結(jié)構(gòu)化知識(shí),通過標(biāo)準(zhǔn)節(jié)點(diǎn)之間的引用關(guān)聯(lián)將標(biāo)準(zhǔn)知識(shí)組合成可以系統(tǒng)查詢與更新的知識(shí)網(wǎng)絡(luò)。

4 食品標(biāo)準(zhǔn)知識(shí)圖譜實(shí)證

4.1 食品標(biāo)準(zhǔn)知識(shí)圖譜構(gòu)建

食品安全標(biāo)準(zhǔn)是相關(guān)權(quán)威機(jī)構(gòu)依照程序制定的規(guī)范性文件,對(duì)推動(dòng)食品安全發(fā)展起到至關(guān)重要的作用。我國(guó)已有食品、食品添加劑、食品相關(guān)產(chǎn)品國(guó)家標(biāo)準(zhǔn)1,30 0 余項(xiàng),行業(yè)標(biāo)準(zhǔn)2,90 0 余項(xiàng),地方標(biāo)準(zhǔn)1,200余項(xiàng),形成了相對(duì)完善的食品標(biāo)準(zhǔn)體系。但是食品安全標(biāo)準(zhǔn)種類多、層次豐富,一定程度上給標(biāo)準(zhǔn)系統(tǒng)知識(shí)管理造成了一定的困難。其配套法規(guī)政策不足,制定范圍、定位不明確 ,內(nèi)容龐雜,并且相互引用形式多樣,在信息公開性上仍有欠缺,這些都對(duì)于消費(fèi)者合理維權(quán),企業(yè)有效生產(chǎn)經(jīng)營(yíng)產(chǎn)生不良影響。

食品安全標(biāo)準(zhǔn)是眾多的食品標(biāo)準(zhǔn)中唯一強(qiáng)制執(zhí)行的標(biāo)準(zhǔn),因此本文以現(xiàn)行食品安全國(guó)家標(biāo)準(zhǔn)作為研究對(duì)象。根據(jù)食品安全標(biāo)準(zhǔn)與監(jiān)測(cè)評(píng)估司發(fā)布的食品安全國(guó)家標(biāo)準(zhǔn)目錄顯示,食品安全國(guó)家標(biāo)準(zhǔn)分為通用標(biāo)準(zhǔn)、食品產(chǎn)品標(biāo)準(zhǔn)、特殊膳食食品標(biāo)準(zhǔn)、食品添加劑質(zhì)量規(guī)格及相關(guān)標(biāo)準(zhǔn)等共計(jì)12類。由于食品安全標(biāo)準(zhǔn)制定底層邏輯是圍繞食品的生產(chǎn)制造過程進(jìn)行的,故而選擇食品產(chǎn)品和特殊膳食食品標(biāo)準(zhǔn)共計(jì)8 0 份標(biāo)準(zhǔn)文件用作實(shí)證,以下將上述國(guó)家安全標(biāo)準(zhǔn)統(tǒng)稱為食品產(chǎn)品標(biāo)準(zhǔn)。

對(duì)食品產(chǎn)品文件分析,以標(biāo)準(zhǔn)作為實(shí)體,對(duì)其主要共有元素進(jìn)行分析設(shè)計(jì)本體。其封面中包含的標(biāo)準(zhǔn)名稱、編號(hào)以及發(fā)行時(shí)間作為標(biāo)準(zhǔn)的基礎(chǔ)屬性。以食品產(chǎn)品標(biāo)準(zhǔn)GB 5420為例,標(biāo)準(zhǔn)名稱為《干酪》,標(biāo)準(zhǔn)編號(hào)為GB 5420,發(fā)行時(shí)間為“2021”。食品產(chǎn)品標(biāo)準(zhǔn)的內(nèi)容屬性包括適用范圍、相關(guān)術(shù)語以及術(shù)語定義,位于文件正文部分“1 范圍”以及“2 術(shù)語和定義”。參照“3 技術(shù)要求”部分定義食品產(chǎn)品標(biāo)準(zhǔn)與其他標(biāo)準(zhǔn)的關(guān)系屬性,食品產(chǎn)品技術(shù)要求包含原料要求、感官要求、理化指標(biāo)、污染物限量和真菌毒素限量、微生物限量、食品添加劑和食品營(yíng)養(yǎng)強(qiáng)化劑,其中微生物限量常細(xì)分為致病菌限量和微生物限量。文件“4 其他”包含食品外包裝等其他相關(guān)要求,綜合上述內(nèi)容結(jié)合食品安全國(guó)家標(biāo)準(zhǔn)的12個(gè)大類別,定義食品產(chǎn)品標(biāo)準(zhǔn)同其他標(biāo)準(zhǔn)的關(guān)系屬性見表1,食品產(chǎn)品標(biāo)準(zhǔn)知識(shí)圖譜本體模型如圖3所示。根據(jù)本體設(shè)計(jì)邏輯,基于規(guī)則對(duì)標(biāo)準(zhǔn)原始數(shù)據(jù)的進(jìn)行知識(shí)抽取與加工,并將簡(jiǎn)化后的結(jié)構(gòu)化三元組進(jìn)行存儲(chǔ)。

4.2 食品產(chǎn)品標(biāo)準(zhǔn)知識(shí)圖譜可視化

食品產(chǎn)品知識(shí)圖譜可視化通過Neo4j圖數(shù)據(jù)庫實(shí)現(xiàn),Neo4j圖數(shù)據(jù)庫可以清晰地展示出節(jié)點(diǎn)之間的依賴關(guān)系以及顯性關(guān)系屬性。對(duì)食品產(chǎn)品標(biāo)準(zhǔn)以其本體模型進(jìn)行知識(shí)抽取與知識(shí)融合后,形成食品產(chǎn)品標(biāo)準(zhǔn)與其他食品安全標(biāo)準(zhǔn)的關(guān)聯(lián)數(shù)據(jù)資源導(dǎo)入圖數(shù)據(jù)庫中,實(shí)現(xiàn)食品產(chǎn)品標(biāo)準(zhǔn)資源的可視化存儲(chǔ)與訪問。通過py2neo工具包可通過Python應(yīng)用程序內(nèi)部和命令行直接使用Neo4j,實(shí)現(xiàn)批量結(jié)構(gòu)化知識(shí)導(dǎo)入。數(shù)據(jù)導(dǎo)入后在Neo4j圖數(shù)據(jù)庫中可使用Cypher查詢語言檢索食品產(chǎn)品標(biāo)準(zhǔn)知識(shí)圖譜中節(jié)點(diǎn)及其關(guān)聯(lián)關(guān)系,相關(guān)Cypher語句示例見表2。

圖譜示例如圖4所示,實(shí)體節(jié)點(diǎn)共計(jì)212個(gè),關(guān)系數(shù)量789。通過進(jìn)一步點(diǎn)擊訪問可以查詢各節(jié)點(diǎn)具體情況基本屬性以及關(guān)聯(lián)標(biāo)準(zhǔn)情況。

4.3 食品產(chǎn)品標(biāo)準(zhǔn)關(guān)聯(lián)查詢

食品產(chǎn)品標(biāo)準(zhǔn)知識(shí)圖譜的主要優(yōu)勢(shì)在于以知識(shí)網(wǎng)絡(luò)直觀呈現(xiàn)了食品產(chǎn)品標(biāo)準(zhǔn)與其他標(biāo)準(zhǔn)之間的引用關(guān)系,為標(biāo)準(zhǔn)的查找和分析提供便捷的知識(shí)管理可視化工具。標(biāo)準(zhǔn)關(guān)聯(lián)查詢的首要作用,對(duì)于食品生產(chǎn)過程中需要參照標(biāo)準(zhǔn)針對(duì)性地進(jìn)行匯總,對(duì)產(chǎn)品涉及的各技術(shù)要素以及檢驗(yàn)方法實(shí)現(xiàn)“一圖直達(dá)”。標(biāo)準(zhǔn)“GB 25570 輔食營(yíng)養(yǎng)補(bǔ)充品”的關(guān)聯(lián)圖譜,以該產(chǎn)品標(biāo)準(zhǔn)為中心的網(wǎng)狀結(jié)構(gòu)直觀地整理了該標(biāo)準(zhǔn)存在有28項(xiàng)關(guān)聯(lián),主要的19項(xiàng)標(biāo)準(zhǔn)關(guān)聯(lián)產(chǎn)生在理化指標(biāo)檢驗(yàn)方法上,對(duì)于食品添加劑、營(yíng)養(yǎng)劑以及外包裝均有相關(guān)的標(biāo)準(zhǔn)要求(如圖5所示)。

其次,關(guān)聯(lián)查詢給標(biāo)準(zhǔn)的修訂提供了重要性數(shù)據(jù)參考。食品生產(chǎn)與人民群眾生命安全息息相關(guān),知識(shí)圖譜可以通過節(jié)點(diǎn)出度、入度,從數(shù)據(jù)層面標(biāo)記標(biāo)準(zhǔn)重要性以及關(guān)聯(lián)程度。以“微生物檢驗(yàn)方法標(biāo)準(zhǔn)”為例,在Neo4j中直接查詢“MATCH (a)-[r:`微生物檢驗(yàn)方法`]->(b)RETURN b, COUNT(r) ORDERBY COUNT(r) DESC”,圖譜如圖6所示,數(shù)據(jù)結(jié)果見表3。結(jié)果顯示與食品產(chǎn)品直接關(guān)聯(lián)的微生物檢驗(yàn)方法標(biāo)準(zhǔn)重要性前三分別為GB 4789.3、GB 4789.2、GB 4789.4,關(guān)聯(lián)數(shù)目分別為50項(xiàng)、40項(xiàng)以及21項(xiàng),因此在修訂相關(guān)標(biāo)準(zhǔn)時(shí)對(duì)于關(guān)聯(lián)程度較廣的標(biāo)準(zhǔn)應(yīng)更加謹(jǐn)慎、多方考慮。

5 結(jié) 語

我國(guó)標(biāo)準(zhǔn)的領(lǐng)域知識(shí)深度廣,有效的知識(shí)管理對(duì)于提高標(biāo)準(zhǔn)文件信息管理水平、促進(jìn)標(biāo)準(zhǔn)化工作成果具有重要意義。標(biāo)準(zhǔn)知識(shí)圖譜的核心在于標(biāo)準(zhǔn)知識(shí)單元的重組與細(xì)化,對(duì)標(biāo)準(zhǔn)文檔邏輯化的拆分的知識(shí)管理優(yōu)勢(shì)在于,對(duì)于實(shí)體不僅囊括其涉及屬性的長(zhǎng)文本,還能夠基于標(biāo)準(zhǔn)的制定邏輯對(duì)標(biāo)準(zhǔn)之間引用關(guān)系進(jìn)行存儲(chǔ),對(duì)于標(biāo)準(zhǔn)文檔做到了知識(shí)概括性、引用關(guān)聯(lián)性同時(shí)把握。知識(shí)圖譜的語義網(wǎng)絡(luò)特性在描述標(biāo)準(zhǔn)的語義關(guān)系上充分發(fā)揮效能,做到更深層、更高細(xì)粒度的知識(shí)管理,并為以此作為底層知識(shí)庫開展的智能應(yīng)用打下基礎(chǔ)。

知識(shí)圖譜的組織模式提供了標(biāo)準(zhǔn)管理的框架和底層邏輯,后續(xù)研究方向聚焦于構(gòu)建圖譜的效率。探索具有通用性的標(biāo)準(zhǔn)本體構(gòu)建方法、提高標(biāo)準(zhǔn)知識(shí)抽取加工過程精確度以及如何深度利用標(biāo)準(zhǔn)知識(shí)圖譜實(shí)現(xiàn)智能應(yīng)用,例如:精準(zhǔn)問答等擴(kuò)展。

參考文獻(xiàn)

楊波,楊美芳. 知識(shí)圖譜研究綜述及其在風(fēng)險(xiǎn)管理領(lǐng)域應(yīng)用[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2021,42(08):1610-1618.

劉嶠,李楊,段宏,等. 知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 計(jì)算機(jī)研究與發(fā)展, 2016,53(03):582-600.

Cheng B, Zhang J, Liu H, et al. Research on medical knowledgegraph for stroke[J]. Journal of Healthcare Engineering, 2021,2021.

Zhang D, Jia Q, Yang S, et al. Traditional Chinese MedicineAutomated Diagnosis Based on Knowledge Graph Reasoning[J].CMC-COMPUTERS MATERIALS & CONTINUA, 2022,71(1): 159-170.

Yang B, Liao Y. Research on enterprise risk knowledge graphbased on multi-source data fusion[J]. Neural Computing andApplications, 2022, 34(4): 2569-2582.

袁俊,劉國(guó)柱,梁宏濤,等. 知識(shí)圖譜在商業(yè)銀行風(fēng)控領(lǐng)域的研究與應(yīng)用綜述[J/OL]. 計(jì)算機(jī)工程與應(yīng)用: 1-16[2022-08-11].

王思宇,邱江濤,洪川洋,等. 基于知識(shí)圖譜的在線商品問答研究[J]. 中文信息學(xué)報(bào), 2020,34(11):104-112.

孫佳琛,王金龍,丁國(guó)如,等. 頻譜知識(shí)圖譜:面向未來頻譜管理的智能引擎[J].通信學(xué)報(bào),2021,42(05):1-12.

胡琳,楊建軍,韋莎,等. 工業(yè)互聯(lián)網(wǎng)標(biāo)準(zhǔn)體系構(gòu)建與實(shí)施路徑[J]. 中國(guó)工程科學(xué), 2021,23(02):88-94.

黃持偉,吳學(xué)科,陽如坤,等. 鋰電池智能制造裝備標(biāo)準(zhǔn)體系研究[J]. 中國(guó)標(biāo)準(zhǔn)化, 2021(07):57-62+93.

肖有明,賴森森. 我國(guó)的食品安全標(biāo)準(zhǔn)體系建設(shè)[J]. 現(xiàn)代食品, 2020(17):145-147.

于航宇,樊永祥,王家祺. 我國(guó)現(xiàn)行食品安全地方標(biāo)準(zhǔn)分析[J]. 中國(guó)食品衛(wèi)生雜志, 2019,31(05):485-489.

唐爽,韓義萍,張玉,等. 標(biāo)準(zhǔn)知識(shí)庫構(gòu)建研究[J]. 中國(guó)標(biāo)準(zhǔn)化, 2020(S1):46-50.

趙雪芹,李天娥. 面向數(shù)字人文的檔案領(lǐng)域本體構(gòu)建研究——以萬里茶道檔案資料為例[J/OL].情報(bào)理論與實(shí)踐:1-9[2022-08-09].

熊勵(lì),王成文,王錕. 基于事件本體的疫情知識(shí)庫構(gòu)建策略[J]. 圖書情報(bào)工作, 2021,65(14):138-148.DOI:10.13266/j.issn.0252-3116.2021.14.016.

劉博,張佳慧,李建強(qiáng),等. 大氣污染領(lǐng)域本體的半自動(dòng)構(gòu)建及語義推理[J]. 北京工業(yè)大學(xué)學(xué)報(bào), 2021,47(03):246-259.

唐琳,郭崇慧,陳靜鋒,等. 基于中文學(xué)術(shù)文獻(xiàn)的領(lǐng)域本體概念層次關(guān)系抽取研究[J].情報(bào)學(xué)報(bào),2020,39(04):387-398.

Wang P, Mao Y, Song W, et al. A Comprehensive and ScientificallyAccurate Pharmaceutical Knowledge Ontology based on MultisourceData[C]//BIOINFORMATICS. 2022: 168-175.

劉慧琳,牛力. 標(biāo)準(zhǔn)文件的知識(shí)圖譜組織模式探究[J]. 檔案學(xué)通訊, 2021(05):58-65.

趙丹. 大慶油田標(biāo)準(zhǔn)體系動(dòng)態(tài)管理系統(tǒng)的研究[J]. 中國(guó)標(biāo)準(zhǔn)化, 2017(17):114-118.

猜你喜歡
知識(shí)管理知識(shí)圖譜標(biāo)準(zhǔn)
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
忠誠(chéng)的標(biāo)準(zhǔn)
美還是丑?
近十五年我國(guó)小學(xué)英語教學(xué)研究的熱點(diǎn)、問題及對(duì)策
基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
提升企業(yè)知識(shí)管理能力 增強(qiáng)企業(yè)的強(qiáng)勁發(fā)展態(tài)勢(shì)
檔案管理與知識(shí)管理的關(guān)系研究
從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
大數(shù)據(jù)時(shí)代高校學(xué)生知識(shí)管理
科技視界(2016年21期)2016-10-17 18:42:37
东兰县| 治县。| 泊头市| 梨树县| 尖扎县| 喀喇| 新兴县| 西华县| 永登县| 保德县| 兰考县| 威宁| 香河县| 尚义县| 淮南市| 九台市| 彩票| 车致| 双江| 新宾| 昆明市| 嘉祥县| 芮城县| 六盘水市| 巴东县| 满城县| 江安县| 柘城县| 建湖县| 西吉县| 沂南县| 青铜峡市| 扬州市| 宾阳县| 康马县| 和田市| 延安市| 呈贡县| 梁山县| 武川县| 和硕县|