国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

計算機專業(yè)信息服務的智能化應用研究

2021-03-22 02:56馬剛李紅云
電腦知識與技術(shù) 2021年6期
關(guān)鍵詞:知識圖譜人工智能

馬剛 李紅云

摘要:高校在教學過程中會產(chǎn)生大量的數(shù)據(jù),很多數(shù)據(jù)都是孤立的存儲于計算機中,數(shù)據(jù)之間缺少語義關(guān)聯(lián),無法滿足個性化、多樣化的信息檢索服務。本文對人工智能化技術(shù)進行了綜合論述,分析各種智能化技術(shù)的特點,優(yōu)先采用基于知識圖譜技術(shù)作為高校學生智能化信息處理平臺,以本人所在學校智能制造學院為例,利用已存的學生數(shù)據(jù)信息表為載體,依據(jù)學生學習需求服務為原則,試圖建立一種智能化專業(yè)學習信息處理系統(tǒng)模型。

關(guān)鍵詞:人工智能;知識圖譜;信息處理系統(tǒng)

中圖分類號:TP18? ? 文獻標識碼:A

文章編號:1009-3044(2021)06-0135-03

1概述

在傳統(tǒng)辦公過程中,學校會產(chǎn)生出大量的文件、班級表、課程表、成績單等數(shù)據(jù),很多數(shù)據(jù)都是孤立被存儲在計算機硬盤中,如果遇到一個具有復雜功能的查詢,就需要很多人在同一時間段查詢各種數(shù)據(jù)表,經(jīng)過認真分析,最后才能找到所需的數(shù)據(jù)。這種較低的辦公效率會極大地影響學校信息化系統(tǒng)建設,不利于學校的快速發(fā)展。基于當前人工智能[1]技術(shù)的不斷發(fā)展,高校的信息化管理應當不斷向智能化辦公方向發(fā)展。本人以我校智能制造學院為例,本文首先研究了基于人工智能的信息檢索技術(shù),匯總學生的各種數(shù)據(jù)信息作為數(shù)據(jù)源,依據(jù)教務管理材料推導出語義檢索的標準規(guī)則,探討一種面向?qū)W生學習信息需求服務的智能化辦公軟件系統(tǒng)模型。

2信息的智能化處理技術(shù)理論和方法

人工智能是九十年代初開始興起的一種智能化處理數(shù)據(jù)的學科,主要包括機器學習、數(shù)據(jù)挖掘、模式識別等內(nèi)容,它基于大量的計算機智能算法而得到人們期望的最優(yōu)數(shù)據(jù)。目前該學科已經(jīng)廣泛應用于圖像處理、文本處理、語言處理、機器人系統(tǒng)等領域。人工智能技術(shù)構(gòu)建具有良好的判斷能力,理解能力和學習能力,同時這也是人們開發(fā)人工智能系統(tǒng),開展智能化信息技術(shù)研究的根本目標。利用人工智能算法(關(guān)聯(lián)規(guī)則、模糊理論、神經(jīng)網(wǎng)絡、知識圖譜等)對原始數(shù)據(jù)信息進行采集和綜合化加工處理,最終得到智能化決策結(jié)論。

2.1模糊理論

美國人L.A.zadeh在二十世紀中期創(chuàng)立了模糊集合理論[2],主要內(nèi)容包括模糊邏輯、模糊推理、模糊控制、模糊計算等,它主要用于解決現(xiàn)實問題中的抽象模型分析與推理,后來被歸納為數(shù)學科學中的一個分支學科,成為模糊問題的主要解決理論和方法。當前人們常用的模糊計算方法主要有:模糊統(tǒng)計法、模糊分步法,熵權(quán)法。熵權(quán)法揭示的原理:如果與指標相關(guān)的熵值越小,則此指標對綜合評價的影響較大。這種思想被應用在信息檢索中具有較高的應用價值。例如:一個詞語,在不同的句子中往往具有多種含義,如果把句子看成是該詞語的背景,不同的背景就決定了該詞語的一種含義。在分析句子詞語的含義值,對該詞語計算出其在句子中背景的信息貢獻量,得到熵值作為特征值用于確定詞語的某一種含義,提高了信息檢索的水平。

2.2人工神經(jīng)網(wǎng)絡

BP神經(jīng)網(wǎng)絡[3]算法能學習和存儲大量輸入—輸出模式映射關(guān)系,為個性化查詢帶來較高的效率,但不足的是需要大量的樣本數(shù)據(jù),才能確定該算法中用到的多個參數(shù)模擬值,同時,該算法設計很復雜,當客戶端大量訪問需要較高的服務器硬件資源。

2.3 知識圖譜

為了給大眾提供更加精準的信息檢索服務,谷歌公司首次提出“知識圖譜”,其觀點認為世界是由大量的實體和實體之間的關(guān)系組成,從而達到基于語義級別的智能化信息檢索,目前基于知識圖譜[4]的研究在語義分析、智能推理、智能互答等領域都有了重要突破。

知識圖譜起源于語義網(wǎng)絡,以“實體-關(guān)系-實體”作為基本單元,大量的關(guān)系把大量的實體彼此聯(lián)系起來,便構(gòu)成了知識網(wǎng)絡模型。知識圖譜目前已經(jīng)廣泛應用于教育、企業(yè)、科研等。

知識圖譜的研究內(nèi)容[5]主要包括:知識圖譜表示與建模(實體建模)、知識存儲、知識抽取與知識挖掘、知識圖譜融合、知識圖譜推理、語義搜索 、知識問答等核心內(nèi)容。

通常,知識圖譜技術(shù)的核心研究對象是本體,本體由五個基本構(gòu)成元素:類(Class)或概念(Conception),關(guān)系(Relations),函數(shù)(Functions),公理(Axioms),實例(Instance)。

因此,本體可以看成是一種五元組:O = ( C , P , I , H, F ),其中,C代表概念集合;P代表屬性集合;I代表個體集合即實例集合;H代表概念層次的結(jié)合;F代表函數(shù)集合。

構(gòu)建知識圖譜需要大量的數(shù)據(jù)源,如果使用自底向上的方法可以獲取知識圖譜中的實體概念、屬性、類別、關(guān)系等信息,一般情況下,通過采集數(shù)據(jù)源和數(shù)據(jù)處理這2個過程就可以構(gòu)建知識圖譜的首要工作,在結(jié)合7步法可以有效識別出實體。

關(guān)系抽取是基于知識圖譜某一領域中,尋找實體與實體之間的關(guān)系,可以使用實體對關(guān)系預測的方法進行判定,例如:一名計算機專業(yè)學生王二參加福建省計算機程序大賽,可以推測實體(王二)與實體(計算機程序大賽)是成員關(guān)系。

3需求分析

構(gòu)建計算機專業(yè)知識圖譜的最終目標就是為學生提供基于語義的智能化專業(yè)信息檢索服務[6],讓學生理解學習哪些課程、如何學習專業(yè)課程、是否達到專業(yè)學習水平等話題。本人對我院約500名學生進行問卷調(diào)查,列舉出學生提出的各種學習問題,收集了大概400份左右的反饋信息。通過這次調(diào)研,獲取學生主要關(guān)心的專業(yè)課問題,進行匯總、整合,對學習需求問題進行分類。需求分類如下:(1)課程學習需求:計算機有哪些課程?這些課程的內(nèi)容是什么?課程內(nèi)容的目標、特點、課程之間的關(guān)系?學習方法是什么?是否具備參加計算機專業(yè)期末考試的條件?(2)專業(yè)技術(shù)考試需求:如何評價自身的計算機專業(yè)水平?是否具備參加計算機專業(yè)資格考試的條件?(3)比賽需求:是否具備參加計算機專業(yè)比賽的條件?(4)畢業(yè)需求:是否符合計算機專業(yè)畢業(yè)條件?是否存在未修的公共課課程、專業(yè)課程?總學習積分是多少,是否達標?

張?zhí)鹛鹪谡撐闹薪o出數(shù)據(jù)結(jié)構(gòu)課程實體研究成果[7],里面包含有大量知識點本體:算法、排序、有向樹、遞歸等,這些本體中部分本體被引入了本文中作為衡量課程難度和核心內(nèi)容的本體。本文列舉面向?qū)W生學業(yè)信息的知識圖譜中常用本體:學生、學生成績、課程、專業(yè)基礎課程(概念、公式、算法等)、專業(yè)核心課程、專業(yè)必修課程、專業(yè)非必修課程、考試、公共課考試、專業(yè)課考試、比賽、國家級比賽、省級比賽、市級比賽、校賽。

4系統(tǒng)實施

4.1 MySQL表導入Neo4j系統(tǒng)

一個知識圖譜里面通常包含有大量的實體、實體的屬性、實體之間的關(guān)系,這3種信息是無法直接存儲在關(guān)系數(shù)據(jù)庫當中的,為此,人們開發(fā)出了一種基于圖形結(jié)構(gòu)方式的數(shù)據(jù)庫軟件系統(tǒng)Neo4j[8],它可以存儲上億個實體,并且同時滿足企業(yè)不斷變化的業(yè)務需求,具備極高的數(shù)據(jù)檢索性能,支持大規(guī)模的數(shù)據(jù)事務管理,目前已被應用到大量的企業(yè)智能檢索系統(tǒng)中。

知識圖譜中的本體模型通常是基于RDF三元組表示的,要把本體數(shù)據(jù)模型存儲到Neo4j數(shù)據(jù)庫中,需要將本體和Neo4j數(shù)據(jù)庫中創(chuàng)建的節(jié)點相匹配,具體操作過程主要包括3步驟:對本體解析,把三元組RDF模型數(shù)據(jù)映射到Neo4j圖節(jié)點模型,對Neo4j圖節(jié)點進行存儲。最后把基于外鍵聯(lián)系的傳統(tǒng)關(guān)系型數(shù)據(jù)庫MySQL[9]遷移到基于關(guān)系關(guān)聯(lián)的圖形數(shù)據(jù)庫Neo4j。

在Neo4j數(shù)據(jù)庫中存放完實體模型后,結(jié)合我院數(shù)據(jù)庫服務器MySQL中存放的歷年學生信息表、成績表、課程表等具體數(shù)據(jù),提取MySQL數(shù)據(jù)表中的主鍵和字段,根據(jù)主鍵在Neo4j數(shù)據(jù)庫中建立實體節(jié)點,根據(jù)字段在實體節(jié)點中建立屬性,重復該操作,把所需的MySQL數(shù)據(jù)表中的數(shù)據(jù)全部轉(zhuǎn)化成Neo4j數(shù)據(jù)庫中的實體值和屬性值。根據(jù)MySQL數(shù)據(jù)表中的外鍵,在Neo4j數(shù)據(jù)庫中建立所有的實體節(jié)點之間的聯(lián)系(即實體之間的關(guān)系)。這里給出MySQL數(shù)據(jù)表:

(1)學生檔案表:身份證號碼、學生姓名、籍貫、出生地、性別、常住地址、電話、備注;(2)學生信息表:年級、專業(yè)、學生編號、姓名、性別、電話、QQ號,宿舍號、學習狀態(tài);(3)學生課程表:? 課程編號、課程名稱、任課教師、教師編號、課程學分、課程性質(zhì);(4)課程信息表:課程編號、課程名稱、學分、課時量、課程性質(zhì);(5)學生課程成績信息表:學生編號、課程編號、平時成績、期末成績、綜合成績;(6)技能考試表:考試編號、等級、考試名稱;

本文使用MySQL-Workbench6.3軟件工具畫出與學生學習管理相關(guān)的數(shù)據(jù)表圖,如圖1所示。由MySQL數(shù)據(jù)表給出的數(shù)據(jù)被轉(zhuǎn)換到Neo4j數(shù)據(jù)庫中后,則得到了計算機專業(yè)信息的知識圖譜實體和實體關(guān)系,本文截取了部分實體和實體關(guān)系,如圖2所示。

4.2 建立知識推理規(guī)則集

在每學期開學時,根據(jù)已經(jīng)設定好的專業(yè)教學目標,任課老師準備好相關(guān)的教材、題庫、考試方案、教案、授課計劃等很多教學相關(guān)資料?;谥R圖譜的語義檢索,需要人工方式來根據(jù)學校教育制度,專業(yè)技術(shù)資格要求、畢業(yè)條件要求、考試資格要求、學生生活手冊要求,把這些制度和要求轉(zhuǎn)換成語義檢索的規(guī)則集。本人搜集了與學生學業(yè)相關(guān)的教務管理材料,經(jīng)過人工分析,獲取如下幾個方面的資格條件實體規(guī)則庫模型公式。

(1)考試規(guī)則:在無作弊的前提下,學生一門課程的期末總成績不低于60分,課程通過,且獲取該課程的學分數(shù)。(2)畢業(yè)條件:全部課程均通過,達到相應的學生畢業(yè)總積分數(shù),且無其他不良的記錄。(3)參加比賽資格: a1*專業(yè)課課程總分數(shù)+ a2*專業(yè)課課程總分數(shù)+…+ an*專業(yè)課課程總分數(shù)+b*軟件項目成績。

(4)參加專業(yè)技術(shù)資格考試:a1*專業(yè)課課程總分數(shù)+ a2*專業(yè)課課程總分數(shù)+…+ an*專業(yè)課課程總分數(shù)。

舉例說明:某一個學生要參加國家計算機軟件水平考試——軟件設計師(中級),其知識能力計算方式:a1*計算機文化課程分數(shù) + a2*軟件工程課程分數(shù)+ a3*數(shù)據(jù)結(jié)構(gòu)課程分數(shù) + a4*Java程序設計課程分數(shù) + a5*計算機組成原理課程分數(shù) + a6*計算機操作系統(tǒng)課程分數(shù) + a7*計算機網(wǎng)絡課程分數(shù)。相關(guān)說明:以上列舉的課程內(nèi)容都屬于軟件設計師考試的范圍,a1至a7這7個參數(shù)值可以使用機器學習算法進行確定。

4.3 搭建系統(tǒng)平臺

基于人工智能技術(shù)的信息檢索具有一定的智能運行思維,其能夠根據(jù)用戶的瀏覽習慣和需求,進行相關(guān)信息的智能化推理和推送,使得用戶能夠在龐大的信息數(shù)據(jù)中快速獲取所需信息。計算機專業(yè)信息檢索智能平臺[9]搭建需要引入Web技術(shù),學生在JSP Web頁面上輸入關(guān)心的問題或話題,對句子進行分詞處理,得到相關(guān)的實體,利用知識圖譜進行語義推理,在neo4j數(shù)據(jù)庫中進行語義檢索,把處理查詢結(jié)果在Web界面顯示并反饋給客戶端。下圖3給出學業(yè)智能信息檢索系統(tǒng)運行模型圖。

參考文獻:

[1] 蘇俊.人工智能技術(shù)應用與發(fā)展趨勢[J].電子技術(shù)與軟件工程,2018(3):250.

[2] 李小文.基于模糊理論的醫(yī)生綜合評價系統(tǒng)的研究與開發(fā)[D].杭州:浙江理工大學,2019.

[3] 徐愷英,王碩.利用BP神經(jīng)網(wǎng)絡算法優(yōu)化個性化搜索引擎[J].情報理論與實踐,2011,34(2):100-102.2:3-7.

[4] 張?zhí)鹛?基于數(shù)據(jù)結(jié)構(gòu)的知識圖譜構(gòu)建及其可視化應用的研究[D].上海:上海師范大學,2020.

[5]鄧志鴻,張銘.Ontology研究綜述[J].北京大學學報,2002,38(5):730-738.

[6] 王飛,張應中,羅曉芳.基于SQWRL的本體知識庫語義查詢[J].計算機技術(shù)與發(fā)展,2017,27(2):15-19,24.

[7]曹皓偉.基于Neo4j生物醫(yī)藥知識圖譜的構(gòu)建[J].計算機時代,2020(6):1-10.

[8] 曲小納.基于PHP技術(shù)與MYSQL數(shù)據(jù)庫技術(shù)的Web動態(tài)網(wǎng)頁設計[J].電腦知識與技術(shù),2020,16(13):50-51.

[9] 蘇翔.基于知識圖譜的“數(shù)據(jù)結(jié)構(gòu)”教學資源平臺的構(gòu)建研究[D].北京:北京林業(yè)大學,2019.

【通聯(lián)編輯:聞翔軍】

猜你喜歡
知識圖譜人工智能
我校新增“人工智能”本科專業(yè)
人工智能與就業(yè)
從《ET&S》與《電化教育研究》對比分析中管窺教育技術(shù)發(fā)展
砀山县| 观塘区| 英吉沙县| 瑞昌市| 拜泉县| 西安市| 永川市| 湘潭县| 长岭县| 县级市| 牡丹江市| 乌鲁木齐市| 高州市| 西畴县| 元朗区| 图木舒克市| 衢州市| 株洲市| 盐亭县| 龙山县| 吉首市| 滨海县| 庆阳市| 贺州市| 洮南市| 张掖市| 平塘县| 涟水县| 灵台县| 兴城市| 青海省| 东宁县| 龙州县| 金昌市| 囊谦县| 乌兰浩特市| 思南县| 沙坪坝区| 龙山县| 金华市| 菏泽市|