国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在學(xué)生專業(yè)傾向性分析中的應(yīng)用

2017-09-12 03:09:04吳梨梨
關(guān)鍵詞:傾向性海量備份

吳梨梨

(福州英華職業(yè)學(xué)院,福建福州350007)

數(shù)據(jù)挖掘技術(shù)在學(xué)生專業(yè)傾向性分析中的應(yīng)用

吳梨梨

(福州英華職業(yè)學(xué)院,福建福州350007)

目前的社會(huì)被稱為信息大爆炸的社會(huì),人們每天都能接收到大量的信息,但這些信息如果沒(méi)有經(jīng)過(guò)一定的篩選以及深度地挖掘,大部分人都無(wú)法了解這些信息中所蘊(yùn)藏的知識(shí)點(diǎn);而傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),已經(jīng)滿足不了這么龐大的數(shù)據(jù)挖掘分析的要求,通過(guò)數(shù)據(jù)挖掘技術(shù)與云計(jì)算技術(shù)結(jié)合,極大程度地彌補(bǔ)了傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的不足之處;設(shè)計(jì)了一個(gè)基于云計(jì)算技術(shù)的數(shù)據(jù)挖掘平臺(tái),用于發(fā)現(xiàn)影響學(xué)生專業(yè)學(xué)習(xí)的因素。

數(shù)據(jù)挖掘; 云計(jì)算; 專業(yè)傾向

通過(guò)專業(yè)傾向性分析,根據(jù)學(xué)生以往的表現(xiàn)發(fā)現(xiàn)最適合學(xué)生特點(diǎn)的專業(yè),避免了學(xué)生在求學(xué)過(guò)程中專業(yè)選擇錯(cuò)誤等問(wèn)題的發(fā)生。而云計(jì)算平臺(tái)下的數(shù)據(jù)挖掘技術(shù)將云計(jì)算技術(shù)與數(shù)據(jù)挖掘技術(shù)完美地結(jié)合,利用云計(jì)算的特點(diǎn),使用數(shù)據(jù)挖掘技術(shù),從海量的互聯(lián)網(wǎng)數(shù)據(jù)中挖掘影響高職學(xué)生選擇專業(yè)的因素,指導(dǎo)學(xué)生的專業(yè)選擇。

一、云計(jì)算與數(shù)據(jù)挖掘概述

(一) 云計(jì)算的定義

云計(jì)算是一種新型的商業(yè)計(jì)算模型,由網(wǎng)絡(luò)計(jì)算、并行處理、分布式計(jì)算發(fā)展而來(lái)。目前對(duì)于云計(jì)算的定義有非常多種,在本文中引用的是中國(guó)云計(jì)算專家劉鵬的定義:云計(jì)算將計(jì)算任務(wù)發(fā)布在大量計(jì)算機(jī)構(gòu)成的資源池上,使各種應(yīng)用系統(tǒng)能夠根據(jù)需要獲取計(jì)算力、存儲(chǔ)空間和各種軟件服務(wù)。這種資源池就是所謂的“云”,用戶按照需求來(lái)獲取網(wǎng)絡(luò)服務(wù),云計(jì)算在廣義上被認(rèn)為是服務(wù)的交付和使用模式。

(二) 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘技術(shù)就是從大量的、不完全的、隨機(jī)的、有噪聲的以及模糊的數(shù)據(jù)中,對(duì)隱含其中的、預(yù)先未知的但具有潛在價(jià)值的知識(shí)和信息進(jìn)行提取的過(guò)程。在以往的數(shù)據(jù)挖掘中,面臨的數(shù)據(jù)量比較小,傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)完全滿足需求。但是隨著海量數(shù)據(jù)的快速增長(zhǎng),數(shù)據(jù)挖掘的個(gè)性化需求越來(lái)越凸顯出來(lái)。云計(jì)算因?yàn)樽陨淼暮A康拇鎯?chǔ)能力以及強(qiáng)大的計(jì)算能力,成為了數(shù)據(jù)挖掘的最有效的解決方式。

(三) 云計(jì)算平臺(tái)下進(jìn)行數(shù)據(jù)挖掘的顯著優(yōu)勢(shì)

首先,云計(jì)算平臺(tái)有效解決了海量數(shù)據(jù)的存儲(chǔ)與數(shù)據(jù)丟失問(wèn)題。云計(jì)算改變了數(shù)據(jù)存儲(chǔ)的一般模式,將網(wǎng)絡(luò)上的海量數(shù)據(jù)經(jīng)過(guò)合并,轉(zhuǎn)換和篩選,存儲(chǔ)在云計(jì)算平臺(tái)的各個(gè)存儲(chǔ)節(jié)點(diǎn)上。其次,利用云計(jì)算平臺(tái)的分布式并行計(jì)算的特點(diǎn),可以有效地降低數(shù)據(jù)處理的成本,并且也擺脫了對(duì)機(jī)器性能的依賴。第三,利用云計(jì)算技術(shù),可以提升處理海量數(shù)據(jù)的能力與速度,在控制好系統(tǒng)的容錯(cuò)性的同時(shí),也可以增加系統(tǒng)的節(jié)點(diǎn)。

二、基于B/S架構(gòu)的云計(jì)算模式下數(shù)據(jù)挖掘平臺(tái)的框架結(jié)構(gòu)

云計(jì)算技術(shù)的實(shí)現(xiàn)主要是建立在網(wǎng)絡(luò)平臺(tái)上,利用虛擬技術(shù)和分布式存儲(chǔ)技術(shù)來(lái)實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的存儲(chǔ)與計(jì)算,云計(jì)算技術(shù)與數(shù)據(jù)挖掘技術(shù)相結(jié)合的框架圖如圖1所示。用戶通過(guò)不同的終端,利用瀏覽器以及相應(yīng)的賬號(hào)登陸到系統(tǒng)中,通過(guò)Iaas服務(wù)可以訪問(wèn)服務(wù)器群和數(shù)據(jù)庫(kù)群,通過(guò)Daas服務(wù)進(jìn)入數(shù)據(jù)管理子系統(tǒng),進(jìn)行平臺(tái)與數(shù)據(jù)服務(wù)之間的數(shù)據(jù)交換,也可以通過(guò)Paas服務(wù)進(jìn)入數(shù)據(jù)挖掘子系統(tǒng),選擇合適的挖掘算法,還可以利用Saas服務(wù)調(diào)用數(shù)據(jù)挖掘子系統(tǒng),完成數(shù)據(jù)挖掘任務(wù)。在這個(gè)系統(tǒng)中,數(shù)據(jù)挖掘平臺(tái)是核心。

三、高職生源專業(yè)傾向性分析系統(tǒng)的的設(shè)計(jì)與實(shí)現(xiàn)

本系統(tǒng)的主要目的是利用與學(xué)生信息相關(guān)的海量數(shù)據(jù)來(lái)分析,找出影響學(xué)生專業(yè)傾向性的主要因素,從而達(dá)到指導(dǎo)專業(yè)選擇的目的。系統(tǒng)的部分功能如下:

(一) 主界面設(shè)計(jì)

良好的人機(jī)交互界面是系統(tǒng)成功的第一步。本系統(tǒng)采用側(cè)面導(dǎo)航欄的模塊結(jié)構(gòu),便于用戶選擇功能區(qū)域。

(二) 數(shù)據(jù)管理子系統(tǒng)

數(shù)據(jù)管理子系統(tǒng)主要提供給用戶的查詢操作。用戶在使用中,使用信息查詢類,向數(shù)據(jù)庫(kù)群和服務(wù)器群提出查詢請(qǐng)求,數(shù)據(jù)庫(kù)系統(tǒng)按照用戶需求關(guān)鍵字組織符合的數(shù)據(jù)組裝到數(shù)組中返回給數(shù)據(jù)查詢類,并顯示在用戶臨時(shí)數(shù)據(jù)表中。

(三) 數(shù)據(jù)挖掘子系統(tǒng)

數(shù)據(jù)挖掘子系統(tǒng)是全系統(tǒng)中功能最重要的模塊。在該模塊中,用戶可以通過(guò)先選擇數(shù)據(jù)庫(kù),再以專業(yè)傾向?yàn)槟繕?biāo),選擇輸入的字段進(jìn)行分析。默認(rèn)的目標(biāo)是專業(yè)傾向,也可以按下拉鍵選擇其他屬性。數(shù)據(jù)挖掘子系統(tǒng)的用戶界面如圖2所示。在該模塊中,數(shù)據(jù)挖掘分析是通過(guò)數(shù)據(jù)挖掘算法來(lái)實(shí)現(xiàn)的。對(duì)使用用戶而言,所進(jìn)行的操作只是選擇數(shù)據(jù)庫(kù)表、選擇目標(biāo)選項(xiàng)、選擇輸入條件等;對(duì)數(shù)據(jù)挖掘子模塊而言,這里要求自主選擇挖掘的支持度、置信度等信息參數(shù),并根據(jù)用戶的條件選擇來(lái)連接數(shù)據(jù)庫(kù),讀取數(shù)據(jù),根據(jù)數(shù)據(jù)挖掘算法進(jìn)行數(shù)據(jù)挖掘操作,并根據(jù)得到的最小支持度和置信度參數(shù)來(lái)過(guò)濾符合條件的數(shù)據(jù),最終返回決策樹(shù)圖形與規(guī)則集。

(四) 系統(tǒng)管理模塊

在系統(tǒng)管理模塊中,主要實(shí)現(xiàn)用戶權(quán)限管理。由于專業(yè)傾向性分析數(shù)據(jù)涉及多個(gè)部門(mén),各有其數(shù)據(jù)敏感性。因此針對(duì)數(shù)據(jù)倉(cāng)庫(kù)里每個(gè)數(shù)據(jù)項(xiàng)應(yīng)做安全分級(jí)管理,對(duì)應(yīng)的則是用戶應(yīng)據(jù)此有不同的訪問(wèn)權(quán)限。按照不同的用戶類別,劃分不同的使用權(quán)限。系統(tǒng)超級(jí)管理員可以把權(quán)限分配給普通用戶,可以添加、刪除用戶的權(quán)限,管理員同時(shí)具有數(shù)據(jù)備份的權(quán)限;數(shù)據(jù)備份是系統(tǒng)重要的功能之一,外力造成的不可控因素有可能導(dǎo)致數(shù)據(jù)崩潰性的破壞,因此需要有規(guī)律地進(jìn)行數(shù)據(jù)備份,以便把數(shù)據(jù)損失挽回到最小;除了對(duì)用戶權(quán)限的設(shè)置以外,系統(tǒng)的超級(jí)管理員還擁有定時(shí)備份數(shù)據(jù)或手動(dòng)備份數(shù)據(jù)的功能,同樣也可以從頁(yè)面上“后臺(tái)首頁(yè)”處點(diǎn)擊進(jìn)入。普通用戶的界面不顯示“后臺(tái)首頁(yè)”功能的登陸入口,保證敏感數(shù)據(jù)得到分級(jí)保護(hù),也盡可能地避免誤操作。管理界面的數(shù)據(jù)備份如圖3所示,管理頁(yè)面的內(nèi)容包括了更改密碼,用戶權(quán)限與數(shù)據(jù)備份。其中“定時(shí)設(shè)置”是對(duì)定時(shí)備份頻率的設(shè)置,默認(rèn)30天自動(dòng)備份。管理員可以隨時(shí)手動(dòng)開(kāi)啟備份功能。除了常規(guī)的系統(tǒng)默認(rèn)備份外,管理員可以點(diǎn)擊“手動(dòng)備份”,操作隨時(shí)可以進(jìn)行。系統(tǒng)在備份時(shí)會(huì)暫時(shí)停止對(duì)外數(shù)據(jù)交互。當(dāng)需要設(shè)置備份文件存放的物理路徑與格式,或?qū)С鰝浞輸?shù)據(jù)時(shí),可以選擇“高級(jí)設(shè)置”。最后,當(dāng)系統(tǒng)數(shù)據(jù)遭遇無(wú)可挽回的損失時(shí),管理員可以點(diǎn)擊“數(shù)據(jù)導(dǎo)入”,使用備份數(shù)據(jù)替換被破壞的數(shù)據(jù)。為了避免頻繁導(dǎo)入數(shù)據(jù)造成數(shù)據(jù)混亂,導(dǎo)入數(shù)據(jù)功能每天最多使用兩次。

(五) 報(bào)表打印

為了能夠隨時(shí)將查詢的結(jié)果以圖文并排的形式打印為紙質(zhì)文本,在報(bào)表打印模塊中,設(shè)置了打印報(bào)表的功能。使用者可以在執(zhí)行任意查詢功能之后,除了在網(wǎng)頁(yè)上列表顯示查詢的結(jié)果外,也可以點(diǎn)擊橫功能欄上的“打印報(bào)表”,生成報(bào)表格式并聯(lián)通實(shí)體的打印機(jī),以紙質(zhì)文本的形式打印出來(lái),打印報(bào)表的運(yùn)行界面如圖4所示。

四、結(jié)語(yǔ)

云計(jì)算平臺(tái)下的數(shù)據(jù)挖掘平臺(tái)為實(shí)現(xiàn)高職生源專業(yè)傾向性分析提供了解決方案,系統(tǒng)使用B/S架構(gòu),滿足了多種終端用戶的訪問(wèn),實(shí)現(xiàn)了用戶群的廣泛性;系統(tǒng)管理模塊實(shí)現(xiàn)了用戶的權(quán)限管理,數(shù)據(jù)管理子系統(tǒng)中用戶根據(jù)自己的賬號(hào)和密碼就可以訪問(wèn)服務(wù)器群和數(shù)據(jù)庫(kù)群;數(shù)據(jù)挖掘子系統(tǒng)中用戶可以根據(jù)自己的需求選擇數(shù)據(jù)挖掘算法來(lái)完成對(duì)數(shù)據(jù)的深度挖掘。

[1] 王鵬,王健安,郭暢,巴濟(jì)慈.基于云計(jì)算及數(shù)據(jù)挖掘技術(shù)的海量數(shù)據(jù)處理研究[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(6):157-160.

[2] 尹雪婷,程強(qiáng),許惠惠.基于云計(jì)算的數(shù)據(jù)挖掘技術(shù)[J].信息與電腦,2015(21):60-63.

[3] 吳銳,孫銀香.云計(jì)算平臺(tái)下的Web數(shù)據(jù)挖掘研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(8):67-68.

2017-04-07

2015年福建省中青年教師教育科研項(xiàng)目“云計(jì)算平臺(tái)下的數(shù)據(jù)挖掘技術(shù)在高職學(xué)生專業(yè)傾向性分析中應(yīng)用”(項(xiàng)目編號(hào):JA15872)

吳梨梨(1983-),女,福建福州人,碩士,講師,研究方向?yàn)閿?shù)據(jù)挖掘,電話:13960822663。

G712.3;TP311.13

A

1671-4733(2017)04-0106-02

猜你喜歡
傾向性海量備份
“備份”25年:鄧清明圓夢(mèng)
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
基于模糊數(shù)學(xué)法的阿舍勒銅礦深部巖體巖爆傾向性預(yù)測(cè)
海量快遞垃圾正在“圍城”——“綠色快遞”勢(shì)在必行
一個(gè)圖形所蘊(yùn)含的“海量”巧題
關(guān)于醫(yī)患沖突報(bào)道的傾向性分析——以“湘潭產(chǎn)婦死亡案”為例
淺析數(shù)據(jù)的備份策略
科技視界(2015年6期)2015-08-15 00:54:11
“沒(méi)準(zhǔn)兒”“不一定”“不見(jiàn)得”和“說(shuō)不定”的語(yǔ)義傾向性和主觀性差異
一種面向博客群的主題傾向性分析模型
出版原圖數(shù)據(jù)庫(kù)遷移與備份恢復(fù)
牡丹江市| 尖扎县| 五大连池市| 墨脱县| 凤冈县| 英山县| 托克逊县| 沙洋县| 墨竹工卡县| 乐清市| 江安县| 聂拉木县| 集贤县| 凤凰县| 大荔县| 临夏市| 仙游县| 南漳县| 丹江口市| 随州市| 岱山县| 于都县| 辽宁省| 礼泉县| 会昌县| 盐山县| 衡阳市| 无极县| 双峰县| 定州市| 玉环县| 株洲市| 海兴县| 安义县| 乡城县| 隆尧县| 拜泉县| 万荣县| 读书| 尼木县| 简阳市|