鄧瑋+蔡春玲+雷剛
摘 要:在這個(gè)網(wǎng)絡(luò)信息技術(shù)飛速增長(zhǎng)的時(shí)代,高校在課程學(xué)習(xí)驗(yàn)收成果的形式是也開始電子化。但與此同時(shí),由于電腦的易操作性,抄襲現(xiàn)象也伴隨而來(lái)。我們采用了兩種簡(jiǎn)單的操作方法,實(shí)現(xiàn)了二個(gè)小軟件。通過監(jiān)測(cè)關(guān)鍵字,統(tǒng)計(jì)個(gè)數(shù)比對(duì)以及截屏監(jiān)測(cè)作業(yè)制作過程來(lái)大致判斷有無(wú)存在抄襲。實(shí)驗(yàn)研究表明軟件能初步判斷出學(xué)生作業(yè)中是否有可能抄襲。
關(guān)鍵詞:電子作業(yè) 檢測(cè)抄襲 關(guān)鍵字 截屏 距離計(jì)算
【中圖分類號(hào)】G434
1引言
隨著計(jì)算機(jī)應(yīng)用的普及,高校正在逐步實(shí)現(xiàn)作業(yè)的電子化和網(wǎng)絡(luò)化。這種作業(yè)形式的改革有效減少了教育資源浪費(fèi),教師工作任務(wù)量,提高了效率,使教與學(xué)得到了互動(dòng)。作業(yè)的電子化是高校教學(xué)改革發(fā)展趨勢(shì),同時(shí)帶來(lái)的負(fù)面影響則是加重抄襲現(xiàn)象,這就成為作業(yè)改革受到嚴(yán)重困擾的主要因素。所以研究一款減少抄襲現(xiàn)象發(fā)生的技術(shù)對(duì)作業(yè)質(zhì)量的提高具有重要意義
2 國(guó)內(nèi)外現(xiàn)狀分析
大學(xué)作業(yè)抄襲在國(guó)內(nèi)外已十分常見。中國(guó)青年報(bào)在調(diào)查中對(duì)2340人進(jìn)行的一項(xiàng)調(diào)查顯示,82.7%的人認(rèn)為大學(xué)生作業(yè)抄襲現(xiàn)象普遍,45.5%的人感覺“非常普遍”。在國(guó)外,Cramster.com網(wǎng)站中包含數(shù)百本教科書附加答案,學(xué)生僅需月付少量金錢,便能輕松解決作業(yè)。
中國(guó)學(xué)者付兵在《基于信息隱藏技術(shù)的電子作業(yè)防抄襲研究》《網(wǎng)絡(luò)環(huán)境與機(jī)房環(huán)境下電子作業(yè)反抄襲策略》這些篇論文中提到,他采用了信息隱藏算法對(duì)作業(yè)文本嵌入原創(chuàng)信息,對(duì)作業(yè)進(jìn)行片段拷貝檢測(cè),從而準(zhǔn)確定位抄襲源。西米蘇里州立大學(xué)的J. Evan Noynaert教授在論文《Plagiarism Detection Software》中指出“Plagiarism detectionsoftware is a powerful tool in the fight against plagiarism.”并提出軟件從三個(gè)方面來(lái)檢測(cè)抄襲:Quiz methods ,Writing style methods以及Comparison with original sources。
在這些理論和實(shí)踐的基礎(chǔ)上,探究出一個(gè)方便直接的防抄襲系統(tǒng),對(duì)大學(xué)生未來(lái)可持續(xù)發(fā)展都有積極的作用。
3 系統(tǒng)設(shè)計(jì)的主要設(shè)計(jì)思路
3.1設(shè)計(jì)方向
兩個(gè)主要的設(shè)計(jì)方向:動(dòng)態(tài)截屏和檢查關(guān)鍵字個(gè)數(shù)。
3.2具體設(shè)計(jì)思路
3.2.1采用QT軟件設(shè)計(jì)兩個(gè)獨(dú)立的客戶端,分別為教師與學(xué)生使用。
3.2.2 教師端的采用QT的file讀取技術(shù),任意選擇兩個(gè)文件讀入軟件,統(tǒng)計(jì)文件中指定關(guān)鍵字的個(gè)數(shù),利用算法得出兩篇作業(yè)關(guān)鍵字個(gè)數(shù)的相似度,若相似度過高則可大體判斷為抄襲。
3.2.3 學(xué)生端采用QT的圖像截取技術(shù),用定時(shí)器自動(dòng)將電腦整個(gè)屏幕截圖以圖片格式保存在一個(gè)文件夾中。通過截圖可判斷做作業(yè)過程中學(xué)生是否出現(xiàn)異常操作。若短時(shí)間內(nèi)截圖中作業(yè)內(nèi)容變化大或者截圖中出現(xiàn)正在用瀏覽器搜索網(wǎng)絡(luò)上的作業(yè)等,則可能存在抄襲。
4 研究過程
4.1圖片定時(shí)記錄以及存儲(chǔ)
由于圖像信息修改較為麻煩,能較真實(shí)的還原事物本質(zhì),則在研究過程中,著重利用Qt Creater中現(xiàn)有的針對(duì)圖形圖像處理的QPixmap類,運(yùn)用其已有的grabWindow()函數(shù),通過參數(shù)的設(shè)定,最終對(duì)學(xué)生電腦在作業(yè)時(shí)的整個(gè)屏幕進(jìn)行捕捉記錄,并利用saveScreen()函數(shù)將捕捉到的圖像信息以系統(tǒng)時(shí)間為命名方式存儲(chǔ)在文件夾中,較為真實(shí)的還原了學(xué)生的作業(yè)過程。為了提高記錄效率,后期利用Qtimer類以1min/張的頻率進(jìn)行圖像信息的存儲(chǔ)。
4.2內(nèi)容對(duì)比檢測(cè)
在數(shù)學(xué)中,空間向量的模越短,則兩點(diǎn)坐標(biāo)越相近?;谶@一性質(zhì),系統(tǒng)羅列了電子作業(yè)中大部分可能用到的關(guān)鍵詞,并按照其字符串長(zhǎng)度進(jìn)行排序,形成一個(gè)n維數(shù)組arr[n]。其次,對(duì)需進(jìn)行比較的電子作業(yè)進(jìn)行關(guān)鍵詞的提取,記錄各個(gè)關(guān)鍵詞的數(shù)量,并按照數(shù)組arr[n]中元素的排列方式形成兩組n維數(shù)組a[n]和b[n]。那么就等同于得到了2個(gè)三維坐標(biāo),在空間向量中,我們可以利用數(shù)學(xué)公式(1)求出二個(gè)向量之間的模,從而得到兩點(diǎn)間的距離,為了增加檢測(cè)結(jié)果的可信度檢測(cè)程序中錄入了50余個(gè)關(guān)鍵字。
公式1 計(jì)算距離的公式
根據(jù)d的數(shù)值大小來(lái)判定相對(duì)比的兩份電子作業(yè)相似性。我們?cè)O(shè)定了一個(gè)指定的闕值,當(dāng)?shù)玫降慕Y(jié)果d的數(shù)值小于等于該指定闕值5時(shí),則可判定為疑似抄襲。
結(jié)束語(yǔ)
現(xiàn)如今的中國(guó)高等教育的教育模式基本類似于“師傅領(lǐng)進(jìn)門,修行靠個(gè)人”,在經(jīng)歷過快節(jié)奏的高中生涯后,自由的大學(xué)生活給大學(xué)生帶來(lái)巨大的心理反差,許多人不再專心于專業(yè)課程學(xué)習(xí),漸漸荒廢學(xué)業(yè),致使畢業(yè)時(shí)前途迷茫,遺憾蹉跎。
本項(xiàng)目的研究主要以檢測(cè)大學(xué)生是否抄襲作業(yè),使大學(xué)生獨(dú)立自主完成專業(yè)作業(yè),培養(yǎng)個(gè)人良好素質(zhì)習(xí)慣。為社會(huì)輸送更多學(xué)而有成的專業(yè)能手。提高高等教育培養(yǎng)出優(yōu)秀人才的比例。對(duì)自身以及社會(huì)都有良好的影響。
本研究的特點(diǎn),它是具有一定實(shí)用性的檢測(cè)軟件??梢詮亩鄠€(gè)方面來(lái)判斷抄襲,容易操作,簡(jiǎn)單,可行性大。
參考文獻(xiàn):
[1]付兵.基于信息隱藏技術(shù)的電子作業(yè)防抄襲研究.長(zhǎng)江大學(xué)計(jì)算機(jī)科學(xué)學(xué)院:1-5.
[2]祁俊.王曉英.抄襲檢測(cè)系統(tǒng)對(duì)計(jì)算機(jī)類電子作業(yè)的影響分析.青海大學(xué):1-3.
[3]化柏林.抄襲檢測(cè)系統(tǒng)將給中國(guó)學(xué)術(shù)界帶來(lái)的變化.科技導(dǎo)報(bào), 2009,27(12),107.
[4]胡秋芬.電子作業(yè)防拷貝技術(shù)比較研究.浙江越秀外國(guó)語(yǔ)學(xué)院, 2013,34(6):59-60.
[5]李建軍.反抄襲軟件的局限及學(xué)術(shù)打假之策.編輯之友·術(shù)業(yè),2010,6:87-91.
[6]羅國(guó)輝.反抄襲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).開發(fā)研究與設(shè)計(jì)技術(shù),2007,1615-1616.
[7]石陸魁,張軍,陳飛,李金釗.匯編語(yǔ)言程序相似性檢測(cè)混合算法.河北科技大學(xué)報(bào),2011,32(2):139-142.