孫娜 姬丹丹 吳婉紅 郭磊
摘 要:本文旨在探究大學(xué)生個人行為與其圖書館借書數(shù)量之間的關(guān)系,得出最為影響其借書數(shù)量的因素,從而更具有針對性地培養(yǎng)大學(xué)生的日常行為習(xí)慣。根據(jù)某高校大學(xué)生一系列行為的數(shù)據(jù),結(jié)合其兩個月內(nèi)借書信息記錄,利用SPSS軟件對借書數(shù)量的影響因素進行多元回歸分析,建立回歸方程來預(yù)測某學(xué)生未來的借書數(shù)量。結(jié)果表明,大學(xué)生的借書次數(shù)、續(xù)借本數(shù)、不同性別的活躍度、不同節(jié)儉程度的活躍度、周課時數(shù)這五個因素是影響其借書數(shù)量最顯著的因素,本文的研究為教學(xué)建設(shè)等方面提供了重要參考。
關(guān)鍵詞:學(xué)生行為數(shù)據(jù);借書數(shù)量;SPSS;多元回歸分析;借閱數(shù)量
中圖分類號:G25 文獻標志碼:A 文章編號:1673-8454(2018)11-0073-05
圖書館作為學(xué)生的第二課堂,是學(xué)生學(xué)習(xí)課外知識、實現(xiàn)知識互補的主要來源,而借閱量是衡量學(xué)生利用圖書館和圖書館藏書質(zhì)量的標準。通過對閱讀量的分析,可以反映出學(xué)生在學(xué)習(xí)情況、課外活動活躍情況活躍度等方面的一系列問題。已有的研究大學(xué)生借閱數(shù)量的論文只著眼于圖書館的環(huán)境狀況、設(shè)備、藏書量等,[1][2]比如布艷艷在《科技風(fēng)》發(fā)表的文章從圖書館的角度對圖書借閱量減少展開了分析,[3]而未考慮學(xué)生個人方面原因造成的借閱量的下降。很多學(xué)者以圖書館為切入點研究借閱量下降的影響因素,有文獻在借閱量下降問題上進行了探究,分析并得出了互聯(lián)網(wǎng)及電子設(shè)備的普及引起了紙質(zhì)書借閱量的下降,并對圖書館的硬件環(huán)境設(shè)施提出了建議。[4-6]在《高校圖書館圖書借閱量統(tǒng)計分析報告》中,作者分析得出,影響圖書館圖書借閱量下降的主要原因是:電子資源的快速發(fā)展,館藏結(jié)構(gòu)不夠合理。[7]除了這些外部環(huán)境的變化會導(dǎo)致圖書館借書量的波動,學(xué)生的個人行為因素,比如學(xué)生的成績、參加課外活動的情況等也會影響其借書數(shù)量,從而對圖書館的整體借書量產(chǎn)生一定的影響。孫寶在《現(xiàn)代情報》中使用10年的讀者數(shù)據(jù)用灰色系統(tǒng)模型實現(xiàn)了圖書館借閱量的預(yù)測,為預(yù)測圖書館借閱量提供了參考經(jīng)驗。[8]陳明通過一元線性回歸模型,將學(xué)生數(shù)量作為自變量進行了圖書借閱量的預(yù)測,并提出影響因變量圖書借閱量的自變量因素不止一個,最主要的因素是學(xué)生人數(shù)。[9]如果考慮其他因素,這就涉及多元線性回歸分析問題。
針對以上存在的問題,本文在已有研究工作的基礎(chǔ)上,綜合考慮學(xué)生個人行為數(shù)據(jù)、借閱數(shù)據(jù),分析得出影響學(xué)生借閱量的關(guān)鍵因素。本文統(tǒng)計了山東某高校某學(xué)院大學(xué)生近兩個月的借書信息,結(jié)合某學(xué)院大學(xué)生日常生活中的個人行為數(shù)據(jù),分析是哪些變量引起的學(xué)生借閱數(shù)量的差異。通過分析我們發(fā)現(xiàn),大學(xué)生的借書次數(shù)、續(xù)借本數(shù)、不同性別的活躍度、不同節(jié)儉程度的活躍度、周課時數(shù)這五個因素是影響學(xué)生借閱量的關(guān)鍵因素,同時實驗結(jié)果表明,我們所采取的模型擬合優(yōu)度高,實驗效果顯著。
一、基于多元線性回歸的借書量影響因素確定
由于學(xué)生借書量受學(xué)生成績、學(xué)生課時數(shù)等多個變量影響,因此需要用兩個以上的影響因素作為自變量來解釋因變量的變化,經(jīng)過分析,這些因變量與自變量呈現(xiàn)明顯的線性關(guān)系,因此本文采用多元線性回歸模型進行借書量影響因素的提取。
1.數(shù)據(jù)處理
學(xué)生個人行為數(shù)據(jù)以及圖書借閱數(shù)量數(shù)據(jù)皆從教務(wù)處系統(tǒng)數(shù)據(jù)庫中導(dǎo)出,以文本文檔的形式呈現(xiàn)。學(xué)生在圖書館的借閱數(shù)據(jù),包括學(xué)生在被調(diào)查時間段內(nèi)的借書次數(shù)、續(xù)借書的本數(shù)。學(xué)生的個人行為數(shù)據(jù),主要有以下內(nèi)容:反映學(xué)生學(xué)習(xí)情況的數(shù)據(jù),包括學(xué)生在被調(diào)查學(xué)期的課時數(shù)、是否獲得獎學(xué)金;反映學(xué)生貧富情況的數(shù)據(jù),包括學(xué)生在餐廳內(nèi)的消費情況、是否獲得助學(xué)金;反映學(xué)生課外時間參與活動活躍度的數(shù)據(jù),即學(xué)生的德育成績;學(xué)生的基本信息數(shù)據(jù),包括學(xué)生的性別、專業(yè)、班級。在獲取了原始數(shù)據(jù)信息的基礎(chǔ)上,根據(jù)客觀情況,對數(shù)據(jù)進行了一系列的處理:[10]
(1)將學(xué)生的學(xué)習(xí)成績和德育成績按照以下標準進行等級劃分:
成績≤60等級為1,60<成績≤70等級為2,70<成績≤80等級為3,80<成績≤90等級為4,90<成績≤100等級為5;劃分后學(xué)習(xí)情況的好壞用學(xué)習(xí)成績等級來體現(xiàn),學(xué)習(xí)成績越好,其學(xué)習(xí)成績等級越高。課外時間參加活動的情況用活躍度來體現(xiàn),參加活動越多,其德育成績等級越高。
(2)將學(xué)生的消費情況按照以下標準進行等級劃分:
0<消費金額≤500等級為0,500<消費金額≤1000等級為1,1000<消費金額≤1500等級為2,1500<消費金額≤2000等級為3。劃分后學(xué)生的貧富情況以節(jié)儉程度來體現(xiàn),即消費金額越多,其消費等級越高,節(jié)儉程度也相對越低。
(3)根據(jù)節(jié)儉程度以及參加課外活動的活躍程度,建立了一個新的變量,即不同節(jié)儉程度的活躍度。本變量是由活躍度(即德育等級)與節(jié)儉程度這兩個變量相加而成,即“不同節(jié)儉程度的活躍度=活躍度+節(jié)儉程度”。學(xué)生的貧富情況不同,因此平時課外生活的活躍度也不同,因此將學(xué)生的節(jié)儉程度與學(xué)生的活躍度兩個變量相結(jié)合,以此來探究因為貧富情況不同而導(dǎo)致課外活動活躍度不同對學(xué)生借閱量的影響。
(4)根據(jù)學(xué)習(xí)成績以及參加課外活動的活躍程度,建立一個新的變量,即不同學(xué)習(xí)成績的活躍度。本變量是由成績等級與活躍度這兩個變量相減而成,即“不同學(xué)習(xí)成績的活躍度=成績等級-活躍度”。學(xué)生的活躍度不同,因此平時用在學(xué)習(xí)上的時間也就不同,因此將學(xué)生的活躍度與學(xué)生的學(xué)習(xí)成績這兩個變量相結(jié)合,以此來探究因為活躍度不同而導(dǎo)致學(xué)習(xí)成績不同對學(xué)生借閱量的影響。
(5)根據(jù)學(xué)習(xí)成績以及節(jié)儉程度,建立了一個新的變量,即不同節(jié)儉程度的學(xué)習(xí)成績。本變量是由成績等級與消費等級這兩個變量相減而成,即“不同學(xué)習(xí)成績的節(jié)儉程度=成績等級-花費等級”。學(xué)生貧富情況不同,因此學(xué)習(xí)的用功努力程度可能不同(比如家庭困難的學(xué)生可能會努力學(xué)習(xí)爭取獎學(xué)金),因此將學(xué)生的學(xué)習(xí)成績與花費等級這兩個變量相結(jié)合,以此來探究因為貧富情況不同而導(dǎo)致的學(xué)習(xí)成績不同對學(xué)生借閱量的影響。
(6)根據(jù)學(xué)習(xí)成績以及學(xué)生性別,建立了一個新的變量,即不同性別的學(xué)習(xí)成績。本變量是由成績等級與性別這兩個變量相乘而成,即“不同性別的學(xué)習(xí)成績=成績等級×性別”(其中男生記為0,女生記為1)。學(xué)生性別不同,對學(xué)習(xí)的專注程度不同,因此將學(xué)生的學(xué)習(xí)成績與學(xué)生性別兩個變量相結(jié)合,由此探究學(xué)生性別不同導(dǎo)致的學(xué)習(xí)成績不同對借閱量的影響。
(7)根據(jù)活躍度以及學(xué)生性別,建立了一個新的變量,即不同性別的活躍度。本變量是由成績等級與性別這兩個變量相乘而成,即“不同性別的活躍度=活躍度×性別”(其中男生記為0,女生記為1)。學(xué)生性別不同,因此對課外活動的時間安排不同(比如男生可能偏愛在宿舍中打游戲而不參與活動)。因此將學(xué)生的活躍度與學(xué)生性別兩個變量相結(jié)合,由此探究學(xué)生性別不同導(dǎo)致的活躍度不同對借閱量的影響。
(8)根據(jù)節(jié)儉程度以及學(xué)生性別,建立了一個新的變量,即不同性別的節(jié)儉程度。本變量是由消費等級與性別這兩個變量相乘而成,即“不同性別的節(jié)儉程度=活躍度×性別”(其中男生記為0,女生記為1)。學(xué)生性別不同,因此節(jié)儉程度不同。因此將學(xué)生的節(jié)儉程度與學(xué)生性別兩個變量相結(jié)合,由此探究學(xué)生性別不同導(dǎo)致的節(jié)儉程度不同對借閱量的影響。
2.變量確定
從社會科學(xué)和心理學(xué)的角度出發(fā),影響大學(xué)生借書量的因素主要有學(xué)生的學(xué)習(xí)成績等級、重修課程數(shù)、課程數(shù)、周課時數(shù)、節(jié)儉程度、專業(yè)、班級、性別、獎學(xué)金、助學(xué)金、續(xù)借本數(shù)、借書次數(shù)、活躍度、不同節(jié)儉程度的活躍度、不同學(xué)習(xí)成績的活躍度、不同節(jié)儉程度的學(xué)習(xí)成績、不同性別的學(xué)習(xí)成績、不同性別的活躍度、不同性別的節(jié)儉程度這19項。
因此將這些作為回歸模型里的19個自變量,即:X1-學(xué)習(xí)成績等級、X2-重修課程數(shù)、X3-課程數(shù)、X4-周課時數(shù)、X5-節(jié)儉程度、X6-專業(yè)、X7-班級、X8-性別、X9-獎學(xué)金、X10-助學(xué)金、X11-續(xù)借本數(shù)、X12-借書次數(shù)、X13-活躍度、X14-不同節(jié)儉程度的活躍度、X15-不同學(xué)習(xí)成績的活躍度、X16-不同節(jié)儉程度的學(xué)習(xí)成績、X17-不同性別的學(xué)習(xí)成績、X18-不同性別的活躍度、X19-不同性別的節(jié)儉程度。
由于這些數(shù)據(jù)的量綱的影響,度量標準并不統(tǒng)一,因此需要將全部數(shù)據(jù)進行標準化之后再進行多元回歸分析。
以下列多元線性回歸的數(shù)學(xué)模型來表示y與Xi之間存在的非確定線性關(guān)系:
二、基于多元線性回歸的借書量影響因素提取
首先將數(shù)據(jù)進行標準化,然后用輸入法對數(shù)據(jù)進行多元線性回歸分析,其中將借書數(shù)量作為因變量,其他因素作為自變量,最后對結(jié)果進行分析和共線性診斷。[11]以上過程皆利用SPSS軟件完成,部分輸出結(jié)果見表1-表4。
由表1可知,從模型的F檢驗結(jié)果來看,回歸顯著性檢驗的Sig值為0.000,即顯著性概率值小于0.001,表明回歸方程總的效果顯著,即方程是有意義的。[12]
復(fù)相關(guān)系數(shù)R用來描述因變量與自變量之間的線性相關(guān)程度,R越大表明相關(guān)性越好。得到的模型摘要說明了回歸方程的擬合情況。由表2可知,模型中復(fù)相關(guān)系數(shù)R=0.944,決定系數(shù)R2=0.891,表明自變量與因變量的相關(guān)性很好。[13]
但由表3可以看出,偏回歸系數(shù)中有很多是非顯著的,表明它們相應(yīng)的自變量可能對借書數(shù)量沒有顯著影響,因此模型中引入這些變量沒有實際意義。表3中,有7個自變量的VIF(方差膨脹因子)>10(通常VIF≥10,則說明自變量之間存在共線性情況),表4中,有2個自變量的條件指數(shù)>10(通常條件指數(shù)>10,[14]則說明自變量之間存在共線性情況),因此模型中存在多重共線問題。
采用逐步回歸分析方法簡化模型,部分輸出結(jié)果見表5-表7。
表5顯示,模型5復(fù)相關(guān)系數(shù)R=0.940,決定系數(shù)R2=0.884,調(diào)整后的決定系數(shù)R2=0.881,說明選擇的因變量借書數(shù)量與所選的5個自變量之間存在非常密切的線性相關(guān)性。由表6可知,經(jīng)逐步回歸分析,最終確定對因變量借書數(shù)量有顯著影響的自變量為借書次數(shù)、續(xù)借本數(shù)、不同性別的活躍度、不同節(jié)儉程度的活躍度、周課時數(shù)。其中,回歸方程的顯著性檢驗統(tǒng)計量F=251.670,檢驗p<0.05,回歸系數(shù)至少1個不為0,所建立的回歸模型具有統(tǒng)計學(xué)意義。[15]由表7可看出,由于自變量間存在多重共線,逐步回歸方法最終選擇借書次數(shù)、續(xù)借本數(shù)、不同性別的活躍度、不同節(jié)儉程度的活躍度、周課時數(shù)作為預(yù)測變量代替其他變量建立模型,回歸系數(shù)均是顯著的,即所選自變量都是對借書本數(shù)有顯著影響的。B值即為偏相關(guān)系數(shù),因此建立回歸方程為:
y=0.876x12+0.136x11-0.126x18+0.103x14-0.06x4
三、驗證與誤差分析
采用我們建立的上述回歸方程計算借書數(shù)量,再與實際的借書數(shù)量進行對比分析,如圖1所示。從圖1中我們可以看到,此回歸分析預(yù)測值與實際值之間的誤差很小,預(yù)測精度較高。
四、結(jié)論
影響借書數(shù)量的因素共有19個,通過共線性診斷發(fā)現(xiàn)自變量間存在多重共線問題,通過逐步回歸分析最終選擇借書次數(shù)、續(xù)借本數(shù)、不同性別的活躍度、不同節(jié)儉程度的活躍度、周課時數(shù)5個變量建立回歸模型。從模型可以看出,對學(xué)生借閱量貢獻最為明顯的因子是借書次數(shù),其次是續(xù)借本書和不同節(jié)儉程度的活躍度,周課時數(shù)和不同性別的活躍度對借閱量的影響最小。
雖然預(yù)測學(xué)生借閱量的方法可以多種多樣,但本文利用spss多元回歸分析方法進行預(yù)測對數(shù)據(jù)要求較小,建模過程簡單,預(yù)測精度較高,預(yù)測值十分接近真實值,擬合效果很好。所以用該方法預(yù)測學(xué)生借閱量是一種十分可行有效的方法。
同時本文的研究存在一定的局限性。首先,本研究的數(shù)據(jù)來源僅限于山東省某高校的某學(xué)院,受該學(xué)院個性化因素影響較大。僅研究某個學(xué)院的數(shù)據(jù)不具有代表性和權(quán)威性,無法形成對比,進而得到更準確的結(jié)論,因此由該研究得出的結(jié)論是否適用于其他學(xué)院、其他學(xué)校還需要進一步的研究驗證。其次,研究所用的各項數(shù)據(jù)并不全面,無法反映學(xué)生的各種背景信息,如學(xué)習(xí)習(xí)慣、獨立學(xué)習(xí)傾向、學(xué)科偏好等,研究無法根據(jù)全面詳細的信息展開,因此具有一定的局限性。
參考文獻:
[1]張莉.如何提高高職圖書館的借閱量:讀者服務(wù)升級計劃的實踐與啟示[J].大學(xué)圖書館學(xué)報,2010(2):41-44.
[2]陶媛.高職院校圖書館借閱基礎(chǔ)數(shù)據(jù)統(tǒng)計與分析——以某交通類高職院圖書館數(shù)據(jù)為例[J].科教文匯(下旬刊),2017(9):96-97.
[3]布艷艷.高校圖書館紙質(zhì)圖書借書量減少原因及對策淺析[J].科技風(fēng),2015(6):252.
[4]鄒梅.圖書借閱量下降原因及對策[J].吉林工程技術(shù)師范學(xué)院學(xué)報,2013(7):54-55.
[5]李化明.對近幾年高校圖書館借閱量下降之分析[J].農(nóng)業(yè)圖書情報學(xué)刊,2014(9):105-108.
[6]鄭錦輝.如何提高獨立學(xué)院圖書館的圖書借閱量[J].黑龍江教育學(xué)院學(xué)報,2013(4):184-186.
[7]李桂梅,譚小華.高校圖書館圖書借閱量統(tǒng)計分析報告[J].中外企業(yè)家,2009(14):215-216.
[8]孫寶,王志麗,劉琳.基于GM的高校圖書館借閱量預(yù)測模型研究[J].現(xiàn)代情報,2008(4):186-188.
[9]陳明.一元線性回歸模型預(yù)測圖書借閱量[J].大學(xué)教育,2016(5):111-112.
[10]凌茹,劉家望.多元線性回歸構(gòu)建湖南省縣醫(yī)院衛(wèi)生人力和床位預(yù)測模型[J].中南大學(xué)學(xué)報(醫(yī)學(xué)版),2011(12):1206-1212.
[11]于曦.基于Unicorn和SPSS的圖書借閱量周期性分析及預(yù)測[J].山東圖書館學(xué)刊,2011(1):52-56.
[12]周永生,肖玉歡,黃潤生.基于多元線性回歸的廣西糧食產(chǎn)量預(yù)測[J].南方農(nóng)業(yè)學(xué)報,2011(9):1165-1167.
[13]房艷焱,余錦鳳.SPSS在數(shù)字圖書館用戶數(shù)據(jù)分析中的應(yīng)用[J].圖書情報工作,2005(12):89-92.
[14]畢建武,賈進章,劉丹.基于SPSS多元回歸分析的回采工作面瓦斯涌出量預(yù)測[J].安全與環(huán)境學(xué)報,2013(5):183-186.
[15]陳希鎮(zhèn),曹慧珍.判別分析和SPSS的使用[J].科學(xué)技術(shù)與工程,2008(13):3567-3571.
(編輯:王天鵬)