国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合多維情境信息的移動讀者畫像研究

2024-01-09 16:54:00習(xí)海旭
關(guān)鍵詞:畫像圖書館融合

習(xí)海旭

(1.江蘇理工學(xué)院計(jì)算機(jī)工程學(xué)院,江蘇常州 213001;2.南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院,江蘇南京 210094)

隨著移動互聯(lián)網(wǎng)的深入發(fā)展,讀者借助于手機(jī)和平板為代表的移動智能終端可隨時(shí)隨地、高效便捷地獲取豐富多樣的圖書資源,享受更適應(yīng)信息和互動需求與偏好的圖書館移動服務(wù)。為了提升圖書館移動服務(wù)的個(gè)性化和人性化水平,對移動讀者信息需求與偏好進(jìn)行建模的移動讀者畫像技術(shù)值得深入研究。移動圖書館用戶畫像簡稱移動讀者畫像,目的是抽取移動圖書館用戶的各種數(shù)據(jù),生成描述用戶的標(biāo)簽集合[1]。通過移動讀者畫像,能夠準(zhǔn)確地掌握移動讀者的信息需求和行為偏好,為其提供易用、滿意的圖書館移動服務(wù)以及個(gè)性化的推薦服務(wù)。

大多數(shù)的移動讀者畫像研究主要通過用戶自然屬性、歷史訪問、交互行為和社會交往等信息來定義和表示需求與偏好模型[2-3]。隨著研究的深入,研究者發(fā)現(xiàn)在移動環(huán)境下,讀者的需求偏好會隨著情境因素而動態(tài)變化[4],借助移動智能終端豐富的硬件資源和強(qiáng)大的計(jì)算資源,實(shí)時(shí)捕獲讀者在使用圖書館服務(wù)時(shí)的狀態(tài)信息,進(jìn)行特定情形下的情境信息建模,從而引起學(xué)術(shù)界廣泛的研究興趣。例如,習(xí)海旭等[5]使用本體表示方法構(gòu)建包含位置、環(huán)境光線等信息的情境模型,實(shí)現(xiàn)借閱、閱讀、發(fā)現(xiàn)和監(jiān)控等移動圖書館的情境感知服務(wù);程秀峰等[6]設(shè)計(jì)包含自然、偏好、情境和社交4 個(gè)維度的標(biāo)簽體系,構(gòu)建基于用戶畫像的智慧參考咨詢服務(wù);李亞梅[7]分析了科學(xué)研究過程中的情境要素,構(gòu)建了一個(gè)通用的科研情境模型,生成帶行為權(quán)值的情境化主題偏好,并推薦了科技文獻(xiàn)。

面對復(fù)雜、多維、動態(tài)和易變的讀者個(gè)性化信息需求[8],基于情境信息的移動讀者畫像存在兩大問題:一是針對不同的應(yīng)用如何選擇畫像時(shí)所需考慮的情境信息;二是如何對所獲取的不同情境信息進(jìn)行權(quán)重融合,以構(gòu)建精確的用戶模型。已有研究基于各類圖書館移動服務(wù)的不同特點(diǎn),構(gòu)建了相應(yīng)的融入情境信息的用戶畫像模型。但大多數(shù)研究只對不同的感知數(shù)據(jù)賦予主觀權(quán)重以確定情境狀態(tài),而對不同類別情境信息之間的融合權(quán)重考慮不多,未形成一種成熟和完善的、基于多維情境信息融合的移動讀者畫像方法,無法充分體現(xiàn)圖書館的個(gè)性化移動服務(wù)。本研究在全面考慮不同應(yīng)用服務(wù)中移動智能設(shè)備感知信息的基礎(chǔ)上,深入探討移動讀者畫像方法,嘗試構(gòu)建一種多維度情境信息融合的移動讀者畫像模型。

1 基于情境的移動讀者畫像屬性

移動圖書館要提供多樣化的移動服務(wù)和內(nèi)容推薦,以滿足不同用戶的圖書館服務(wù)需求;需要描述具備哪些基本屬性的用戶傾向于使用什么樣的方式獲取哪些圖書館服務(wù),且在信息閱讀時(shí)有哪些閱讀行為習(xí)慣。在此基礎(chǔ)上,刻畫不同情境信息對服務(wù)偏好和資源偏好的影響,形成融入多樣化情境的移動圖書館用戶動態(tài)畫像。

1.1 移動讀者畫像屬性的分類

如圖1 所示,移動讀者畫像屬性主要分為3類:第1 類是讀者基本屬性,包括年齡、性別、地域、職業(yè)和教育程度等,反映了讀者的基本需求。第2 類是讀者偏好屬性,包括讀者在圖書館服務(wù)類型、圖書館資源內(nèi)容上的不同喜好。移動讀者一般通過主動和被動2 種方式獲得數(shù)字資源、在線參考咨詢、空間預(yù)定、學(xué)術(shù)、活動、小組支持以及信息素養(yǎng)提升等圖書館服務(wù);以不同的閱讀習(xí)慣,使用不同學(xué)科、主題或關(guān)鍵詞分類下的數(shù)字資源內(nèi)容。第3 類是讀者情境信息。廣義上,與移動讀者相關(guān)的情境信息包括讀者基本屬性、身心狀態(tài)、歷史行為,圖書館資源與服務(wù),物理環(huán)境與社會文化環(huán)境相關(guān)的多維度信息;狹義上,情境信息是用戶狀態(tài)以及周圍環(huán)境對用戶需求與偏好產(chǎn)生影響的補(bǔ)充信息,主要包括物理情境和虛擬情境兩類[9]。用戶狀態(tài)包括用戶姿態(tài)運(yùn)動等身體狀態(tài)和人格特質(zhì)等心理狀態(tài);周圍環(huán)境包括物理?xiàng)l件、服務(wù)條件和活動、事件以及社交與文化環(huán)境等。

圖1 融入情境的移動讀者畫像屬性

這3類讀者畫像屬性之間相互關(guān)聯(lián),影響著移動讀者的圖書資源與服務(wù)需求。一方面,不同基本屬性的讀者存在不同的資源和服務(wù)需求。例如,不同研究方向的學(xué)者關(guān)注的是相應(yīng)主題的學(xué)術(shù)文獻(xiàn);年輕人傾向看書,而老年人傾向于聽書。另一方面,不同的情境信息會對移動讀者的資源與服務(wù)偏好產(chǎn)生不同程度的影響。例如,因喜歡某個(gè)圖書館App 的閱讀休息提示功能,而選擇使用該App;在新冠疫情期間,有關(guān)個(gè)人衛(wèi)生保健的書籍被大量閱讀等。再一方面,移動讀者在若干典型的服務(wù)或閱讀場景下,會有不同的信息和服務(wù)偏好,而這些應(yīng)用場景往往又是情境信息的不同組合。例如,在研究工作場景下,人們傾向于主動獲取學(xué)術(shù)領(lǐng)域的圖書資源和學(xué)術(shù)支持服務(wù),且閱讀的專注時(shí)間較長;旅途閑暇場景下,人們傾向于碎片化閱讀小說和被動地獲取相關(guān)推薦資訊。

1.2 多源畫像屬性集成的技術(shù)架構(gòu)

移動讀者畫像屬性的類別多樣,數(shù)據(jù)來源及其獲取與處理方法存在一定差異。首先,不同類型屬性數(shù)據(jù)的主要提取方法存在一定差異;其次,不同類型屬性數(shù)據(jù)分布在各類圖書館服務(wù)應(yīng)用系統(tǒng)中,需選擇合適的多源異構(gòu)數(shù)據(jù)集成方法進(jìn)行融合處理;最后,不同圖書館服務(wù)應(yīng)用采用在線或離線的方式提取和處理畫像屬性,以滿足不同響應(yīng)速度的需要。

如圖2 所示,多源畫像屬性融合技術(shù)架構(gòu)包括數(shù)據(jù)提取方法、集成方法和統(tǒng)一分析平臺3 個(gè)部分。

圖2 多源畫像屬性集成的技術(shù)架構(gòu)

1.2.1 數(shù)據(jù)提取方法

移動讀者基本屬性的提取一般在正則表達(dá)式匹配定位信息標(biāo)簽后,解析其屬性值,并使用數(shù)據(jù)接口工具,對不同業(yè)務(wù)管理系統(tǒng)中的服務(wù)和資源信息進(jìn)行抽取、清洗和同步;移動讀者偏好屬性來源于用戶使用圖書館服務(wù)的顯性歷史記錄和隱性操作交互,主要采用自定義數(shù)據(jù)采集應(yīng)用程序或使用第三方SDK,對讀者的行為操作和記錄進(jìn)行數(shù)據(jù)采點(diǎn);采集移動讀者情境信息時(shí),采用基于ACQUA和Jigsaw框架的數(shù)據(jù)采集程序在低能耗和低資源的情況下持續(xù)采集傳感器數(shù)據(jù)。

1.2.2 數(shù)據(jù)集成方法

針對不同結(jié)構(gòu)的數(shù)據(jù),采用不同的數(shù)據(jù)集成方法。在結(jié)構(gòu)化數(shù)據(jù)集成中,周期性地將關(guān)系型數(shù)據(jù)批量進(jìn)行分析、轉(zhuǎn)換和裝載,形成統(tǒng)一完備的Hadoop數(shù)據(jù);在非結(jié)構(gòu)數(shù)據(jù)的集成中,實(shí)時(shí)收集日志數(shù)據(jù),緩沖寫入Hadoop數(shù)據(jù)中。

1.2.3 數(shù)據(jù)統(tǒng)一分析平臺

使用HDFS儲存方案,將轉(zhuǎn)換后的各類數(shù)據(jù)存儲在大數(shù)據(jù)系統(tǒng)Hadoop中,分別使用Hive分布式數(shù)據(jù)庫進(jìn)行離線數(shù)據(jù)處理和Hbase 分布式數(shù)據(jù)庫進(jìn)行在線數(shù)據(jù)處理,即時(shí)數(shù)據(jù)也可以使用消息隊(duì)列(Kafka)進(jìn)行實(shí)時(shí)流處理和分析。其中,離線數(shù)據(jù)處理使用MapReduce 任務(wù)完成,在線數(shù)據(jù)使用Spark/Flink框架實(shí)時(shí)處理。

2 移動讀者多維度情境信息融合

2.1 情境信息的融合類型

按照不同的層次,移動讀者多維度情境信息融合包括3種類型:數(shù)據(jù)層次的傳感器數(shù)據(jù)融合,用于確定讀者與環(huán)境狀態(tài);信息層次的情境信息推理融合,用于確定讀者高級情境與圖書館服務(wù)場景;應(yīng)用層次的情境信息權(quán)重融合,用于確定情境信息影響移動讀者偏好的重要程度。

2.1.1 確定讀者與環(huán)境狀態(tài)的數(shù)據(jù)融合

分別融合移動智能終端的傳感器數(shù)據(jù)以及服務(wù)應(yīng)用系統(tǒng)中的相關(guān)數(shù)據(jù),消除基于單個(gè)傳感器數(shù)據(jù)進(jìn)行決策的不確定性,獲得感知對象和環(huán)境當(dāng)前狀態(tài)的全面且連貫的統(tǒng)一描述[10],如表1所示。

表1 通過情境數(shù)據(jù)融合獲得讀者與環(huán)境的狀態(tài)

由表1 可知:通過融合GPS、加速度計(jì)、藍(lán)牙、NFC、接近傳感器等傳感器數(shù)據(jù),獲得移動讀者室內(nèi)外、短距離和接近位置等的地點(diǎn)信息;通過陀螺儀、磁力計(jì)等傳感器數(shù)據(jù)獲得讀者身體姿態(tài)信息;通過融合光傳感器、麥克風(fēng)和攝像頭等傳感器數(shù)據(jù),獲得讀者環(huán)境條件信息等。與讀者相關(guān)的虛擬環(huán)境情境信息大多直接集成相關(guān)數(shù)據(jù),而不需要融合。

2.1.2 確定讀者服務(wù)場景的推理融合

通過對一定持續(xù)時(shí)間范圍內(nèi)讀者與環(huán)境狀態(tài)的情境信息分析,能夠推理出讀者或環(huán)境狀態(tài)的高級情境信息[11],即讀者使用圖書館服務(wù)時(shí)所處的當(dāng)前應(yīng)用場景。例如,讀者以恒定速度持續(xù)發(fā)生位置變化,可推理出讀者正在行走等。如表2所示,通過不同類型的情境信息的融合推理,可以刻畫出讀者使用圖書館移動服務(wù)時(shí),讀者身心狀態(tài)、所處物理環(huán)境和虛擬環(huán)境狀態(tài)3個(gè)方面的應(yīng)用場景。

表2 通過情境信息融合獲得讀者當(dāng)前應(yīng)用場景

2.1.3 高級情境信息的權(quán)重融合

讀者在使用圖書館移動服務(wù)時(shí),需求與偏好受到多維度的情境信息或應(yīng)用場景的影響,但不同情境信息對其產(chǎn)生的影響程度存在一定的差異。例如,相對于研究者,大學(xué)生讀者對學(xué)術(shù)論文的偏好程度與時(shí)間階段情境信息關(guān)系較大,而受其他情境信息的影響不大,如大學(xué)生在畢業(yè)設(shè)計(jì)期間對學(xué)術(shù)論文的需求激增。因此,圍繞不同讀者的特定需求與偏好,定義相關(guān)情境信息對不同讀者特定需求與偏好的影響,按照不同權(quán)重融合情境信息,刻畫讀者對不同情境信息的感知度,從而為讀者提供精準(zhǔn)的信息與服務(wù)推薦。

2.2 情境信息的融合方法

不同類型的情境信息融合,使用不同抽象層次的情境信息,采用不同的融合方法分別實(shí)現(xiàn)數(shù)據(jù)融合、融合分類和融合決策等功能[12]。

2.2.1 傳感器數(shù)據(jù)的融合方法

多傳感器數(shù)據(jù)融合直接對同質(zhì)的傳感器原始數(shù)據(jù)進(jìn)行了融合。首先,對數(shù)據(jù)進(jìn)行清洗、時(shí)間對齊和空間對齊。其中,數(shù)據(jù)清洗主要使用中位值平均濾波法如公式(1)和(2)所示,消除異常與噪聲數(shù)據(jù);時(shí)間對齊是同步具有不同采樣率和時(shí)間延遲的各類傳感器數(shù)據(jù);空間對齊是對齊具有不同空間位置或方向的各類傳感器數(shù)據(jù)。接著,使用卡爾曼濾波算法,將不同傳感器測量的同一參數(shù)的不同值進(jìn)行融合。

其中:yi是某時(shí)刻的傳感器測量值,i=0,1,…,N; max( )yi?yi;min(yi)?yi。

2.2.2 高級情境信息推理的融合方法

多傳感器的融合分類是對多源異質(zhì)傳感器數(shù)據(jù)進(jìn)行特征提取,通過模式識別、推理,獲得讀者或環(huán)境相關(guān)的高級情境信息。包括:傳統(tǒng)的模板方法、聚類算法、分類模型以及神經(jīng)網(wǎng)絡(luò)方法和深度學(xué)習(xí)方法,其中決策樹、SVM以及LSTM、CNN是深度學(xué)習(xí)方法的典型代表。傳統(tǒng)機(jī)器學(xué)習(xí)方法中特征提取方法和分類模型是影響高級情境信息推理有效性和精確度的兩個(gè)關(guān)鍵因素。深度學(xué)習(xí)方法主要由模型自動提取特征并進(jìn)行融合推理分類,是目前的主流方法,例如多層LSTM模型[13]、基于多頭注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型[14]和基于GCN的神經(jīng)網(wǎng)絡(luò)模型[15]。

2.2.3 情境感知服務(wù)的融合方法

面向圖書館移動情境感知服務(wù)的融合決策是對多種明確的讀者及其環(huán)境狀態(tài)進(jìn)行信息融合,以合適的方式提供符合當(dāng)前情境下的資源和功能服務(wù);包括加權(quán)決策法、貝葉斯推理法和信任函數(shù)理論等。其中,加權(quán)決策是對不同情境信息的影響力賦予權(quán)重系數(shù)后,進(jìn)行算數(shù)平均;貝葉斯推理首先賦予不同的先驗(yàn)信念,通過訓(xùn)練集得到各自的條件概率,然后融合得到總體的后念概率分布,最后得到觀測數(shù)據(jù)的融合結(jié)果;信任函數(shù)理論通過信度函數(shù)描述情境信息與決策之間的關(guān)系,通過似然度函數(shù)描述情境信息的可靠性和權(quán)重,通過似然度函數(shù)和信任函數(shù)的乘積,得到證據(jù)的證據(jù)權(quán)重,合成多個(gè)證據(jù)的證據(jù)權(quán)重可得到?jīng)Q策的證據(jù)權(quán)重。證據(jù)合成如公式2所示:

3 融合情境信息的移動讀者畫像

融合情境信息的移動讀者畫像可全面刻畫移動讀者的特征、需求與偏好及其當(dāng)前狀態(tài)和環(huán)境,以更好地理解讀者并提供滿足其個(gè)性化需求的圖書館移動情境感知服務(wù)。畫像過程是在對不同類型的屬性數(shù)據(jù)進(jìn)行采集、處理、集成和分析融合的基礎(chǔ)上,構(gòu)建細(xì)粒度的讀者、資源和服務(wù)標(biāo)簽,并通過可視化工具展示出移動讀者的畫像模型。

3.1 移動讀者屬性標(biāo)簽化

采用不同的方式對讀者、服務(wù)與資源的屬性進(jìn)行標(biāo)簽化處理,主要包括屬性值直接轉(zhuǎn)換、統(tǒng)計(jì)分段標(biāo)簽和數(shù)據(jù)挖掘分類3種方法。如圖3所示,讀者年齡分段標(biāo)簽為兒童、少年、中青年和老年;讀者性別、職業(yè)、功能服務(wù)和閱讀平臺等屬性值直接作為標(biāo)簽;資源內(nèi)容分類可分別使用主題分析方法和實(shí)體抽取方法抽取關(guān)鍵詞后,作為標(biāo)簽或直接使用中圖分類進(jìn)行標(biāo)識;服務(wù)方式偏好按照用戶是否檢索轉(zhuǎn)化為主動、被動兩類;按照樣本統(tǒng)計(jì)結(jié)果,根據(jù)閱讀頻率、時(shí)間和時(shí)長劃分成涉獵型讀者、專業(yè)型讀者,根據(jù)閱讀方式劃分為泛讀讀者、精讀讀者,根據(jù)交互閱讀劃分為活躍用戶、沉默用戶等;前述方法融合而得的各層級情境信息按讀者狀態(tài)、物理環(huán)境和虛擬環(huán)境3類,標(biāo)注其取值對服務(wù)內(nèi)容和使用習(xí)慣等偏好的影響程度,表示為<情境屬性、情境信息值、功能內(nèi)容/方式習(xí)慣、偏好概率>。

圖3 融合情境信息的移動讀者畫像標(biāo)簽體系

3.2 畫像模型表示與可視化

使用向量的形式表示移動讀者畫像模型,以方便基于畫像的情境感知服務(wù)應(yīng)用中移動讀者相似度的計(jì)算,向量表示為<基礎(chǔ)信息,功能偏好,方式偏好,內(nèi)容偏好,習(xí)慣偏好,情境信息對偏好的影響向量>。為了可視化畫像模型,可使用Tag-Cloud等開源標(biāo)簽可視化工具,以不同權(quán)重大小的方式呈現(xiàn)讀者標(biāo)簽;為了詳細(xì)展示閱讀時(shí)長,可采用柱狀圖;展示內(nèi)容偏好,可采用雷達(dá)圖;展示情境信息對偏好的影響,可使用echarts插件,以堆積圖的形式表示等。

4 移動讀者的情境信息融合畫像實(shí)證研究

本文選擇高校讀者對象進(jìn)行融合情境信息的移動閱讀行為畫像實(shí)證研究,詳細(xì)展現(xiàn)了讀者畫像結(jié)果的表現(xiàn)形式,并對畫像質(zhì)量進(jìn)行問卷調(diào)查評價(jià)。

4.1 移動讀者情境信息的數(shù)據(jù)來源

由于讀者畫像涉及用戶隱私數(shù)據(jù)采集,開展面向大規(guī)模移動讀者,尤其是公眾讀者的實(shí)證研究會遇到各種現(xiàn)實(shí)條件限制,操作難度較大。因此,本研究以小范圍內(nèi)的高校讀者為對象,驗(yàn)證本文提出的基于情境信息融合的移動讀者畫像研究方法。征得36位讀者(20位數(shù)字媒體技術(shù)專業(yè)本科生,10 位機(jī)電產(chǎn)品檢測與智能控制專業(yè)碩士,6位計(jì)算機(jī)專業(yè)大學(xué)教師)的授權(quán),在他們手機(jī)和電腦上安裝了系統(tǒng)數(shù)據(jù)采集工具和傳感器數(shù)據(jù)采集工具,實(shí)時(shí)采集他們在2022年1月15日至2023年2月1日期間,使用微信讀書應(yīng)用時(shí)的行為數(shù)據(jù)以及活動和環(huán)境狀態(tài)數(shù)據(jù),這些數(shù)據(jù)通過因特網(wǎng)實(shí)時(shí)傳輸并保存到Hadoop大數(shù)據(jù)系統(tǒng)中。

4.2 移動讀者情境信息統(tǒng)計(jì)示例

選擇某個(gè)高校教師讀者的基本信息、移動閱讀內(nèi)容偏好、習(xí)慣偏好數(shù)據(jù)以及對偏好有影響的高級情境信息進(jìn)行數(shù)據(jù)統(tǒng)計(jì),展現(xiàn)了移動讀者畫像中多維情境信息的詳細(xì)內(nèi)容。

4.2.1 讀者基本信息

該移動讀者性別男,地址江蘇常州,會員注冊時(shí)間為2019年3月12日,職業(yè)是高校教師,教育程度為博士研究生。

4.2.2 讀者閱讀內(nèi)容偏好

在近一年內(nèi),該讀者閱讀過36本書籍,書籍題材從中圖法分類來看,涉及歷史小說、經(jīng)濟(jì)理財(cái)和電子技術(shù);從主題分類來看,涉及明清歷史、人物傳記、股票基金、Web技術(shù)、深度學(xué)習(xí);從內(nèi)容實(shí)體分類來看,涉及“當(dāng)年明月”等作者實(shí)體、“鄧小平”等主人公實(shí)體、“三體”等科技實(shí)體、“SpringCloud”和“圖神經(jīng)網(wǎng)絡(luò)”等方法實(shí)體。

4.2.3 讀者閱讀習(xí)慣偏好

近一年內(nèi),該讀者大部分是使用APP 閱讀軟件,有時(shí)使用平板和電腦,總共閱讀時(shí)長4 031 h 31 min,閱讀天數(shù)168 d,按照最新國民閱讀統(tǒng)計(jì)報(bào)告,該讀者屬于閱讀愛好者。該讀者閱讀筆記共有423 條,分布在大多數(shù)書籍中,屬于精讀讀者。讀者讀完29本書,完成率較高,且專業(yè)書籍閱讀時(shí)長最長,屬于專業(yè)型讀者;訂閱數(shù)只有2本,大部分是查詢和檢索獲得圖書,屬于主動閱讀者;關(guān)注讀者數(shù)3人,贊過的書籍和內(nèi)容數(shù)量都小于平均數(shù),屬于沉默用戶。

4.2.4 高級情境信息的影響

近一年內(nèi),該讀者看書時(shí)間一般集中在非工作日,一天內(nèi)看書的時(shí)間主要集中在午間和睡前時(shí)間,工作時(shí)間看書較少且主要看電子技術(shù)類書籍;躺著和通勤狀態(tài)下看的書大多是歷史、小說類,工作狀態(tài)下看經(jīng)濟(jì)、電子技術(shù)類書籍的概率較大,在行走時(shí)幾乎不看書;在2022 年7 月~12月,看過新冠病毒預(yù)防與保健相關(guān)書籍。由此,分別計(jì)算出躺著、通勤狀態(tài)下對歷史小說主題的偏好影響概率分別為0.83 和0.81,工作狀態(tài)下對電子技術(shù)類書籍的偏好影響概率為0.78,經(jīng)濟(jì)類書籍的為0.12,特定事件情境對內(nèi)容偏好的影響概率為0.89。此外,用戶活動狀態(tài)對閱讀時(shí)長的影響概率為0.81,對交互閱讀方式的影響概率為0.73。讀者所處時(shí)間階段(開學(xué)、課題申報(bào)等時(shí)段)對閱讀頻率影響概率為0.87。文字大小、屏幕尺寸、網(wǎng)絡(luò)環(huán)境、環(huán)境光線等情境信息對自動橫屏、自動亮度等閱讀輔助功能的偏好影響概率為0.79,而位置和社交對閱讀內(nèi)容和方式的影響不大。

4.3 移動讀者情境信息融合畫像示例

綜合上述畫像數(shù)據(jù),繪制了該高校教師可視化畫像。如圖4所示,圖4(b)、4(c)的取值都按照統(tǒng)計(jì)值進(jìn)行了歸一化處理。由圖4(d)可知,假定在Covid-19 公共衛(wèi)生事件發(fā)生期間,為該讀者推薦Covid-19 相關(guān)圖書和其它(Others)相關(guān)圖書的概率計(jì)算過程,見公式(4)和(5)所示:

4.4 移動讀者調(diào)查問卷的數(shù)據(jù)分析

本文采用調(diào)查問卷的形式對36位高校讀者畫像質(zhì)量進(jìn)行人工評價(jià)。

4.4.1 問卷設(shè)計(jì)

在繪制了所有移動讀者的畫像之后,要求讀者對各自畫像中閱讀內(nèi)容、習(xí)慣偏好和高級情境對偏好影響等信息進(jìn)行評分。問卷共有12 道題,每題采用Likert五分量表法計(jì)分。每類信息包含4道題,分別衡量該類信息的易理解與一致性兩個(gè)方面,每個(gè)方面含一組正向題目和反向題目。所有正反向題目都將順序打亂,避免同類正反向題目之間相互影響。

4.4.2 畫像質(zhì)量的調(diào)查結(jié)果

對不同題項(xiàng)的主觀評分進(jìn)行統(tǒng)計(jì)計(jì)算,得出如圖5 所示的箱形圖,轉(zhuǎn)換后得到百分制,平均分為80.96分,且95%的置信區(qū)的評分誤差為3.43,即在95%的置信度下,畫像結(jié)果得分在79.246 和82.676之間。

圖5 高校讀者畫像質(zhì)量問卷得分

進(jìn)一步分析發(fā)現(xiàn),讀者對閱讀內(nèi)容畫像評分普遍高于其他兩類信息;碩士生和高校教師讀者對畫像的自我認(rèn)識一致性較高,而本科生則普遍認(rèn)為閱讀習(xí)慣方面的標(biāo)簽吻合度有一定的差異,情境信息對偏好的影響與畫像吻合度較高。

5 結(jié)語

本文劃分了不同類別情境信息之間的融合類型,提出了一種結(jié)合信任函數(shù)理論和情境感知影響力的多維情境信息融合方法。在此基礎(chǔ)上,對移動讀者畫像的屬性構(gòu)成、屬性數(shù)據(jù)的采集和集成技術(shù)框架進(jìn)行了探討,最終系統(tǒng)地構(gòu)建了一種基于多維情境信息融合的移動讀者畫像方法,為移動圖書館的個(gè)性化服務(wù)奠定了技術(shù)基礎(chǔ)。由于數(shù)據(jù)隱私的限制,本研究沒有采集大量讀者的閱讀行為數(shù)據(jù),只以幾個(gè)用戶為例進(jìn)行了畫像實(shí)證,但也能夠在一定程度上體現(xiàn)本方法的有效性,后續(xù)在條件允許的情況下可以進(jìn)一步增加數(shù)據(jù)量,進(jìn)行方法有效性的可靠性研究。本研究實(shí)證只涉及使用頻率教高的移動閱讀服務(wù),沒有對其他圖書館移動服務(wù)的畫像服務(wù)研究,雖然不同服務(wù)類型受不同的情境感知信息影響,但畫像方法和服務(wù)類型的變化關(guān)系很小。此外,基于情境信息融合的用戶畫像的圖書館移動服務(wù)個(gè)性化推薦值得進(jìn)一步研究。

猜你喜歡
畫像圖書館融合
威猛的畫像
村企黨建聯(lián)建融合共贏
融合菜
從創(chuàng)新出發(fā),與高考數(shù)列相遇、融合
“00后”畫像
畫像
《融合》
圖書館
飛躍圖書館
去圖書館
壶关县| 乐昌市| 汉源县| 丹寨县| 大新县| 上犹县| 务川| 大冶市| 南皮县| 赤水市| 马边| 沛县| 岳西县| 冷水江市| 盘锦市| 镇江市| 赣州市| 慈利县| 安仁县| 芦溪县| 建平县| 永康市| 北辰区| 杭锦旗| 宾川县| 申扎县| 德安县| 托克托县| 乐至县| 河间市| 双峰县| 阿拉善左旗| 漾濞| 霍林郭勒市| 尼木县| 土默特右旗| 东方市| 囊谦县| 北宁市| 延边| 板桥市|