薛曉璇
(西安職業(yè)技術(shù)學(xué)院經(jīng)濟(jì)管理學(xué)院,陜西西安 710077)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)信息數(shù)量在迅速增長(zhǎng),以前,網(wǎng)絡(luò)用戶從互聯(lián)網(wǎng)上搜索與內(nèi)容相關(guān)的信息,而現(xiàn)在網(wǎng)絡(luò)用戶根據(jù)自己的實(shí)際需求搜索自己需要的信息,但是從互聯(lián)網(wǎng)的海量信息中獲取最新的、滿足網(wǎng)絡(luò)用戶需求的信息較為困難,是目前需要解決的問(wèn)題之一[1-2]。用戶畫像是指網(wǎng)絡(luò)用戶在瀏覽網(wǎng)站時(shí)會(huì)留下多種網(wǎng)絡(luò)數(shù)據(jù),被互聯(lián)網(wǎng)自動(dòng)識(shí)別并收集,例如網(wǎng)絡(luò)用戶的喜好、生活習(xí)慣、工作職業(yè)、消費(fèi)水平等信息,網(wǎng)絡(luò)平臺(tái)會(huì)針對(duì)網(wǎng)絡(luò)用戶個(gè)人的信息選擇有效的信息數(shù)據(jù)作為標(biāo)簽,然后根據(jù)做成的標(biāo)簽信息構(gòu)建屬于網(wǎng)絡(luò)用戶個(gè)人的抽象模型[3]。各大公司可以根據(jù)網(wǎng)絡(luò)用戶的需求、生活習(xí)慣等對(duì)用戶進(jìn)行有針對(duì)性的推薦,如何有效地利用用戶畫像向用戶進(jìn)行推送,是目前研究的方向。
該文根據(jù)以上有關(guān)用戶畫像推薦系統(tǒng)出現(xiàn)的問(wèn)題,設(shè)計(jì)了基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng),該系統(tǒng)采用了大數(shù)據(jù)聚類的技術(shù),合理構(gòu)建用戶畫像,構(gòu)建自動(dòng)推送模型,從而根據(jù)網(wǎng)絡(luò)用戶個(gè)人的喜好、需求,進(jìn)行有針對(duì)性的智能推送,提高推送信息的效率。
基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的電源電路,必須能快速、有效地調(diào)整單片機(jī)的轉(zhuǎn)速,進(jìn)而使智能推送系統(tǒng)更具有可靠性與實(shí)時(shí)性,在具體設(shè)計(jì)時(shí)需要采用單極性可逆脈沖調(diào)制來(lái)控制推送系統(tǒng)的電源電路,該電路的優(yōu)點(diǎn)是電路運(yùn)行可靠性高,不用添加其他電路,開(kāi)關(guān)頻率高[4-5]。該電源電路的芯片選用TD 公司生產(chǎn)的ST264,該芯片是一種驅(qū)動(dòng)芯片,具有較強(qiáng)的智能控制能力,驅(qū)動(dòng)芯片最大輸出電流為40 A,工作電壓最高達(dá)到60 V,芯片內(nèi)部設(shè)有特殊裝置,能夠高效地保護(hù)電路,例如欠壓、欠流、線損等,對(duì)電源電路控制較簡(jiǎn)單、靈敏。為了使電源電路更加穩(wěn)定,需要降低電流的損耗,提高電源的輸出電壓,所以采用0.1 Ω的電阻,用驅(qū)動(dòng)芯片放大電阻兩端的輸入電壓,共模輸出電壓為1.8~3.3 V,驅(qū)動(dòng)輸出電流為10 mA,工作電壓為20~40 V,電路需要具有良好的開(kāi)關(guān)特性,電路中的功率管在工作時(shí)功耗較小,工作電壓最高為60 V,輸出的直流電流最高為150 A,為了使電源電路更快地實(shí)現(xiàn)串口通信,需要在電源電路中加入電平轉(zhuǎn)換芯片[6-7]。
該文設(shè)計(jì)的電源電路如圖1 所示。
基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的單片機(jī)芯片選用三星公司推出的SFI16F3365,該芯片專門針對(duì)智能推送控制,具有良好的控制能力與A/D 電平轉(zhuǎn)換能力,該文設(shè)計(jì)的單片機(jī)與市場(chǎng)同類單片機(jī)相比,具有較多的優(yōu)勢(shì):具有6 對(duì)互補(bǔ)輸出的功率控制模塊、采樣速度最高達(dá)到305 次每秒、12 位A/D 轉(zhuǎn)換器、輸出電流最高達(dá)40 mA,其次還具有較好的功耗管理方式、高效的振蕩器構(gòu)造[8-10]。單片機(jī)結(jié)構(gòu)如圖2 所示。
圖2 單片機(jī)結(jié)構(gòu)
單片機(jī)整個(gè)構(gòu)造由蓄電池供電,由推送系統(tǒng)的電源電路轉(zhuǎn)換后,傳感器的采樣信號(hào)被送到單片機(jī)的輸出端口,單片機(jī)根據(jù)驅(qū)動(dòng)特性以及大數(shù)據(jù)聚類算法對(duì)傳感器采集的數(shù)據(jù)進(jìn)行分析處理,進(jìn)而確定單片機(jī)工作電流的方向與大小,單片機(jī)通過(guò)采集器傳輸?shù)碾娫纯刂泼钌刹蓸有盘?hào),信號(hào)通過(guò)單片機(jī)的外圍電路控制單片機(jī)的正常工作,在單片機(jī)的外圍電路上設(shè)置電壓傳感器,傳感器將單片機(jī)的輸出電流傳輸?shù)街悄芡扑拖到y(tǒng)的采集器,采集器對(duì)電源電路實(shí)行開(kāi)關(guān)閉環(huán)管理,如果智能推送系統(tǒng)在工作時(shí)出現(xiàn)異常,單片機(jī)的警示燈將進(jìn)行報(bào)警提示[11-12]。
基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的采集器主要由信號(hào)轉(zhuǎn)換器、采集器外圍電路兩部分組成,信號(hào)轉(zhuǎn)換器主要完成采樣信號(hào)的輸入、放大,將轉(zhuǎn)換完成的采樣信號(hào)處理后輸入到采集器的驅(qū)動(dòng)芯片中,該種信號(hào)轉(zhuǎn)換器包括兩路采集通道,1路低頻通道與3 路高頻通道相連,2 路高頻通道與4 路低頻通道相連,3 路高頻通道可以傳輸40~60 kHz 頻段的采樣信號(hào),4 路低頻通道主要傳輸100~400 kHz頻段的采樣信號(hào),各個(gè)通道具有相位一致性的特點(diǎn)。信號(hào)轉(zhuǎn)換器的低頻通道傳輸完成差分過(guò)的差分信號(hào),2 路高頻通道不需要為信號(hào)轉(zhuǎn)換器傳輸差分信號(hào),A/D 轉(zhuǎn)換器與采集器的外圍電路底板相連[13-15]。采集器結(jié)構(gòu)如圖3 所示。
圖3 采集器結(jié)構(gòu)
采集器的外圍電路選用的核心芯片為SIMENSA公司生產(chǎn)的最新系列芯片SIC1286,該芯片可以處理采集器采集的信號(hào)數(shù)據(jù),對(duì)其進(jìn)行控制、傳輸并保存,外圍電路的電路板主要提供外圍電路所需要的電源,把信號(hào)轉(zhuǎn)換器以及采樣數(shù)據(jù)進(jìn)行并列保存、連接,為轉(zhuǎn)換器的串口通信提供輸入接口。采集器的外圍電路也可以完成采樣信號(hào)的轉(zhuǎn)換,外圍電路芯片可支持的最高采樣頻率為256 kHz,支持的最低采樣頻率為64 kHz,中心頻率為2~30 kHz,采集器整體接收輸入信號(hào)的方式設(shè)計(jì)為差分方式,方便對(duì)采樣數(shù)據(jù)的采集與處理。
微處理器主要完成數(shù)據(jù)的處理、存儲(chǔ)和控制,微處理器的芯片選用ST 公司生產(chǎn)的最新芯片SD6528,微處理器設(shè)有網(wǎng)口、USB 以及通信串口接口,通過(guò)與無(wú)線電設(shè)備的連接,實(shí)現(xiàn)對(duì)采集器采集數(shù)據(jù)的預(yù)處理,此外,微處理器處理數(shù)據(jù)的速度由芯片管腳的數(shù)量決定,該文設(shè)計(jì)的微處理器電路如圖4 所 示[16]。
圖4 微處理器電路圖
該文設(shè)計(jì)的基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)采用了大數(shù)據(jù)聚類技術(shù),聚類在信息數(shù)據(jù)挖掘中應(yīng)用較為廣泛,大數(shù)據(jù)聚類可以有效細(xì)分網(wǎng)絡(luò)用戶,發(fā)現(xiàn)網(wǎng)絡(luò)中的可靠信息,搜索網(wǎng)絡(luò)信息中的重要數(shù)據(jù)。在傳統(tǒng)聚類方法中,聚類提出的假設(shè)可以一次性嵌入網(wǎng)絡(luò)數(shù)據(jù)信息中,現(xiàn)在的聚類算法通常屬于迭代型算法,下一步驟的計(jì)算需要使用上一步驟計(jì)算出來(lái)的數(shù)據(jù)結(jié)果。隨著互聯(lián)網(wǎng)數(shù)據(jù)信息迅速增長(zhǎng),計(jì)算機(jī)的容量與計(jì)算能力無(wú)法滿足網(wǎng)絡(luò)用戶對(duì)海量數(shù)據(jù)的計(jì)算需求,需要網(wǎng)絡(luò)平臺(tái)采用分布式算法對(duì)用戶需要的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行并行處理。該文采用大數(shù)據(jù)聚類技術(shù)主要因?yàn)榇髷?shù)據(jù)可以包含網(wǎng)絡(luò)海量信息的結(jié)構(gòu)化數(shù)據(jù),對(duì)用戶的信息需求,可以有針對(duì)性地進(jìn)行分析預(yù)處理,根據(jù)用戶的消費(fèi)行為、瀏覽喜好、生活習(xí)慣等進(jìn)行有效的智能推送,對(duì)用戶需要的網(wǎng)絡(luò)非結(jié)構(gòu)化數(shù)據(jù)以及無(wú)結(jié)構(gòu)化數(shù)據(jù)能夠較快處理,且存儲(chǔ)網(wǎng)絡(luò)信息數(shù)據(jù)的容量非常巨大。
按照用戶喜歡的類型給用戶推送內(nèi)容,是基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)運(yùn)行的主要目的,智能推送的流程如圖5 所示。
圖5 智能推送流程
首先對(duì)用戶喜好的數(shù)據(jù)進(jìn)行采集與處理。采集用戶的消費(fèi)行為、瀏覽網(wǎng)站或者生活習(xí)慣等行為數(shù)據(jù),將這些行為數(shù)據(jù)作為系統(tǒng)軟件分析的數(shù)據(jù),用戶通過(guò)自己安裝的瀏覽器軟件瀏覽網(wǎng)站的相關(guān)內(nèi)容,企業(yè)根據(jù)網(wǎng)絡(luò)平臺(tái)上傳輸?shù)挠脩粜袨閿?shù)據(jù),按照推送的方式反映給用戶,用戶根據(jù)系統(tǒng)軟件提供的相關(guān)信息,進(jìn)行選擇性地瀏覽以及購(gòu)買。用戶被網(wǎng)絡(luò)平臺(tái)采集的數(shù)據(jù)信息多種多樣,包括用戶的性別、職業(yè)、生活習(xí)慣、地理位置、年齡等,網(wǎng)絡(luò)將這些信息數(shù)據(jù)統(tǒng)一封包整理,匯總到系統(tǒng)軟件的服務(wù)器,通過(guò)數(shù)據(jù)集成、清洗、變換、簡(jiǎn)化4 種預(yù)處理數(shù)據(jù)的方式對(duì)這些用戶數(shù)據(jù)進(jìn)行處理。
然后整理用戶數(shù)據(jù)做成標(biāo)簽。標(biāo)簽類似一種特殊符號(hào),整理用戶畫像,用戶的行為數(shù)據(jù)被采集完成后,匯總到對(duì)應(yīng)的標(biāo)簽中,用戶標(biāo)簽包含用戶位置標(biāo)簽、習(xí)慣標(biāo)簽、興趣愛(ài)好標(biāo)簽等。
最后系統(tǒng)軟件對(duì)用戶實(shí)現(xiàn)個(gè)性化推送。對(duì)用戶個(gè)人數(shù)據(jù)采集并處理完后,做成標(biāo)簽,根據(jù)用戶標(biāo)簽準(zhǔn)確預(yù)測(cè)用戶的個(gè)人需求,在數(shù)據(jù)庫(kù)中為用戶推送感興趣的內(nèi)容,實(shí)現(xiàn)個(gè)性化用戶推送。
為了驗(yàn)證該文提出的基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的有效性,與傳統(tǒng)系統(tǒng)進(jìn)行實(shí)驗(yàn)對(duì)比。得到的提取時(shí)間實(shí)驗(yàn)結(jié)果如表1 所示。
表1 提取時(shí)間實(shí)驗(yàn)結(jié)果
推送準(zhǔn)確率如圖6 所示。
圖6 推送準(zhǔn)確率實(shí)驗(yàn)結(jié)果
該文設(shè)計(jì)的基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng),采用了大數(shù)據(jù)聚類技術(shù),有效地將用戶行為數(shù)據(jù)統(tǒng)一地整理并進(jìn)行處理,提高了整理用戶行為數(shù)據(jù)的速度,時(shí)效性較強(qiáng)。智能推送系統(tǒng)的硬件包括電源電路、采集器、微處理器與單片機(jī),各種硬件分工合作,使智能推送系統(tǒng)較容易地實(shí)現(xiàn),提高了基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)的安全性與可靠性,對(duì)用戶畫像進(jìn)行有針對(duì)性的采集、分析與處理,并做成對(duì)應(yīng)的標(biāo)簽信息,標(biāo)簽信息可以包括用戶的位置、性別、年齡等數(shù)據(jù),使推送給用戶的個(gè)性化信息內(nèi)容更具有針對(duì)性與準(zhǔn)確性,能更準(zhǔn)確地預(yù)測(cè)用戶的行為愛(ài)好與生活習(xí)慣,為用戶提供更滿意的個(gè)性化服務(wù),采用軟硬件的環(huán)境,突出了個(gè)性化服務(wù)對(duì)用戶的重要性,使基于大數(shù)據(jù)聚類的用戶畫像提取與智能推送系統(tǒng)更具特色[17]。
該文基于大數(shù)據(jù)聚類設(shè)計(jì)了用戶畫像提取與智能推送系統(tǒng),通過(guò)互聯(lián)網(wǎng)建立用戶畫像與標(biāo)簽體系,通過(guò)采集用戶行為數(shù)據(jù),利用大數(shù)據(jù)聚類將行為數(shù)據(jù)進(jìn)行分類并做成對(duì)應(yīng)的標(biāo)簽,提高了用戶行為數(shù)據(jù)的整合性。根據(jù)用戶的習(xí)慣愛(ài)好,預(yù)測(cè)用戶可能喜好的網(wǎng)絡(luò)信息內(nèi)容,提高了智能推送系統(tǒng)的工作效率,使系統(tǒng)更具有準(zhǔn)確性與可靠性。軟硬件的設(shè)計(jì)環(huán)境,使推送系統(tǒng)更具安全性,根據(jù)用戶已經(jīng)安裝的系統(tǒng)軟件,建立可以實(shí)現(xiàn)網(wǎng)絡(luò)信息提取與智能發(fā)送的模型,使系統(tǒng)的個(gè)性化推送內(nèi)容更周到、全面、細(xì)致,用戶對(duì)智能發(fā)送的滿意度最高,進(jìn)而可以更好地為有需求的用戶進(jìn)行畫像。