梁琨 趙金銘 高明輝 楊晨 鞏秀鋼
摘? 要:幼兒期是智力發(fā)展的黃金期,在這時期兒童的大部分知識能力都是從玩耍中得到的。本篇論文針對上述情況,開發(fā)了一套激發(fā)兒童學習興趣、提高兒童認知能力的早教系統(tǒng)。該系統(tǒng)主要由攝像頭模塊、語音模塊組成,利用攝像頭捕捉物體關鍵信息,由服務器對圖像進行處理,以線性回歸算法對采集的數(shù)據(jù)進行分析,預測兒童的興趣,同時,該系統(tǒng)具備與兒童進行簡單交互的功能。
關鍵詞:智能早教系統(tǒng);兒童興趣;語音識別;圖像信息處理
中圖分類號:TN931.3;TP311.1? ? ?文獻標識碼:A 文章編號:2096-4706(2019)09-0184-03
0? 引? 言
學齡前期,幼兒的神經(jīng)纖維的發(fā)育逐步完善,對外界的各種刺激的傳導更為準確迅速,這個時期是兒童智力發(fā)展的關鍵時期,此時的學齡前教育對于開發(fā)兒童的智力十分重要。目前,學前教育市場持續(xù)穩(wěn)定增長,早教系統(tǒng)所占的市場份額也在不斷增加。然而,內(nèi)容交互能力差、功能匱乏、自學習能力差已成為目前市場早教系統(tǒng)的主要瓶頸。因此,在本篇文章中設計了一套結(jié)合視頻、語音對話等于一體,通過機器視覺,興趣預測,提升孩子認識世界的能力,激發(fā)孩子的學習興趣的輔助早教系統(tǒng)。同時,本系統(tǒng)能夠使家長及時了解孩子的興趣愛好并能夠適時地加以引導,為孩子創(chuàng)造發(fā)展的空間,將兒童的興趣轉(zhuǎn)變?yōu)橄鄳哪芰Α?/p>
1? 國內(nèi)外研究現(xiàn)狀
我國早教行業(yè)于1998年開始起步,相較于歐美我國早教行業(yè)起步較晚,目前國內(nèi)早教市場主要被如美國的金寶貝、美吉姆等早教機構(gòu)所占領,而這些早教機構(gòu)的早期教育服務是以教授課程為主。這些早教機構(gòu)一般監(jiān)管不到位且收費較高,存在一些安全隱患,如2018年紅黃藍早教機構(gòu)發(fā)生的虐童現(xiàn)象。對比這些早教機構(gòu),目前國內(nèi)早教系統(tǒng)發(fā)展現(xiàn)狀并不樂觀,這些早教系統(tǒng)主要具備兒童故事機、遠程監(jiān)控、視頻通話等功能,并不能幫助父母分析兒童的興趣愛好,為孩子創(chuàng)造更好的發(fā)展空間;而國外早教行業(yè)主要是以學前教育的方式讓孩子通過自己的探索得到知識,并不能及時發(fā)現(xiàn)兒童的興趣,減少了孩子與家長之間的互動。美國兒科學會認為家庭的硬件設備配置、媒介素養(yǎng)教育與嬰幼兒的媒介接觸行為呈顯著相關(一半以上的孩子最初接觸媒介是受家中大人影響)[1]。可見,家庭對嬰幼兒的媒介接觸指導對嬰幼兒媒介素養(yǎng)有直接且重要的影響[1]。
2? 系統(tǒng)組成
本系統(tǒng)主要由攝像頭模塊、語音模塊、平臺網(wǎng)站組成。系統(tǒng)的總體構(gòu)成如圖1所示。
系統(tǒng)通過攝像頭對物體進行捕獲,將所得的圖像信息上傳至服務器端,服務器端對圖像信息進行處理,依據(jù)圖像模型進行物體識別,若運行平臺網(wǎng)頁,早教視頻播放模塊會實時切換至兒童所感興趣的物體。同時,主程序會對相關數(shù)據(jù)進行收集,對兒童感興趣的物體利用物體分類模型進行聚類,通過線性回歸算法預測出兒童的興趣。
3? 系統(tǒng)硬件設計
3.1? 圖像采集模塊
圖像采集模塊通過攝像頭捕捉圖像信息,用樹莓派控制模塊的運行。當服務器傳來拍照命令時,樹莓派操縱攝像頭捕捉圖像信息,將其保存在樹莓派的存儲卡中。待服務器端準備好相應的存儲空間后,圖片將以流的形式發(fā)送至服務器端,進行相應的處理,具體過程如圖2所示。
3.2? 語音模塊
交互機器人內(nèi)部有一塊Arduino單片機,用來連接LD3320語音合成模塊、YS-XFS5152語音識別模塊和ESP 8266 Wi-Fi模塊。
當孩子對機器人說話時,機器人內(nèi)部的語音識別模塊進行語音的讀取,基于大量的語音模型分析,將輸入的語音特征向量序列轉(zhuǎn)化成詞序列并輸出。語音數(shù)據(jù)被Arduino處理為指定命令后,經(jīng)Wi-Fi模塊發(fā)送至服務器端,服務器根據(jù)收到的命令做出響應。若接收到對話的指令,服務器會將指定的內(nèi)容進行GBK編碼后發(fā)送至Arduino,通過語音合成模塊進行語音播報,具體流程如圖3所示。
4? 系統(tǒng)軟件設計
4.1? 服務器端處理邏輯
當服務器接收到來自Arduino的命令時,首先對其進行解析,若為對話指令,則將相應的文本進行GBK編碼后發(fā)送至Arduino;若為物體識別指令,服務器端向樹莓派發(fā)送相應的命令,等待圖像信息回傳,圖像傳輸完畢后,對其進行物體識別。服務器端會將物體信息處理為相應的對話文本后傳輸至Arduino。同時,相應的信息經(jīng)處理后會保存在數(shù)據(jù)庫中,以供“興趣預測”功能調(diào)用,具體服務器端處理器邏輯流程如圖4所示。
4.3? 平臺網(wǎng)頁
4.3.1? 早教視頻播放
若用戶使用平臺網(wǎng)站,早教視頻頁面將基于物體識別進程返回的結(jié)果播放相應的視頻。
具體實現(xiàn)方法為:當服務器端進行物體識別后,會以Post形式向后臺的Servlet發(fā)送對應的JSON字串,此時,進程中的監(jiān)聽器會對JSON字串進行解析,修改Servlet中的物體ID。
與此同時,Web端通過Ajax技術不斷地向后臺Servlet請求物體ID,當檢測到物體ID變化后,與此物體ID對應的早教視頻會進行實時切換。
4.3.2? 歷程記錄
兒童的瀏覽記錄會實時保存在數(shù)據(jù)庫中,并在網(wǎng)頁中進行顯示,以便家長參考。
具體流程為:當主進程中得到物體識別子進程返回的有效物體信息后,首先對物體名稱表進行遍歷,若該表中存在此物體名稱,物體接觸次數(shù)會自動加一,同時物體對應的名稱與此時的時間戳會保存在歷程表中;若物體名稱表中不存在該物體的名稱,物體名稱表會新增加一列,并賦予該物體一個ID,同時物體對應的名稱與此時的時間戳會保存在歷程表中。
當家長訪問相應的Web頁面時,最新的十條記錄將被顯示,若家長期望獲取孩子接觸物體的全部記錄,可以點擊更多進行數(shù)據(jù)的調(diào)取。
4.3.3? 興趣預測
后臺程序會提取數(shù)據(jù)庫中兒童感興趣的物品進行聚類,為了保證數(shù)據(jù)的可維護性,使用大量的中文文本進行相關模型的訓練,以保證后續(xù)增加的物體存在對應的分類。
隨后程序根據(jù)兒童接觸這些物體的次數(shù)與時間,基于線性回歸算法對兒童的興趣做出預測。具體實現(xiàn)方法為:每次運行興趣預測頁面時,會向后臺數(shù)據(jù)庫請求兒童接觸物體的次數(shù)c與接觸該物體的最大時間戳t,基于c、t與興趣的正反關系進行線性回歸處理,得出某個物體對應的興趣值,對分類相同的物體乘以相應的權(quán)值進行累加,計算各個分類數(shù)值,結(jié)果最大的作為兒童的興趣輸出,同時,所有的分類結(jié)果會以圖表的形式顯示在平臺網(wǎng)頁,如圖5所示,以便家長及時了解孩子的興趣愛好,給予孩子正確的引導。
5? 結(jié)? 論
該系統(tǒng)打破了傳統(tǒng)玩具的局限性,結(jié)合圖像、網(wǎng)頁、語音對話等于一體,通過物體識別、簡單對話、視頻播放等方式,拓寬兒童的視野,激發(fā)兒童的學習興趣;同時,本系統(tǒng)能夠使家長及時了解孩子的興趣愛好等相關信息,為家長提供相應的教育建議,實現(xiàn)教育服務的私人定制。
當然,該系統(tǒng)在后續(xù)時間內(nèi)需要進行不斷的完善,圖像識別模型的物體種類需要進一步添加,興趣預測算法中各個物體的種類權(quán)重、時間、次數(shù)變量的參數(shù)也需要根據(jù)后期獲取的數(shù)據(jù)不斷調(diào)整,以保證最終結(jié)果的可靠性。
參考文獻:
[1] 我是唯一的康總.國內(nèi)早教市場研究?國外早教市場研究? [EB/OL].https://www.jianshu.com/p/5b10b27a58bf? utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation,2018-01-29.
[2] JNingWei.論文閱讀:RetinaNet [EB/OL].https://blog.csdn.net/JNingWei/article/details/80038594,2018-04-22.
作者簡介:梁琨(1998.01-),男,漢族,山東臨沂人,本科,研究方向:計算機科學與技術;趙金銘(1998.03-),女,漢族,山東日照人,本科,研究方向:通信工程;高明輝(1998.05-),男,漢族,山東威海人,本科,研究方向:軟件工程;楊晨(1996.04-),女,漢族,山東濰坊人,碩士研究生,研究方向:檢測與控制技術、嵌入式系統(tǒng)及應用;通訊作者:鞏秀鋼(1970.08-),男,漢族,山東淄博人,計算機系主任,副教授,博士,研究方向:嵌入式系統(tǒng)與物聯(lián)網(wǎng)技術。