蔡樺 張莉 李斌 譚瑤
(湖南應(yīng)用技術(shù)學(xué)院,湖南常德 415000)
如今,耳機已經(jīng)是人們生活中的一個必需品。隨著科技與經(jīng)濟的發(fā)展,人們的生活水平提高,人們對于耳機的需求增加,對于耳機性能方面具有強烈要求。本文則以現(xiàn)有的耳機產(chǎn)品為創(chuàng)新基礎(chǔ),研究一款集人體感應(yīng)與語音識別為一體的新型耳機——數(shù)字化耳機。數(shù)字化耳機可以解決忘關(guān)音樂、歌曲不合心意等問題,使耳機更符合當(dāng)代信息技術(shù)的發(fā)展,與時俱進,并讓使用者感受大數(shù)據(jù)時代數(shù)字化耳機帶來的便捷[1]。
市場上現(xiàn)有的耳機花式多樣,各有優(yōu)勢,不盡完美。根據(jù)2018年的年度報告,JEET AirPlus藍(lán)牙耳機憑借其連接方便,適用性廣,攜帶便利,配置高,音質(zhì)穩(wěn)定等因素迅速火爆,但這款耳機適用消費人群狹窄,對于工薪階層消費人群來說有一定壓力,數(shù)字化耳機則是在此基礎(chǔ)上實現(xiàn)性價比更高的耳機,從而符合消費需求。
市場上還有許多琳瑯滿目的產(chǎn)品,中國工廠憑借制造工藝上的優(yōu)勢,加強技術(shù)端投入,進而開發(fā)自主品牌。交叉銷售的耳機產(chǎn)品都成為各大廠商發(fā)展的主要延伸方向,蘋果、華為、小米、魅族等知名智能終端廠商紛紛推出了自有品牌的耳機產(chǎn)品。通過搭載藍(lán)牙技術(shù),進行無線傳輸數(shù)據(jù),智能耳機能夠和智能手機等移動終端緊密協(xié)同工作,擁有接聽電話、智能運動追蹤、GPS導(dǎo)航等功能。智能耳機相對于傳統(tǒng)耳機音質(zhì)更佳,攜帶方便,外觀更加美觀。但現(xiàn)在市場上所存在的耳機還是存在很多的不足,續(xù)航性不強,經(jīng)常出現(xiàn)使用電量不足的問題,甚至還有連接性的問題,如連接設(shè)備出錯,導(dǎo)致聲音突然外放等。
數(shù)字化耳機是一款由觸感和聲音控制組成的智能耳機,可以根據(jù)語音識別系統(tǒng)來切換模式,可以根據(jù)消費者的喜好來推薦合適的音樂,更可以通過人體感應(yīng)達到人忘關(guān)音樂時自動關(guān)機,節(jié)約電量的效果[2]。
數(shù)字化耳機外觀以市場上較火爆的藍(lán)牙耳機外觀為基礎(chǔ),分別有電源按鈕、通話按鈕、充電口、LED指示燈、音量/靜音按鈕等基礎(chǔ)部件。在此基礎(chǔ)上,數(shù)字化耳機增加兩大功能區(qū)——人體感應(yīng)功能區(qū)和語音識別功能區(qū),分別實現(xiàn)人體感應(yīng)技術(shù)與語音識別技術(shù)。初步設(shè)想圖如圖1。
圖1 初步設(shè)想圖Fig.1 Preliminary plan
2.2.1 人體感應(yīng)技術(shù)
數(shù)字化耳機使用的人體感應(yīng)技術(shù)主要是由紅外傳感器所實現(xiàn)。人體感應(yīng)技術(shù)對數(shù)字化耳機進行控制感應(yīng)的原理如下,人體是一特定波長紅外線的發(fā)射體,由傳感處理電路通過壓力傳感器、紅外溫度感應(yīng)傳感器檢測是否有人使用耳機并對用戶使用狀態(tài)信號予以處理后,向系統(tǒng)發(fā)送模擬信號,系統(tǒng)通過分析檢測后,作出相應(yīng)的反應(yīng)控制耳機。此人體感應(yīng)技術(shù)與人體紅外感應(yīng)開關(guān)技術(shù)相類似,主要器件為人體熱釋電紅外傳感器,人體都有恒定的體溫,一般在36°~37°,所以會發(fā)出特定波長的紅外線,根據(jù)探測人體發(fā)射的紅外線進行工作。人體感應(yīng)器流程圖如圖2。
圖2 人體感應(yīng)流程圖Fig.2 Human body induction flow chart
當(dāng)傳感器檢測到有人的時候,系統(tǒng)控制耳機播放音樂;當(dāng)傳感器檢測到?jīng)]人的時候,五分鐘內(nèi)系統(tǒng)控制耳機暫停音樂;當(dāng)傳感器檢測到超過五分鐘還沒有人的時候,系統(tǒng)控制耳機自動關(guān)機。
2.2.2 語音識別技術(shù)
語音識別系統(tǒng)構(gòu)建過程主要包括訓(xùn)練和識別兩個部分[3]。
訓(xùn)練,即對預(yù)先收集好的海量語音、語言數(shù)據(jù)庫進行信號處理和知識挖掘,獲取語音識別系統(tǒng)所需要的聲學(xué)模型和語言模型,數(shù)字化耳機則可在訓(xùn)練時獲取“推薦模式”和“學(xué)習(xí)模式”等詞。
識別,即對用戶實時的語音進行自動識別,識別過程又可以主要分為前端和后端兩個模塊,前端模塊主要作用是端點檢測,去除多余的靜音和非說話聲,降噪,特征提取等,后端模塊的作用是利用訓(xùn)練好的聲學(xué)模型和語言模型對用戶所說的話進行模式識別。語音識別基本原理如圖3。
圖3 語音識別基本原理Fig.3 Basic principles of speech recognition
簡單來說,用戶首先輸入語音,通過數(shù)字化耳機傳輸至系統(tǒng),系統(tǒng)對輸入的語音進行預(yù)處理,然后提取語音的特征,在此基礎(chǔ)上建立語音識別所需的模塊。然后系統(tǒng)在識別過程中根據(jù)語音識別模型,將計算機中存放的語音模塊與輸入的語音信號特征進行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入語音匹配的模塊。最后,系統(tǒng)給出識別結(jié)果,給數(shù)字化耳機下達指令。
2.2.3 推薦模式技術(shù)
推薦模式里,系統(tǒng)所做的工作分為四個部分:音樂分類、建立用戶模型、尋找相似用戶和推薦歌單。推薦模式技術(shù)流程圖如圖4所示。
圖4 推薦模式流程圖Fig.4 Recommended mode flowchart
音樂分類:系統(tǒng)從用戶開始聽歌起就不斷地收集用戶信息,然后將用戶播放過的歌曲進行分類。
建立用戶模型:根據(jù)用戶播放某種風(fēng)格歌曲次數(shù),確定用戶喜歡的風(fēng)格,這樣就可以給用戶建立一個初步模型。系統(tǒng)后臺需要根據(jù)用戶聽歌日常,不斷計算分析用戶喜好風(fēng)格,實現(xiàn)用戶信息更新。
尋找相似用戶:比較所有用戶的信息,將喜歡同種風(fēng)格的用戶集合起來,為不同的風(fēng)格匹配到相似用戶。
推薦歌單:分兩種形式,從相似用戶層面推薦歌單和系統(tǒng)從單個用戶層面推薦歌單。前者是將喜歡相似風(fēng)格的用戶歌單進行比較,然后向雙方推薦對方所沒有的歌曲;后者是系統(tǒng)通過用戶自身播放歌曲,分析出用戶喜好風(fēng)格,然后從同種風(fēng)格歌曲中選取若干推送給用戶。
數(shù)字化耳機的推薦模式技術(shù)需要通過協(xié)同過濾算法來實現(xiàn),協(xié)同過濾簡單來說是利用興趣相投、擁有共同經(jīng)驗之群體的喜好來推薦用戶感興趣的信息。系統(tǒng)過濾算法主要分為收集用戶信息、最近鄰搜索及產(chǎn)生推薦結(jié)果三大部分。
簡單來說,數(shù)字化耳機所需的協(xié)同過濾算法主要分為兩類:基于用戶與基于項目(單曲)。
基于用戶:系統(tǒng)統(tǒng)計所有的用戶信息,根據(jù)建立的用戶模型,集合相似的用戶,然后雙方推薦對方喜歡的歌曲。如A用戶與B用戶收藏的歌單相似度很高,那么在判斷A用戶與B用戶口味相似的基礎(chǔ)上,可以給A用戶推薦B用戶收藏歌單里他所沒有收藏的歌曲,同樣,也可以給B用戶推薦A用戶收藏歌單里他所沒有收藏的歌曲。
基于項目(單曲):將用戶對一首歌的偏好作為向量計算單曲之間的相似度,比對相似度后,根據(jù)這個用戶歷史偏好為另一位用戶推薦單曲。即系統(tǒng)在用戶使用耳機聽歌日常中,根據(jù)用戶聽歌曲目、聽歌時長以及播放次數(shù),不斷地收集分析,判斷用戶的喜好風(fēng)格,然后在同種風(fēng)格中選取歌曲推薦給用戶。
2.2.4 后期技術(shù)
后期技術(shù)主要包括圖形圖像編輯、Coreldraw以及H5秀三個方面。
圖形圖像編輯技術(shù)用于設(shè)計數(shù)字化耳機樣圖,主要用到的軟件為Adobe Photoshop。
Coreldraw主要用于設(shè)計標(biāo)志。該圖像軟件是一套屢獲殊榮的圖形圖像編輯軟件,它包含兩個繪圖應(yīng)用程序:一個用于矢量圖及頁面設(shè)計,一個用于圖像編輯。
H5秀用于推廣耳機。制作H5秀的主要軟件為秀米,H5是針對于移動端的一種營銷應(yīng)用方式,可以制作集文字、圖片、音樂等信息形式于一身的展示頁面,非常適合用于手機傳播。
當(dāng)今市場上大多耳機都為單調(diào)、刻板的風(fēng)格,忽視了人們的消費需求。因此,數(shù)字化耳機則從消費者心理需求等方面對市場上已有耳機進行改造。
首先,數(shù)字化耳機所推出的人體感應(yīng)功能符合當(dāng)代市場發(fā)展潮流,體現(xiàn)了數(shù)字化時代人類在產(chǎn)品上的進步,方便了消費者。同時,這種感應(yīng)技術(shù)成本較低性價比較高,迎合了消費者的求實心理。數(shù)字化耳機的人體感應(yīng)功能還能夠控制耳機在人忘關(guān)耳機時控制耳機自動關(guān)機,節(jié)約了耳機的電池電量,符合當(dāng)今時代消費者的節(jié)約能源,綠色消費心理。
其次,數(shù)字化耳機所具有的語音識別功能可以進入學(xué)習(xí)模式和推薦模式兩大模塊。語音識別功能的學(xué)習(xí)模式功能能夠幫助喜歡聽歌的學(xué)習(xí)者盡快進入學(xué)習(xí)狀態(tài),避免學(xué)習(xí)者受到外界環(huán)境的干擾;語音識別功能的推薦模式則更能根據(jù)消費者的喜好給消費者推薦單曲,在無形之中滿足了消費者的需求。
數(shù)字化耳機是從當(dāng)今時代發(fā)展出發(fā)、從消費者需求出發(fā),從而達到產(chǎn)品與人之間的互動的一種產(chǎn)品。我們所期待的數(shù)字化耳機是在市場已有耳機的基礎(chǔ)上給人們帶來情感上的共鳴,以及為之動情的設(shè)計。
現(xiàn)代主義設(shè)計過分注重理性與功能,忽視人的情感,因此市場上已有的智能耳機,還是存在很多不足。它遵循的設(shè)計理念是功能主義,而數(shù)字化耳機在這基礎(chǔ)上更加注重的是人的情感需求。數(shù)字化耳機是集音質(zhì)、美感等為一體的多功能耳機。數(shù)字化耳機的產(chǎn)生一定會進一步推動中國耳機市場的發(fā)展,且數(shù)字化耳機在實現(xiàn)無線傳輸立體聲信號,提高連接效率和穩(wěn)定性,提升音質(zhì)的同時,還極大地提升了耳機的續(xù)航能力。由于數(shù)字化耳機的便攜性優(yōu)勢和聲控功能,消費者對數(shù)字化耳機的需求將會不斷增長,相信在不久的將來數(shù)字化耳機一定會在移動娛樂、移動辦公、運動健身等多個應(yīng)用場景下普及。