丁春光,張馳,黃志華,梁安健,劉馨陽,李穎
(1.工業(yè)和信息化部電子第五研究所,廣東 廣州 511370;2.工業(yè)裝備質(zhì)量大數(shù)據(jù)工業(yè)和信息化部重點實驗室,廣東 廣州 511370)
隨著人工智能和互聯(lián)網(wǎng)高速發(fā)展,產(chǎn)生了大量的數(shù)據(jù),社會從數(shù)據(jù)匱乏走向數(shù)據(jù)過載階段。如何在海量數(shù)據(jù)中快速精準地找到數(shù)據(jù)消費者(用戶)所關(guān)心數(shù)據(jù),成為數(shù)據(jù)生產(chǎn)者或者數(shù)據(jù)服務(wù)商關(guān)注的問題。在元器件選用領(lǐng)域,同樣面臨海量的電子元器件產(chǎn)品信息,設(shè)計師或物資管理人員如何精準找到合適元器件,快速完成產(chǎn)品的元器件選型,成為急需解決問題。
面臨海量數(shù)據(jù),產(chǎn)生數(shù)據(jù)過載問題,數(shù)據(jù)消費者在海量數(shù)據(jù)中找到所需數(shù)據(jù)變得困難,特別從海量數(shù)據(jù)中獲得有價值的數(shù)據(jù),同時數(shù)據(jù)生產(chǎn)者或者數(shù)據(jù)服務(wù)商如何從海量數(shù)據(jù)中獲得有價值的消費者成為問題解決焦點。為了解決數(shù)據(jù)過載問題,比較有代表性的解決方案是分類目錄和搜索引擎。雅虎是分類目錄方案的代表性公司,谷歌和百度是搜索引擎比較有代表性的公司。但隨著互聯(lián)網(wǎng)規(guī)模不斷擴大,分類目錄的覆蓋性不強,分類過于復雜,無法滿足用戶數(shù)據(jù)需求弊端日益明顯。搜索引擎是基于關(guān)鍵詞檢索數(shù)據(jù),需要用戶主動提供準確的關(guān)鍵詞,當用戶無法主動找到準確地描述自己需求的關(guān)鍵字或提供關(guān)鍵字的信息量不足時,檢索出來的結(jié)果很難反映用戶的潛在需求。分類目錄和搜索引擎只能解決用戶主動查找信息的需求,即用戶知道自己想要什么,并不能解決用戶沒有明確需求的問題。和分類目錄和搜索引擎一樣,推薦系統(tǒng)也是一種幫助用戶快速發(fā)現(xiàn)有用信息,解決數(shù)據(jù)過載問題的解決方案之一。推薦系統(tǒng)不需要主動提供明確的關(guān)鍵詞,而是通過分析用戶歷史行為給用戶建立畫像,從而主動給用戶推薦其所關(guān)心的數(shù)據(jù)。
推薦系統(tǒng)是能找出用戶和物品之間聯(lián)系的信息過濾系統(tǒng)。推薦系統(tǒng)主要有以下兩個顯著的特征。
a)主動性
從用戶角度考慮,不需要用戶提供明確的數(shù)據(jù)需求,能夠自主通過數(shù)據(jù)分析用戶與物品之間的關(guān)聯(lián)數(shù)據(jù)進行建模,為用戶提供可能感興趣的信息。
b)個性化
能夠挖掘冷門但用戶感興趣的信息推薦給用戶。推薦系統(tǒng)已經(jīng)成為人工智能在電子商務(wù)(亞馬遜、淘寶和京東)和社交平臺(抖音和豆瓣)領(lǐng)域最成功的應(yīng)用之一。常見的推薦系統(tǒng)算法如表1 所示。
表1 常見的推薦系統(tǒng)算法 [1]
目前用戶在電子元器件產(chǎn)品目錄或者電子元器件選用平臺選型有兩種方式。一種方式為分類目錄,已經(jīng)知道想要的元器件分類和具體產(chǎn)品參數(shù)指標,按元器件分類樹進行檢索,先選取一個分類,然后按照質(zhì)量等級、封裝形式、外形尺寸和電性能參數(shù)進行多參聯(lián)合篩選找到所需要的元器件產(chǎn)品信息。另一種方式為搜索引擎,知道大體產(chǎn)品型號或者關(guān)鍵參數(shù),以關(guān)鍵詞形式依托搜索引擎進行檢索。兩種選型方式都存在一定局限性,很難從定位、個性和衍生3 個角度滿足用戶需求。方式一需要用戶明確知道自己想要元器件的分類和技術(shù)指標,否則很難進行精確選型。方式二需要用戶知道自己想要元器件產(chǎn)品型號或元器件產(chǎn)品屬性關(guān)鍵詞。但關(guān)鍵詞顆粒度和反映信息量會影響元器件選型結(jié)果,很難定位用戶的最終需求,需要用戶依托自身經(jīng)驗進行進一步篩選以定位到用戶最終想要的產(chǎn)品。
基于推薦系統(tǒng)的元器件智慧選型是通過對元器件產(chǎn)品數(shù)據(jù)進行特征提取建立滿足推薦系統(tǒng)算法要求的基礎(chǔ)特征數(shù)據(jù)庫,依托機器學習相關(guān)算法對產(chǎn)品或廠家進行過濾排序干預,形成最終推薦結(jié)果。通過構(gòu)建元器件智慧選型推薦系統(tǒng),可以精準推薦用戶所關(guān)心元器件產(chǎn)品,彌補分類目錄和搜索引擎在選型精度上的缺陷,提升用戶檢索體驗。智能推薦系統(tǒng)可以從元器件產(chǎn)品定位、滿足個性化需求和滿足衍生需求3 個角度提升元器件選型精準程度和效率。產(chǎn)品定位角度可以幫助用戶快速定位想要選用的元器件產(chǎn)品。滿足個性化需求角度推薦的產(chǎn)品符合用戶自身個性化預期和偏好,如經(jīng)常選用某生產(chǎn)廠家產(chǎn)品。滿足衍生需求角度能夠推薦與該產(chǎn)品相關(guān)配套產(chǎn)品信息,如元器件外圍配套電路信息、選用該產(chǎn)品的用戶還選用了什么產(chǎn)品,幫助用戶完成一體化設(shè)計和選用。元器件智慧選型系統(tǒng)框架圖如圖1 所示。
圖1 元器件智慧選型推薦系統(tǒng)框架圖
推薦系統(tǒng)基于用戶的基本信息、元器件選用信息、用戶對元器件產(chǎn)品偏好和用戶對廠家偏好,用戶對產(chǎn)品或廠家的評論信息、打分信息和用戶瀏覽記錄等行為數(shù)據(jù)進行智能分析,獲取不同用戶選型習慣,形成用戶畫像,推送用戶關(guān)心關(guān)注的、與用戶檢索近似同類周邊的元器件產(chǎn)品,實現(xiàn)元器件的智能推送。標簽化用戶元器件選型步驟和習慣,牽引用戶的科學選型,為用戶提供智能化的元器件選型導航。用戶在選用器件過程中,可根據(jù)器件實際應(yīng)用情況和使用方法等進行評論反饋,評論信息不斷積累、共享,以供其他用戶選型參考[2]。也可以通過自然語言的情感分析,在用戶對該產(chǎn)品的問題評論中獲取對該產(chǎn)品偏好程度。另外針對該產(chǎn)品評分評星也一定程度反映用戶偏好。通過研究用戶的興趣偏好,由智能算法進行個性化計算,發(fā)現(xiàn)用戶關(guān)注點,從而引導用戶發(fā)現(xiàn)需求。
基于設(shè)計需求主要是為了解決傳統(tǒng)“基于經(jīng)驗器件選型” 單一檢索帶來的選型效率低下、效果不佳等問題。通過對數(shù)據(jù)資源庫的數(shù)據(jù)挖掘、數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)建模等技術(shù),建立面向設(shè)計需求的智慧選型模式,實現(xiàn)根據(jù)用戶輸入的器件性能指標、質(zhì)量水平和廠商等需求,進行器件的關(guān)聯(lián)性、相似性和符合性匹配,快速地確定選型方案,同時引入元器件產(chǎn)品畫像,綜合元器件的應(yīng)用歷史、質(zhì)量表現(xiàn)、物資狀態(tài)和使用評價等因素考慮,向用戶推送最優(yōu)元器件。通過數(shù)據(jù)應(yīng)用去指引設(shè)計選型,在選型源頭去幫助我們控制產(chǎn)品的質(zhì)量、成本,最大化規(guī)避后期的質(zhì)量和保障性風險[3]。
相似度算法主要是用于衡量對象之間的相似度,是推薦系統(tǒng)的基礎(chǔ)性算法。在元器件領(lǐng)域判斷一個產(chǎn)品相似性(替代性)主要從產(chǎn)品的基本功能、關(guān)鍵性能參數(shù)、封裝及外形尺寸、質(zhì)量可靠性與環(huán)境適應(yīng)性等幾個方面來綜合考慮[4]。因為元器件產(chǎn)品分類較多,每個分類的技術(shù)指標參數(shù)又不盡相同,不可能將所有參數(shù)都用于相似模型訓練,選取確定每個分類的關(guān)鍵技術(shù)指標參數(shù),通過運用相似度算法,基于元器件技術(shù)參數(shù)建立元器件相似產(chǎn)品關(guān)系,通過模型判斷各元器件之間的相似關(guān)系,綜合計算關(guān)鍵性能參數(shù)重要度和參數(shù)值近似度,建立元器件的關(guān)鍵參數(shù)替代關(guān)系模型,將相關(guān)度從高到低的相似產(chǎn)品推薦給用戶,實現(xiàn)智能替代查找和推送。
關(guān)聯(lián)分析又稱為關(guān)聯(lián)挖掘,它是一種簡單實用的分析技術(shù),用于發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而描述了一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式。通過挖掘各生產(chǎn)廠家手冊建議的外圍電路配置,構(gòu)建常用的外圍電路數(shù)據(jù)庫,基于常用外圍電路圖建立元器件的關(guān)聯(lián)關(guān)系。當用戶選用某個元器件,應(yīng)用關(guān)聯(lián)分析法,從支持度、置信度和提升度,結(jié)合用戶行為考慮某種電路功能,系統(tǒng)智能推送配套元器件給用戶。通過關(guān)聯(lián)分析可以判斷元器件之間的關(guān)聯(lián)密度,用戶選用某個元器件后會自動推薦與之關(guān)系最近的元器件及其配套的外圍電路。
受加劇的中美貿(mào)易戰(zhàn)和新冠疫情影響,各電子行業(yè)企業(yè)都在一段時間內(nèi)出現(xiàn)缺芯危機?;谕扑]系統(tǒng)的元器件智慧選型有助于幫助企業(yè)快速找到其產(chǎn)品所需電子元器件以及可替代的國產(chǎn)元器件方案,對于國家和行業(yè)維護產(chǎn)業(yè)鏈供應(yīng)鏈穩(wěn)定,具有非常重要的作用和意義。本文指出推薦系統(tǒng)在元器件智慧選型中起到重要作用、算法和典型應(yīng)用場景,為后續(xù)基于推薦系統(tǒng)的元器件智慧選型平臺搭建和算法研究奠定了基礎(chǔ)。