摘 要:本研究旨在探討銀行業(yè)中人工智能電話客服系統(tǒng)的用戶體驗(yàn)優(yōu)化,利用梯度學(xué)習(xí)的集成模型對數(shù)據(jù)進(jìn)行擬合,預(yù)測客戶滿意度。通過收集銀行業(yè)應(yīng)用智能AI真實(shí)數(shù)據(jù),本文使用了隨機(jī)森林模型和梯度提升模型,結(jié)合它們的優(yōu)勢來提高模型的性能。本文分析了模型的擬合效果和預(yù)測準(zhǔn)確性,并觀察了數(shù)據(jù)的基本特征以及模型的決策邊界、擬合響應(yīng)面和預(yù)測結(jié)果。試驗(yàn)結(jié)果顯示,集成模型在預(yù)測客戶滿意度方面表現(xiàn)出了很高的準(zhǔn)確性和可靠性,能夠有效優(yōu)化銀行業(yè)電話客服系統(tǒng)的用戶體驗(yàn)。未來的研究將繼續(xù)改進(jìn)模型,以提高服務(wù)質(zhì)量和用戶滿意度。
關(guān)鍵詞:銀行業(yè);人工智能;智能客服;用戶體驗(yàn)
中圖分類號:TP 18" " " " " " " " " " " " 文獻(xiàn)標(biāo)志碼:A
目前,隨著智能語音技術(shù)的飛速發(fā)展,其在融媒體應(yīng)用中的應(yīng)用場景和模式創(chuàng)新備受關(guān)注。張楷越對智能語音技術(shù)在融媒體中的應(yīng)用進(jìn)行了深入剖析[1]。王晰巍等通過調(diào)查用戶虛擬在線體驗(yàn),探討了AI語音助手的影響因素[2]。從用戶體驗(yàn)的視角,陳積銀等研究了人工智能視頻生產(chǎn)平臺的使用效果[3],而陳曦和宮承波在場景理論的視野下,深入探討了智能音頻用戶體驗(yàn)?zāi)P蚚4]。人工智能技術(shù)在融媒體體驗(yàn)中的其他方面也得到了廣泛關(guān)注。徐延章以廣電融媒體設(shè)計模型為基礎(chǔ),解讀了人工智能與融媒體的交融[5]。顏洪等通過情感交互設(shè)計,深入研究了人工智能語境下的情感交互[6]。本文旨在研究使用梯度學(xué)習(xí)的集成模型進(jìn)行數(shù)據(jù)擬合,以優(yōu)化銀行業(yè)中人工智能電話客服系統(tǒng),提高用戶體驗(yàn)。
1 模型概述
1.1 隨機(jī)森林
隨機(jī)森林是一種基于決策樹的集成學(xué)習(xí)算法。決策樹是一種樹形結(jié)構(gòu),其中,每個非葉子節(jié)點(diǎn)為一個特征屬性的判斷,每個葉子節(jié)點(diǎn)為一種類別或者數(shù)值。在隨機(jī)森林中,通過隨機(jī)選擇樣本和特征來構(gòu)建多棵決策樹,并通過投票或平均值來綜合多棵樹的預(yù)測結(jié)果。
決策樹如公式(1)所示。
(1)
式中:x為樣本;h(x)為決策樹模型對樣本的預(yù)測值;M為弱分類器的數(shù)量;N為葉子節(jié)點(diǎn)的數(shù)量;Ri為第i個葉子節(jié)點(diǎn)的區(qū)域;wi為該葉子節(jié)點(diǎn)的預(yù)測值;I為指示函數(shù),用于表示樣本x是否屬于第i個葉子節(jié)點(diǎn)的區(qū)域Ri。
在隨機(jī)森林中,通過隨機(jī)選擇特征來構(gòu)建每棵樹,以增加模型的多樣性。最終的隨機(jī)森林模型如公式(2)所示。
(2)
式中:N1為隨機(jī)森林中樹的數(shù)量;hj(x)為第j棵樹的預(yù)測結(jié)果;f(x)為隨機(jī)森林模型對樣本的預(yù)測值。
1.2 梯度提升
在模型中,將客戶滿意度作為目標(biāo)變量y,而等待時長w和通話時長t則作為特征變量。本文的目標(biāo)是學(xué)習(xí)一個函數(shù)f(w,t),使其能夠準(zhǔn)確地預(yù)測客戶滿意度y2。為了實(shí)現(xiàn)這個目標(biāo),本文使用了梯度提升算法來訓(xùn)練集成模型。
梯度提升是一種迭代的集成學(xué)習(xí)算法,通過迭代地訓(xùn)練一系列弱學(xué)習(xí)器,每個學(xué)習(xí)器都在上一個學(xué)習(xí)器的殘差上進(jìn)行訓(xùn)練。最終的模型是所有弱學(xué)習(xí)器的加權(quán)和。
梯度提升算法通過迭代地擬合殘差來逐步優(yōu)化模型。在第i輪迭代中,假設(shè)當(dāng)前模型的預(yù)測結(jié)果為fi-1,則第i個弱分類器被訓(xùn)練來擬合當(dāng)前模型的殘差,如公式(3)所示。
ri=y1-fi-1 (3)
式中:r為殘差;y1為預(yù)測結(jié)果。
然后,更新模型如公式(4)所示。
fi=fi-1+γihi (4)
式中:γi為學(xué)習(xí)率,控制每次迭代更新的步長;fi為更新后的模型預(yù)測值;fi-1為更新前的舊模型預(yù)測值;hi為弱分類器對樣本x特征的預(yù)測結(jié)果。
通過迭代地添加弱分類器,并根據(jù)殘差進(jìn)行模型更新,最終得到一個在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好的集成模型,可以用于預(yù)測客戶滿意度。
1.3 集成模型
本文提出的集成模型基于梯度學(xué)習(xí),其核心思想是通過組合多個弱分類器(例如決策樹、隨機(jī)森林和梯度提升樹)來構(gòu)建一個更強(qiáng)大的模型,以提高預(yù)測的準(zhǔn)確性和魯棒性。本文提出的模型如公式(5)所示。
(5)
式中:f1(x)為最終的集成模型;M為弱分類器的數(shù)量;γm為第m個弱分類器的權(quán)重;hm(x)為第m個弱分類器的預(yù)測結(jié)果。
通過梯度學(xué)習(xí)的方式,迭代優(yōu)化模型參數(shù),使集成模型能夠最大化擬合訓(xùn)練數(shù)據(jù),從而提高預(yù)測的準(zhǔn)確性。在訓(xùn)練過程中,使用損失函數(shù)來衡量預(yù)測值與真實(shí)值之間的差距,并通過梯度下降法來更新模型參數(shù),以最小化損失函數(shù)。優(yōu)化目標(biāo)如公式(6)所示。
(6)
式中:N為訓(xùn)練樣本的數(shù)量;L為損失函數(shù);yi為第i個樣本的真實(shí)值;f(xi)為模型對第i個樣本的預(yù)測值。
集成模型通過組合不同的弱學(xué)習(xí)器,并通過梯度學(xué)習(xí)的方式優(yōu)化模型參數(shù),對銀行業(yè)中人工智能電話客服系統(tǒng)用戶體驗(yàn)進(jìn)行有效預(yù)測。
2 模型性能
2.1 模型設(shè)置
本文使用了銀行業(yè)人工智能電話客服真實(shí)數(shù)據(jù)(N=1000)對模型的性能進(jìn)行測試。本文所使用的模型包括隨機(jī)森林模型和梯度提升模型。其中,由500個決策樹組成的隨機(jī)森林模型用于回歸問題,即預(yù)測客戶滿意度。由500個弱學(xué)習(xí)器組成的梯度提升模型使用了最小二乘提升算法(LSBoost),并進(jìn)行了500輪訓(xùn)練。
本文利用了兩個不同模型的優(yōu)勢,結(jié)合它們的預(yù)測結(jié)果以提高模型的性能。由于隨機(jī)森林和梯度提升模型處理數(shù)據(jù)時采用了不同的策略,因此它們的預(yù)測結(jié)果可能會提供互補(bǔ)的信息。尤其是當(dāng)面對真實(shí)世界的復(fù)雜數(shù)據(jù)時,這樣的集成方法通常有助于提高模型的魯棒性和泛化能力。
為了評估模型的性能,本文將使用銀行業(yè)真實(shí)數(shù)據(jù)進(jìn)行測試,并比較單個模型和集成模型的預(yù)測結(jié)果。本文使用常見的性能指標(biāo),例如均方根誤差(RootMeanSquareError,RMSE)和決定系數(shù)(CoefficientofDetermination,R2)來評估模型的擬合效果和預(yù)測準(zhǔn)確性。通過比較模型在測試數(shù)據(jù)上的表現(xiàn),能夠評估集成模型相對于單個模型的優(yōu)勢,并確定其在銀行業(yè)電話客服系統(tǒng)用戶體驗(yàn)優(yōu)化中的效果。通過比較模型預(yù)測的客戶滿意度與實(shí)際調(diào)查結(jié)果,評估模型的性能。
2.2 數(shù)據(jù)基本特征
由圖1可知,等待時長和通話時長與客戶滿意度之間存在一定的關(guān)系。
通話時間的分布較為集中,大部分通話時長在70s~140s,說明在這個范圍內(nèi)的通話時長較為常見。然而,也存在少量通話時長較短或較長的情況,這可能受到客戶需求、問題復(fù)雜度等因素的影響。人工智能客服對處理特定問題的復(fù)雜度和耗時情況基本穩(wěn)定,因此不同類型和復(fù)雜度的問題可能會導(dǎo)致通話時長變化。一些簡單的問題可能解決很快,通話時長較短,而一些復(fù)雜的問題可能需要更長的時間來解決,導(dǎo)致通話時長較長。
客戶在通話前的等待時間約為9s,這表明大部分客戶等待時間較短。然而,本文也觀察到一些客戶等待時間較長,最長為15s。等待時間過長可能會使客戶對服務(wù)質(zhì)量和解決方案的準(zhǔn)確性有很高期望,因此引入人工智能客服而非人工客服時降低了客戶滿意度,需要進(jìn)一步關(guān)注和改善AI與人工客服的切換。與此同時,人工智能電話客服系統(tǒng)本身的技術(shù)問題或系統(tǒng)故障也可能影響等待時長和通話時長。如果系統(tǒng)出現(xiàn)故障或者技術(shù)問題,就可能會導(dǎo)致等待時間延長或者通話過程中中斷,導(dǎo)致客戶滿意度降低。
客戶滿意度評分主要集中在五分,這說明大多數(shù)客戶對銀行業(yè)電話客服系統(tǒng)的服務(wù)表示滿意。然而,也有部分客戶選擇了三分,少量客戶選擇了四分、二分和一分。這些低分可能反映了客戶在服務(wù)過程中遇到的問題或不滿意的地方,需要重點(diǎn)關(guān)注和改進(jìn),以提高整體用戶體驗(yàn)。
圖2展示了模型的決策邊界,這是指模型在特征空間中劃分不同類別或預(yù)測值的邊界。對本文的模型來說,決策邊界表明了模型對客戶滿意度的預(yù)測邊界,即不同特征值下模型對客戶滿意度的預(yù)測結(jié)果。
通過觀察決策邊界的形狀和位置,本文可以深入了解模型對不同特征值的預(yù)測結(jié)果以及模型在不同區(qū)域的表現(xiàn)。
在銀行業(yè)電話客服系統(tǒng)中,通話時長和等待時長是影響客戶滿意度的重要因素。因此,本文將重點(diǎn)關(guān)注這兩個特征對決策邊界的影響。可以觀察到,隨著通話時間的延長,客戶普遍選擇較高的評分。如果系統(tǒng)的語音識別準(zhǔn)確性高,那么客戶能夠更快地完成通話,從而縮短通話時長。反之,如果語音識別存在誤解,就可能導(dǎo)致通話時長延長。然而,等待時長較長使客戶評價下降。特別是通話時長在30s~50s的客戶對等待時間更敏感,更易因?yàn)榈却龝r間較長而選擇較低的滿意度評分。因?yàn)榈却龝r間較長會讓客戶感到不悅,所以影響了其對服務(wù)的整體評價。
因此,通過觀察決策邊界,本文可以更清晰地了解模型對不同特征值的預(yù)測結(jié)果以及模型在不同區(qū)域的表現(xiàn)。這有助于更好地理解客戶滿意度的預(yù)測機(jī)制,并提出針對性地改進(jìn)措施,以優(yōu)化銀行業(yè)電話客服系統(tǒng)的用戶體驗(yàn)。
與圖2類似,圖3的擬合響應(yīng)面也提供了模型對客戶滿意度預(yù)測的整體趨勢和變化規(guī)律。通過在三維空間中展示不同特征組合下的客戶滿意度預(yù)測結(jié)果,本文可以更全面地了解模型的預(yù)測效果。擬合響應(yīng)面的形狀和曲線反映了模型對不同特征值的敏感程度以及不同特征組合對客戶滿意度的影響程度。
預(yù)測結(jié)果如圖4所示,當(dāng)客戶滿意度較高時,模型的預(yù)測能力表現(xiàn)較好,當(dāng)客戶滿意度較低時,更易于高估客戶滿意度。模型的訓(xùn)練數(shù)據(jù)可能存在偏差,即在訓(xùn)練數(shù)據(jù)中,客戶滿意度較高的樣本比較多,因此模型更擅長預(yù)測這種類別。通過比較預(yù)測結(jié)果與實(shí)際觀測值之間的差異,本文可以評估模型的預(yù)測準(zhǔn)確性和擬合效果,從而更全面地了解模型在銀行業(yè)電話客服系統(tǒng)用戶體驗(yàn)優(yōu)化中的表現(xiàn)。
模型在銀行業(yè)人工智能客戶服務(wù)的真實(shí)數(shù)據(jù)上表現(xiàn)出非常高的擬合效果和預(yù)測準(zhǔn)確性。
決定系數(shù)R2為0.99900,非常接近于1。這表明模型能夠解釋目標(biāo)變量(客戶滿意度)中99.90%的方差,說明模型對數(shù)據(jù)的擬合效果非常好。
平均絕對誤差(MeanAbsoluteError,MAE)為0.0021,這說明模型的平均預(yù)測誤差約為0.0021,在實(shí)際問題中屬于非常小的范圍。
均方誤差(MeanSquaredError,MSE)為0.0010,這也是一個非常小的值,表明模型的預(yù)測值與實(shí)際值之間的偏差非常小。
綜合這些指標(biāo)來看,模型在銀行業(yè)真實(shí)數(shù)據(jù)上的擬合效果非常優(yōu)秀,能夠準(zhǔn)確地預(yù)測客戶滿意度。這些結(jié)果說明本文提出的集成模型在銀行業(yè)電話客服系統(tǒng)用戶體驗(yàn)優(yōu)化中具有很高的可行性和實(shí)用性。
試驗(yàn)結(jié)果表明,本文的集成模型在預(yù)測客戶滿意度方面具有較高的準(zhǔn)確性和可靠性。與單一算法相比,集成模型能夠更準(zhǔn)確地捕捉不同因素對客戶滿意度的復(fù)雜影響,從而提高了預(yù)測的準(zhǔn)確性。
3 結(jié)語
本研究利用梯度學(xué)習(xí)的集成模型對銀行業(yè)中人工智能電話客服系統(tǒng)的用戶體驗(yàn)進(jìn)行研究。將等待時長和通話時長進(jìn)行數(shù)據(jù)擬合,本文建立了一個預(yù)測客戶滿意度的模型,并證明了其在實(shí)際應(yīng)用中的有效性。未來,本文將繼續(xù)改進(jìn)模型,探索更多因素對用戶體驗(yàn)的影響,以進(jìn)一步提高銀行業(yè)人工智能電話客服系統(tǒng)的服務(wù)質(zhì)量和用戶滿意度。
參考文獻(xiàn)
[1]張楷越.智能語音技術(shù)在融媒體中的應(yīng)用場景與模式創(chuàng)新[J].傳媒,2023(18):25-27.
[2]王晰巍,劉宇桐,烏吉斯古楞,等.AI語音助手用戶虛擬在線體驗(yàn)影響因素[J/OL].圖書館論壇,2024,44(1):71-85[2024-01-26].http://kns.cnki.net/kcms/detail/44.1306.G2.20230828.1416.006.html.
[3]陳積銀,胡睿心,孫鶴立.用戶體驗(yàn)視角下人工智能視頻生產(chǎn)平臺使用效果研究[J].新聞大學(xué),2021(12):92-107,124-125.
[4]陳曦,宮承波.場景理論視野下智能音頻用戶體驗(yàn)?zāi)P吞骄縖J].當(dāng)代傳播,2021(2):89-92.
[5]徐延章.人工智能+融媒體體驗(yàn):基于廣電融媒體設(shè)計模型的解讀[J].電視研究,2020(6):45-48.
[6]顏洪,劉佳慧,覃京燕.人工智能語境下的情感交互設(shè)計[J].包裝工程,2020,41(6):13-19.