摘要:為提高財(cái)務(wù)數(shù)據(jù)處理的自動(dòng)化水平,本文設(shè)計(jì)了一種基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動(dòng)化分類系統(tǒng)。該系統(tǒng)在收集財(cái)務(wù)數(shù)據(jù)后,根據(jù)分類規(guī)則進(jìn)行自動(dòng)化分類,并將結(jié)果存儲(chǔ)于數(shù)據(jù)庫(kù)中。分類規(guī)則基于財(cái)務(wù)數(shù)值、文本和業(yè)務(wù)邏輯構(gòu)成,并采用RPA技術(shù)進(jìn)行參數(shù)設(shè)置,執(zhí)行邏輯編寫。數(shù)據(jù)建模使用Apriori算法挖掘數(shù)據(jù)模式,生成關(guān)聯(lián)規(guī)則,并直接應(yīng)用于財(cái)務(wù)機(jī)器人的數(shù)據(jù)自動(dòng)化分類系統(tǒng)中。經(jīng)測(cè)試,基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類的需求。
關(guān)鍵詞:RPA技術(shù);財(cái)務(wù)機(jī)器人;數(shù)據(jù)自動(dòng)化;分類系統(tǒng)設(shè)計(jì)
中圖分類號(hào):F273""""""""" 文獻(xiàn)標(biāo)志碼:A
隨著信息技術(shù)飛速發(fā)展,企業(yè)對(duì)財(cái)務(wù)數(shù)據(jù)處理的自動(dòng)化和智能化需求日益增長(zhǎng)。為提高財(cái)務(wù)數(shù)據(jù)的處理效率和準(zhǔn)確性,本文設(shè)計(jì)了一種基于機(jī)器人流程自動(dòng)化(Robotic Process Automation,RPA)技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)。該系統(tǒng)利用RPA技術(shù),可實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的自動(dòng)收集、清洗和轉(zhuǎn)換,并采用Apriori算法挖掘數(shù)據(jù)模式,生成關(guān)聯(lián)規(guī)則,從而實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的自動(dòng)化分類。此外,除了對(duì)財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)進(jìn)流程、數(shù)據(jù)建模、應(yīng)用與監(jiān)控等方法進(jìn)行設(shè)計(jì)外,還對(duì)多個(gè)用戶同時(shí)向財(cái)務(wù)機(jī)器人輸入數(shù)據(jù)后的情況進(jìn)行了測(cè)試分析。測(cè)試結(jié)果表明,基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類的需求。本文基于RPA的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)旨在推動(dòng)企業(yè)財(cái)務(wù)管理現(xiàn)代化進(jìn)程,提升企業(yè)的核心競(jìng)爭(zhēng)力。
1流程設(shè)置
1.1數(shù)據(jù)處理
設(shè)計(jì)該系統(tǒng)時(shí),首要任務(wù)是對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行處理。機(jī)器人會(huì)應(yīng)用RPA技術(shù)自動(dòng)收集、清洗和轉(zhuǎn)換各種類型的財(cái)務(wù)數(shù)據(jù),確保數(shù)據(jù)的完整性和準(zhǔn)確性[1]?;赗PA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類流程如圖1所示。
在確保機(jī)器人有權(quán)限訪問并連接財(cái)務(wù)數(shù)據(jù)源的情況下,機(jī)器人能夠應(yīng)用RPA技術(shù)自動(dòng)從會(huì)計(jì)軟件、銀行對(duì)賬單、發(fā)票、工資單等多個(gè)財(cái)務(wù)數(shù)據(jù)源中收集數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗,以消除重復(fù)、不完整、不準(zhǔn)確或無(wú)關(guān)數(shù)據(jù)。去除重復(fù)記錄、填補(bǔ)缺失值、糾正錯(cuò)誤和標(biāo)準(zhǔn)化數(shù)據(jù)格式后,將清洗的數(shù)據(jù)轉(zhuǎn)換為適合分類的格式。采用RPA編譯將數(shù)據(jù)轉(zhuǎn)換為適合機(jī)器學(xué)習(xí)模型的格式。轉(zhuǎn)換后,財(cái)務(wù)機(jī)器人可對(duì)數(shù)據(jù)信息進(jìn)行驗(yàn)證,以確保其完整性和準(zhǔn)確性。再將不同來(lái)源的數(shù)據(jù)集成到一個(gè)統(tǒng)一的數(shù)據(jù)集中,處理數(shù)據(jù)源間的沖突和重復(fù)問題,并將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中,以支持后續(xù)的數(shù)據(jù)分析。
1.2設(shè)置分類規(guī)則
在基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動(dòng)化分類系統(tǒng)中,處理規(guī)則是保證數(shù)據(jù)正確分類的關(guān)鍵[2]。RPA數(shù)據(jù)自動(dòng)化分類系統(tǒng)處理規(guī)則流程如圖2所示。
在基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動(dòng)化分類系統(tǒng)中,明確財(cái)務(wù)數(shù)據(jù)分類的需求和目標(biāo)可識(shí)別出具體的分類規(guī)則[3]。分類規(guī)則由具體財(cái)務(wù)數(shù)值、財(cái)務(wù)發(fā)票文本、財(cái)政年度以及其他業(yè)務(wù)邏輯構(gòu)成。設(shè)置參數(shù)時(shí),需要根據(jù)定義好的規(guī)則編寫具體的執(zhí)行邏輯,并為每個(gè)規(guī)則設(shè)置相應(yīng)的參數(shù)。參數(shù)設(shè)定為固定值——金額、變量——日期以及外部源數(shù)據(jù)——市場(chǎng)利率。設(shè)計(jì)數(shù)據(jù)驗(yàn)證流程可保證輸入數(shù)據(jù)符合預(yù)設(shè)格式標(biāo)準(zhǔn)。對(duì)于不符合要求的數(shù)據(jù),需要記錄異常、觸發(fā)警報(bào),并對(duì)其進(jìn)行異常處理。確定規(guī)則并驗(yàn)證數(shù)據(jù)后,財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)將設(shè)計(jì)自動(dòng)化分類流程,使用循環(huán)結(jié)構(gòu)遍歷所有數(shù)據(jù)并應(yīng)用分類規(guī)則。最后根據(jù)配置結(jié)果輸出報(bào)告,生成詳細(xì)財(cái)務(wù)數(shù)據(jù)信息,并根據(jù)報(bào)告結(jié)果進(jìn)行反饋循環(huán),以持續(xù)優(yōu)化、調(diào)整分類規(guī)則,滿足企業(yè)的財(cái)務(wù)數(shù)據(jù)分類需求。
2數(shù)據(jù)建模
2.1Apriori算法挖掘
在基于RPA的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)中,Apriori算法有助于識(shí)別數(shù)據(jù)中的模式和關(guān)聯(lián),從而輔助生成分類規(guī)則[4]。掃描數(shù)據(jù)集,并統(tǒng)計(jì)每個(gè)項(xiàng)的支持度計(jì)數(shù),可生成頻繁1-項(xiàng)集?;陬l繁k-1項(xiàng)集,可連接產(chǎn)生候選k-項(xiàng)集。對(duì)候選k-項(xiàng)集進(jìn)行剪枝,即可去除不滿足最小支持度要求的候選項(xiàng)。計(jì)算每個(gè)候選項(xiàng)集在數(shù)據(jù)集中出現(xiàn)的支持度,可識(shí)別出頻繁項(xiàng)集,即在數(shù)據(jù)集中經(jīng)常出現(xiàn)的物品組合。支持度計(jì)算過程如公式(1)所示。
(1)
式中:x為一個(gè)物品或物品組合,即要計(jì)算支持度的項(xiàng)集;Sx為物品x的支持度,即物品x在所有交易中出現(xiàn)的概率;Tc為所含物品x的交易數(shù),即數(shù)據(jù)集中所含物品x的交易數(shù)量;Tt為總交易數(shù),即數(shù)據(jù)集中的總交易數(shù)量。
得到支持度后,根據(jù)最小支持度閾值篩選出頻繁k-項(xiàng)集,作為下一輪迭代的基礎(chǔ),并重復(fù)進(jìn)行連接、剪枝、計(jì)算支持度和篩選頻繁項(xiàng)集的步驟,直到無(wú)法生成新的頻繁k-項(xiàng)集為止。最后,基于挖掘到的頻繁項(xiàng)集生成關(guān)聯(lián)規(guī)則,并計(jì)算置信度等指標(biāo)。置信度指標(biāo)計(jì)算過程如公式(2)所示。
(2)
式中:(x→y)為關(guān)聯(lián)規(guī)則,其中x是規(guī)則的前提部分,y是規(guī)則的結(jié)論部分,表示在購(gòu)買物品x的情況下也購(gòu)買物品y;S(x,y)為同時(shí)含有物品x和y的交易數(shù),即數(shù)據(jù)集中同時(shí)含有物品x和y的交易數(shù)量;S(x)為物品x的支持度,即物品x在所有交易中出現(xiàn)的概率,在此處可用于計(jì)算購(gòu)買物品x時(shí)也購(gòu)買物品y的概率;Cd(x→y)為關(guān)聯(lián)規(guī)則的置信度,即在購(gòu)買物品x時(shí)也購(gòu)買物品y的概率,該值可衡量關(guān)聯(lián)規(guī)則的強(qiáng)度和可靠性。
置信度指標(biāo)可評(píng)估關(guān)聯(lián)規(guī)則中前提部分與結(jié)論部分間的相關(guān)性。高置信度表明在前提條件下出現(xiàn)結(jié)論的概率較高,規(guī)則更可靠。
2.2生成關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則可由頻繁項(xiàng)集推導(dǎo)得出[5]。根據(jù)最小支持度和最小置信度閾值,從頻繁項(xiàng)集中選擇具有較高支持度和置信度的項(xiàng)集,將其作為關(guān)聯(lián)規(guī)則的候選項(xiàng)。對(duì)于每一個(gè)頻繁項(xiàng)集,生成所有可能的關(guān)聯(lián)規(guī)則。假設(shè)頻繁項(xiàng)集為{A,B,C},可以生成的關(guān)聯(lián)規(guī)則包括A≥B,C;B≥AC;C≥A,B;A≥B;A≥C;B≥A;B≥C;C≥A;C≥B。計(jì)算生成的每個(gè)關(guān)聯(lián)規(guī)則的置信度。如果置信度大于等于最小置信度閾值,則將該關(guān)聯(lián)規(guī)則保存下來(lái)。對(duì)于每個(gè)保存下來(lái)的關(guān)聯(lián)規(guī)則,根據(jù)規(guī)則的前置條件和結(jié)論部分進(jìn)行規(guī)則命名和描述。如規(guī)則A≥B中,C可以命名為“購(gòu)買A通常伴隨購(gòu)買B和C”,并對(duì)其進(jìn)行解釋和注釋,以便于后續(xù)理解使用。根據(jù)增加或減少頻繁項(xiàng)集的選擇調(diào)整最小支持度和最小置信度閾值,以獲得更符合實(shí)際需求的關(guān)聯(lián)規(guī)則。最后將生成的關(guān)聯(lián)規(guī)則應(yīng)用于財(cái)務(wù)機(jī)器人的數(shù)據(jù)自動(dòng)化分類系統(tǒng)中,輔助分類規(guī)則的生成和優(yōu)化。
3應(yīng)用與監(jiān)控
3.1關(guān)聯(lián)規(guī)則應(yīng)用
在應(yīng)用過程中,利用生成的關(guān)聯(lián)規(guī)則幫助財(cái)務(wù)機(jī)器人更好地理解數(shù)據(jù)并進(jìn)行自動(dòng)化分類,從而提高分類系統(tǒng)的準(zhǔn)確性、效率和智能化水平[6]。同時(shí),計(jì)算余弦相似度可衡量2個(gè)向量間的相似程度,進(jìn)而在關(guān)聯(lián)規(guī)則挖掘中評(píng)估規(guī)則間的相似性,以更好地理解數(shù)據(jù)間的關(guān)系和模式。余弦相似度是指將2個(gè)向量在空間中進(jìn)行投影并計(jì)算二者間夾角的余弦值來(lái)衡量其相似程度。分子表示2個(gè)向量間的內(nèi)積,分母表示各自長(zhǎng)度的乘積。對(duì)于任意2條關(guān)聯(lián)規(guī)則對(duì)應(yīng)的向量,余弦相似度計(jì)算過程如公式(3)所示。
(3)
式中:x和y分別為2條關(guān)聯(lián)規(guī)則對(duì)應(yīng)的向量;xi和yi分別為2個(gè)向量在第i個(gè)維度上的取值;Σi xi. yi為2個(gè)向量x和y中對(duì)應(yīng)維度值的乘積之和,此部分計(jì)算了2個(gè)向量在每個(gè)
維度上的相似程度為2個(gè)向量各自每個(gè)維度值的平方和開根號(hào)后的乘積,此部分計(jì)算了2個(gè)向量在每個(gè)維度上的長(zhǎng)度。
余弦相似度值范圍為[-1,1],其中1為完全相同,-1為完全不同,0為無(wú)相關(guān)性。計(jì)算余弦相似度,比較不同規(guī)則間的方向關(guān)系,從而更好地理解數(shù)據(jù)間的關(guān)系和模式。
3.2性能監(jiān)控
在完成財(cái)務(wù)數(shù)據(jù)的自動(dòng)化分類流程和關(guān)聯(lián)規(guī)則的生成后,為了確保系統(tǒng)的穩(wěn)定性、準(zhǔn)確性并適應(yīng)可能的變化,需要對(duì)系統(tǒng)進(jìn)行性能監(jiān)控與調(diào)優(yōu)。首先,應(yīng)持續(xù)監(jiān)控?cái)?shù)據(jù)清洗的質(zhì)量,確保數(shù)據(jù)的準(zhǔn)確性和完整性。通過抽樣檢查或全量檢查相結(jié)合的方式,可驗(yàn)證數(shù)據(jù)質(zhì)量。其次,采用交叉驗(yàn)證測(cè)試來(lái)評(píng)估分類系統(tǒng)的準(zhǔn)確率。將財(cái)務(wù)數(shù)據(jù)中的原始數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,并使用訓(xùn)練集數(shù)據(jù)訓(xùn)練分類模型。將訓(xùn)練集數(shù)據(jù)劃分為K個(gè)等份,每次保留一個(gè)份作為測(cè)試集,其余(K-1)份作為訓(xùn)練集,重復(fù)k次,得到k個(gè)模型評(píng)估結(jié)果。最后,統(tǒng)計(jì)每次交叉驗(yàn)證的分類結(jié)果,計(jì)算分類系統(tǒng)的準(zhǔn)確率。分類系統(tǒng)的準(zhǔn)確率計(jì)算過程如公式(4)所示。
×100%(4)
式中:Ac為準(zhǔn)確率;Cs為模型正確預(yù)測(cè)的樣本數(shù)量;Ts為總的測(cè)試樣本數(shù)量。
將k次交叉驗(yàn)證的準(zhǔn)確率取平均值,即可得到最終準(zhǔn)確率評(píng)估結(jié)果,計(jì)算過程如公式(5)所示。
Acyi(5)
式中:Fa為最終準(zhǔn)確率;k為交叉驗(yàn)證的折數(shù),表示數(shù)據(jù)集被劃分為子集進(jìn)行驗(yàn)證的子集數(shù)量;Acyi為在第i折驗(yàn)證所得的準(zhǔn)確率。
在交叉驗(yàn)證過程中,對(duì)每一次驗(yàn)證得到的準(zhǔn)確率進(jìn)行求和,并取平均值作為最終的準(zhǔn)確率評(píng)估指標(biāo),由此可以綜合考慮所有折的表現(xiàn),更全面地評(píng)估分類系統(tǒng)的性能。
4測(cè)試評(píng)估
4.1測(cè)試準(zhǔn)備
基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動(dòng)化分類系統(tǒng)的集成測(cè)試以Windows Server2019為操作系統(tǒng),部署Intel Core i7-10700KF處理器,以滿足系統(tǒng)快速處理大量財(cái)務(wù)數(shù)據(jù)的基礎(chǔ)需求。同時(shí),采用Corsair Vengeance LPX16GB(2×8GB)、DDR43200MHz內(nèi)存,以便系統(tǒng)能夠同時(shí)處理多個(gè)任務(wù)和數(shù)據(jù)集,并便于機(jī)器人與不同的財(cái)務(wù)系統(tǒng)快速進(jìn)行數(shù)據(jù)交換。服務(wù)器還設(shè)置有Intel X550-AT210GbE SFP+Network Interface Card網(wǎng)絡(luò)接口。建立高速穩(wěn)定的網(wǎng)絡(luò)環(huán)境,以確保機(jī)器人可以無(wú)障礙地在不同系統(tǒng)間傳輸數(shù)據(jù)。完成測(cè)試環(huán)境搭建后,根據(jù)功能測(cè)試驗(yàn)證財(cái)務(wù)機(jī)器人在高并發(fā)情況下的數(shù)據(jù)收集性能。模擬多個(gè)用戶同時(shí)向數(shù)據(jù)源輸入數(shù)據(jù),并運(yùn)行數(shù)據(jù)收集任務(wù),測(cè)量收集任務(wù)的響應(yīng)時(shí)間和系統(tǒng)資源占用情況,從而驗(yàn)證系統(tǒng)在高并發(fā)情況下能否保持性能的穩(wěn)定性。
4.2測(cè)試結(jié)果
為驗(yàn)證基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)在高并發(fā)情況下的數(shù)據(jù)收集性能,模擬多個(gè)用戶同時(shí)向數(shù)據(jù)源輸入數(shù)據(jù),并運(yùn)行數(shù)據(jù)收集任務(wù),系統(tǒng)響應(yīng)時(shí)間和資源占用情況見表1。
經(jīng)測(cè)試,隨著用戶數(shù)增加,系統(tǒng)響應(yīng)時(shí)間基本保持在2s左右,表明系統(tǒng)在高并發(fā)情況下仍能保持較快的數(shù)據(jù)收集速度。TC-6(60個(gè)用戶)的響應(yīng)時(shí)間為2.5s,略高于其他測(cè)試用例,但仍然在可接受范圍內(nèi)。另外,CPU利用率隨著用戶數(shù)增加而逐漸上升,但利用率始終保持在60%以下,證明CPU資源沒有達(dá)到滿載,仍有余力處理更多的任務(wù)。同時(shí),內(nèi)存利用率同樣隨著用戶數(shù)增加而上升,但總體保持在55%~63%,表明內(nèi)存利用率的增加幅度也相對(duì)平穩(wěn),系統(tǒng)內(nèi)存管理得當(dāng),表明基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)在高并發(fā)環(huán)境下的穩(wěn)定性良好,能夠滿足大規(guī)模數(shù)據(jù)分類需求。
5結(jié)語(yǔ)
基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)為企業(yè)提供了一種高效、準(zhǔn)確的財(cái)務(wù)數(shù)據(jù)處理解決方案,有助于提升企業(yè)的財(cái)務(wù)管理水平和核心競(jìng)爭(zhēng)力。設(shè)計(jì)了基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng),可實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)處理的自動(dòng)化和智能化,有效提高企業(yè)財(cái)務(wù)數(shù)據(jù)處理的效率和準(zhǔn)確性。利用RPA技術(shù),可實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)的自動(dòng)收集、清洗、轉(zhuǎn)換和分類功能,采用Apriori算法挖掘數(shù)據(jù)模式并生成關(guān)聯(lián)規(guī)則,可滿足大規(guī)模數(shù)據(jù)分類的需求。經(jīng)測(cè)試,在高并發(fā)環(huán)境下,系統(tǒng)表現(xiàn)穩(wěn)定,響應(yīng)迅速,并且資源利用率在可接受范圍內(nèi)。表明基于RPA技術(shù)的財(cái)務(wù)機(jī)器人數(shù)據(jù)自動(dòng)化分類系統(tǒng)具備處理大量財(cái)務(wù)數(shù)據(jù)和快速交換數(shù)據(jù)的能力,可用于企業(yè)日常財(cái)務(wù)數(shù)據(jù)處理、分析和報(bào)告。
參考文獻(xiàn)
[1]彭雪妍. 基于財(cái)務(wù)數(shù)字化轉(zhuǎn)型背景下的國(guó)企集團(tuán)司庫(kù)管理體系建設(shè)路徑探析[J]. 國(guó)際商務(wù)財(cái)會(huì),2023(23):49-52.
[2]徐強(qiáng)艷,李璐涵. 數(shù)字化轉(zhuǎn)型背景下RPA財(cái)務(wù)機(jī)器人在中小型企業(yè)財(cái)務(wù)管理中的應(yīng)用探究[J]. 老字號(hào)品牌營(yíng)銷,2023
(23):98-100.
[3]黃月薪,陳兵,王耀東,等. 機(jī)器人流程自動(dòng)化技術(shù)驅(qū)動(dòng)科技期刊數(shù)字化創(chuàng)新發(fā)展的應(yīng)用路徑——出版流程轉(zhuǎn)型升級(jí)視角[J]. 科技管理研究,2023,43(23):241-246.
[4]張曉瑋,劉波,戈姍姍,等. 基于人工智能的財(cái)務(wù)管理創(chuàng)新——財(cái)務(wù)機(jī)器人在XH醫(yī)院的應(yīng)用[J]. 財(cái)會(huì)月刊,2022
(23):119-126.
[5]黃成慶,董文宇. 基于RPA技術(shù)的醫(yī)院醫(yī)療收入核算流程優(yōu)化研究——以FY醫(yī)院為例[J]. 會(huì)計(jì)之友,2022(16):40-46.
[6]張媛. 基于RPA技術(shù)的財(cái)務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)自動(dòng)化分類系統(tǒng)[J]. 自動(dòng)化與儀器儀表,2022(1):168-171.