馬從鋰 黃飛虎 弋沛玉 王琳娜 彭艦
摘 要: 因果關(guān)系發(fā)現(xiàn)是因果推斷的重要部分,其目標(biāo)是揭示數(shù)據(jù)內(nèi)在的生成機(jī)制,并以有向無(wú)環(huán)圖的形式表示. 然而關(guān)于因果關(guān)系發(fā)現(xiàn),現(xiàn)有方法很少考慮到觀察數(shù)據(jù)存在缺失值的情況. 在實(shí)際場(chǎng)景中,大量數(shù)據(jù)集存在缺失值,因此估計(jì)缺失數(shù)據(jù)集中的因果關(guān)系成為一個(gè)亟需解決的問(wèn)題. 本文提出了一種新的基于因果反饋的算法實(shí)現(xiàn)關(guān)于缺失數(shù)據(jù)集的因果關(guān)系發(fā)現(xiàn),其中生成對(duì)抗網(wǎng)絡(luò)被用于估計(jì)缺失數(shù)據(jù)集的分布,并利用基于Actor-Critic 的因果關(guān)系發(fā)現(xiàn)模塊搜索最優(yōu)因果圖,設(shè)計(jì)了一個(gè)基于擴(kuò)展貝葉斯信息準(zhǔn)則的自定義獎(jiǎng)勵(lì)函數(shù),引入分類誤差引導(dǎo)模型加速探索過(guò)程,提升模型穩(wěn)定性. 在模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)上進(jìn)行的大量實(shí)驗(yàn)結(jié)果表明,本文提出的方法在不同數(shù)據(jù)缺失率下優(yōu)于現(xiàn)有方法.
關(guān)鍵詞: 深度學(xué)習(xí); 缺失數(shù)據(jù)補(bǔ)全; 因果關(guān)系發(fā)現(xiàn); 有向無(wú)環(huán)圖
中圖分類號(hào): TP183 文獻(xiàn)標(biāo)志碼: A DOI: 10. 19907/j. 0490-6756. 2024. 022002
1 引言
因果推斷被用來(lái)揭示事物的內(nèi)在生成機(jī)制、發(fā)現(xiàn)事物的運(yùn)行規(guī)律,在統(tǒng)計(jì)學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)等眾多領(lǐng)域中都有應(yīng)用[1]. 因果關(guān)系發(fā)現(xiàn)是因果推斷領(lǐng)域非常重要的分支,旨在從數(shù)據(jù)中推導(dǎo)出一個(gè)因果關(guān)系模型,以揭示數(shù)據(jù)的內(nèi)在生成機(jī)制[2].