劉傳蔚
(天津市公共資源交易中心(天津市政府采購中心),天津 300171)
公共資源是一個(gè)城市或地區(qū)有關(guān)公共服務(wù)的重要資源,也是具有經(jīng)濟(jì)價(jià)值的重要板塊,更是市場經(jīng)濟(jì)體系平穩(wěn)運(yùn)行中不可或缺的重要組成部分[1]。目前,公共資源已經(jīng)成為政府控制且可以進(jìn)行交易的重要信息化產(chǎn)品,這也推動(dòng)了公共資源交易的飛速發(fā)展。隨著信息化技術(shù)浪潮,公共資源交易活動(dòng)更高效和頻繁[2]。據(jù)不完全統(tǒng)計(jì),全國各類公共資源交易平臺(tái)達(dá)數(shù)千個(gè),每年涉及的經(jīng)濟(jì)總額高達(dá)數(shù)百萬億元。由此可見,推動(dòng)公共資源交易進(jìn)一步良性發(fā)展是公共資源領(lǐng)域未來的重要發(fā)展方向。從目前的情況來看,在公共資源交易過程中主要存在部門多、交易流程繁冗以及資源數(shù)據(jù)量大等問題,影響了交易的效率和對接的準(zhǔn)確性[3]。因此,該文在公共資源中引入大數(shù)據(jù)挖掘方法,對公共資源信息進(jìn)行分析,以提高交易效率。
公共資源數(shù)據(jù)量大、信息繁冗,要實(shí)現(xiàn)公共資源交易的有效對接,就需要設(shè)置多個(gè)合理的、客觀的且準(zhǔn)確的挖掘條件,以便順利地實(shí)施大數(shù)據(jù)挖掘方法。因此,多個(gè)條件配置的過程就是消除公共資源數(shù)據(jù)冗余性的過程。而當(dāng)全部數(shù)據(jù)的冗余性被消除時(shí),就可以挖掘出準(zhǔn)確的結(jié)果,這也是該文構(gòu)建大數(shù)據(jù)挖掘方法的切入點(diǎn)。
根據(jù)公共資源數(shù)據(jù)挖掘的多條件設(shè)計(jì)思想,給出所有可能條件的數(shù)學(xué)集合,如公式(1)所示。
式中:E為公共資源挖掘過程中全部條件的集合;e1為公共資源挖掘過程中配置的第一類條件;e2為公共資源挖掘過程中配置的第二類條件;e|E|為公共資源挖掘過程中配置的第|E|類條件;|E|為公共資源挖掘過程中配置的條件總數(shù)量。
為了有效解決公共資源數(shù)據(jù)挖掘過程中的條件配置問題,針對每個(gè)條件可以配置1 個(gè)具體的挖掘方案,由此形成方案集合,如公式(2)所示。
式中:P為公共資源挖掘過程中全部方案的集合;p1為公共資源挖掘過程中配置的第一類方案;p2為公共資源挖掘過程中配置的第二類方案;p|P|為公共資源挖掘過程中配置的第|E|類方案;|P|為公共資源挖掘過程中配置的方案總數(shù)量。
在上述2 類集合的配置情況下,可以進(jìn)一步構(gòu)建公共資源大數(shù)據(jù)挖掘判斷矩陣,如公式(3)所示。
式中:R為公共資源挖掘過程中構(gòu)建出的判斷矩陣;r11為公共資源挖掘過程中第一類條件和第一類方案構(gòu)建出的判據(jù);r12為公共資源挖掘過程中第二類條件和第一類方案構(gòu)建出的判據(jù);r21為公共資源挖掘過程中第一類條件和第二類方案構(gòu)建的判據(jù)。
在公共資源的大數(shù)據(jù)挖掘過程中,不同方案及對應(yīng)的判據(jù)存在差異,其是否為更佳的判定依賴于大數(shù)據(jù)挖掘算法后臺(tái)支撐的專家知識(shí)。大數(shù)據(jù)挖掘算法會(huì)根據(jù)算法設(shè)定自動(dòng)為不同的方案配置權(quán)重,這些權(quán)重的關(guān)系如公式(4)所示。
式中:qj為公共資源挖掘過程中第j個(gè)權(quán)重;|E|為公共資源挖掘過程中的全部權(quán)重總數(shù)量。
在大數(shù)據(jù)挖掘方法的使用過程中,如果不同類別的公共資源數(shù)據(jù)存在較大的數(shù)值差異,就無法形成有效的橫向間比對,會(huì)影響判據(jù)和方案選擇的準(zhǔn)確性。因此,對挖掘過程中的同類參數(shù)進(jìn)行歸一化計(jì)算是基礎(chǔ)性工作。
同類參數(shù)的歸一化計(jì)算如公式(5)所示。
式中:tji為歸一化后的結(jié)果;rji為原參數(shù)值;為最大參數(shù)值;i為方案序號(hào);j為條件序號(hào)。
上述處理采用正向的歸一化計(jì)算,結(jié)果都是0~1 的小數(shù)。也可以采用反向歸一化計(jì)算,如公式(6)所示。
式中:為最小參數(shù)值。
至此,可以得到該文提出的大數(shù)據(jù)挖掘方法的流程圖,如圖1 所示。
圖1 公共資源大數(shù)據(jù)挖掘方法流程圖
由圖1 可知,該文提出的公共資源大數(shù)據(jù)挖掘方法一共包括5 個(gè)步驟,分別是生成條件矩陣、生成方案矩陣、生成判斷矩陣、權(quán)重歸一化以及生成挖掘結(jié)果。
針對公共資源和公共資源交易問題構(gòu)建了大數(shù)據(jù)挖掘方法。這些方法必須進(jìn)行充分的條件設(shè)置才能達(dá)到更好的挖掘效果。
當(dāng)采用大數(shù)據(jù)挖掘方法進(jìn)行公共資源數(shù)據(jù)處理時(shí),首先要對其進(jìn)行分類,分類過程可以看成第一次去冗余的過程。而公共資源的數(shù)據(jù)板塊在很多城市或地區(qū)已經(jīng)有了比較明確的劃分或切割。該文抽取一部分公共資源數(shù)據(jù)的分類問題進(jìn)行說明,該分類關(guān)系如圖2 所示。
圖2 公共資源數(shù)據(jù)的分類
由圖2 可知,該文選取了公共資源數(shù)據(jù)的6 個(gè)分類,包括基礎(chǔ)設(shè)施數(shù)據(jù)、公共項(xiàng)目數(shù)據(jù)、材料交易數(shù)據(jù)、經(jīng)濟(jì)發(fā)展數(shù)據(jù)、金融服務(wù)數(shù)據(jù)以及專家服務(wù)數(shù)據(jù)。分類只是第一次去除冗余的過程,如果需要得到更理想的數(shù)據(jù)挖掘結(jié)果,就需要進(jìn)行更多的條件設(shè)置,該文進(jìn)一步的條件設(shè)置見表1。
表1 公共資源數(shù)據(jù)挖掘中的條件設(shè)置
由表1 可知,針對從公共資源中所抽取的6 種類別分別設(shè)置了6 個(gè)條件,為了保證在數(shù)據(jù)挖掘過程中的各類公共資源數(shù)據(jù)具有相同的維度進(jìn)行對等設(shè)計(jì)。當(dāng)然,各類數(shù)據(jù)所屬領(lǐng)域不同,其特征條件也存在很多差異。
為了便于公共資源大數(shù)據(jù)挖掘過程的展開,對挖掘方法執(zhí)行過程中獲取結(jié)果的等級(jí)進(jìn)行分類,結(jié)果如圖3 所示。
圖3 公共資源大數(shù)據(jù)挖掘結(jié)果的等級(jí)
在圖3 中,將公共資源大數(shù)據(jù)挖掘結(jié)果準(zhǔn)確性設(shè)置為6 個(gè)等級(jí),為了便于進(jìn)一步實(shí)施算法,對其進(jìn)行對應(yīng)量化,見表2。
表2 圖3 中各等級(jí)的量化結(jié)果
在進(jìn)一步的大數(shù)據(jù)挖掘試驗(yàn)中,要從海量的公共資源數(shù)據(jù)中找到與要求匹配的3 類數(shù)據(jù),分別是A 型公共資源數(shù)據(jù)、B 型公共資源數(shù)據(jù)、C 型公共資源數(shù)據(jù)。根據(jù)公式(1)~公式(6)的大數(shù)據(jù)挖掘方法流程,得到了A 型公共資源數(shù)據(jù)挖掘過程的判斷矩陣,見表3。
表3 A 型公共資源數(shù)據(jù)挖掘過程的判斷矩陣
根據(jù)公式(1)~公式(6)的大數(shù)據(jù)挖掘方法流程,得到了B 型公共資源數(shù)據(jù)挖掘過程的判斷矩陣,見表4。
表4 B 型公共資源數(shù)據(jù)挖掘過程的判斷矩陣
根據(jù)公式(1)~公式(6)的大數(shù)據(jù)挖掘方法流程,得到了B 型公共資源數(shù)據(jù)挖掘過程的判斷矩陣,見表5。
表5 C 型公共資源數(shù)據(jù)挖掘過程的判斷矩陣
為了更直觀地展示上述過程的挖掘效果,用柱狀圖來表達(dá)表3~表5 的結(jié)果,如圖4 所示。
圖4 表3~表5 的圖形表達(dá)
通過圖4 的形象對比,就可以選取更合適的公共資源數(shù)據(jù),這也體現(xiàn)了大數(shù)據(jù)挖掘方法的優(yōu)勢。例如如果想選擇條件2 配置較好的公共資源,就應(yīng)該選擇A 型公共資源數(shù)據(jù)。如果想選擇條件1 配置較好的公共資源,就應(yīng)該選擇B 型公共資源數(shù)據(jù)。如果想選擇條件4 配置較好的公共資源,就應(yīng)該選擇C 型公共資源數(shù)據(jù)。
隨著公共資源及公共資源交易快速發(fā)展和適用范圍越來越廣,對其進(jìn)行大數(shù)據(jù)挖掘處理、找到更適合對接的公共資源數(shù)據(jù)就成為時(shí)代發(fā)展所需要的重要技術(shù)。針對該實(shí)際問題,該文提出了一種大數(shù)據(jù)挖掘方法,該方法根據(jù)公共資源交易的需求設(shè)定多種類型、多個(gè)數(shù)量的條件,達(dá)到數(shù)據(jù)冗余的最佳去除效果,進(jìn)一步形成方案集合的配置,并實(shí)現(xiàn)不同判據(jù)的權(quán)重設(shè)置和歸一化處理。在試驗(yàn)過程中,以基礎(chǔ)設(shè)施數(shù)據(jù)、公共項(xiàng)目數(shù)據(jù)、材料交易數(shù)據(jù)、經(jīng)濟(jì)發(fā)展數(shù)據(jù)、金融服務(wù)數(shù)據(jù)以及專家服務(wù)數(shù)據(jù)6 類公共資源數(shù)據(jù)為挖掘?qū)ο?,形成了A 型公共資源數(shù)據(jù)、B 型公共資源數(shù)據(jù)以及C 型公共資源數(shù)據(jù)的差異化分析,可以為不同的需求者提供更有針對性的挖掘結(jié)果。