“十一五”時期銀行數據大集中后,對數據的規(guī)范管理、質量改進及應用機制建設成為擺在信息主管面前的重要課題。
“我們2003年就開始搞大數據。”中國農業(yè)銀行軟件開發(fā)中心趙維平表示,“當時遇到很多困惑,如技術路徑、平臺選型方面的問題。最終,我們選擇了自主可控的技術路徑:基礎硬件、基礎軟件、數據模型、工具平臺和制度管理都是自主可控的?!?/p>
趙維平介紹說:“農行的大數據平臺建設,硬件方面我們采用華為RH2288系列,基礎軟件方面我們引進了南大通用的MPP架構數據庫,從28個數據節(jié)點擴展至后來的56個節(jié)點,非結構化、結構化的上游生產數據基本都放在MPV架構數據庫中。數據模型方面,我們結合先進建模理論,融合了范式和維度思路?;A工具方面,我們以自主開發(fā)為主,制定了一套比較完備的規(guī)范、制度、方法和標準?!?/p>
農行大數據平臺有著比較清晰的邏輯架構?!霸跀祿磳樱袔缀跛猩a系統(tǒng)數據已納入進來,通過交換平臺實現上游數據生產和下游數據消費系統(tǒng)之間,總分行之間,總行各應用系統(tǒng)間的數據交互?!壁w維平解釋說,“在數據分析挖掘方面,我們按業(yè)務細分領域落到不同的應用系統(tǒng)中去嘗試實現。同時,我們也在加大對各類算法,聚類、分類、回歸、神經網絡等的研究,注重數據分析人才的培養(yǎng)?!?/p>
在探索大數據應用方面,中國銀行推出的中銀開放平臺是一個實踐產品。中國銀行總行軟件中心上海分中心副總經理牛曉峰介紹說:“這個平臺獲得了2015年人民銀行的科技進步獎。其設計思路是將中國銀行整體數據進行歸并整理,開發(fā)出1000多個標準API接口,并將這些接口開放給中行各分行及客戶,他們可以通過API訪問并使用中行數據,加工后獲得想要的應用結果。”
對于如何更為有效地釋放銀行數據價值,牛曉峰認為三個方面比較關鍵?!耙皇窃诤弦?guī)前提下要更有效、充分地利用銀行外部數據服務;二是以應用為驅動,要做大數據應用的場景產品;三是通過將結構化、非結構化,線上、線下的數據有機提煉并整合起來,從而更精準地建設客戶營銷平臺。”
四大銀行中,中國建設銀行擁有龐大用戶基數,目前手機銀行用戶數達1.8億多,網上銀行近2億?!半S著手機銀行、網上銀行及微信銀行三大互聯網渠道的建立及用戶數的累積,我們應用大數據的場景和基礎已經具備?!敝袊ㄔO銀行信息技術管理部資深經理林磊明表示。
他認為,傳統(tǒng)銀行做大數據主要為解決三大問題。“一是提升客戶識別,二是利于客戶營銷,三是強化風險防范?!?/p>
目前,建行已成立上海大數據分析中心,隸屬于信息管理部門。林磊明表示:“建行大數據平臺設計遵循架構先行,在功能架構上希望做到盡可能完備,并能及時反映到業(yè)務流程中去。目前,我們在大數據平臺上已經取得一些成果,如我們能向客戶經理提供實時數據服務,已經總結出挖掘類、數據實驗室、機器查詢、儀表盤、固定報表、自動查詢等六類數據應用模式。同時,我們通過建立‘模型實驗室,支持大數據模型研發(fā),并快速部署至生產環(huán)境中去。此外,通過位置服務終端識別技術應用,我們在銀行風險事件規(guī)避和防范方面有了比較不錯的應用成效?!?/p>
總的來看,“十二五”期間,各大銀行主管領導對數據積累、改善并持續(xù)改進質量的關注度提升,并有意識地構建數據治理平臺和相關機制。但業(yè)內專業(yè)的數據質量管理部門仍然缺乏,風險數據的同業(yè)共享機制也尚未建立。