同濟(jì)大學(xué)建筑設(shè)計(jì)研究院(集團(tuán))有限公司 孟獻(xiàn)寶 翁曉紅
本文首先探討數(shù)字化技術(shù)在知識(shí)經(jīng)濟(jì)時(shí)代下的變革發(fā)展及在文化設(shè)施領(lǐng)域呈現(xiàn)的價(jià)值體系,隨后分析TJAD文化設(shè)施數(shù)字化平臺(tái)的建設(shè)目標(biāo)及架構(gòu)設(shè)計(jì),研究平臺(tái)的功能模塊設(shè)置及關(guān)鍵技術(shù)應(yīng)用,討論建設(shè)相關(guān)數(shù)字平臺(tái)的重要意義,探索新形勢(shì)下的商業(yè)模式,全面提升企業(yè)的服務(wù)效能。
隨著人工智能時(shí)代的來(lái)臨,各行業(yè)面臨著從“傳統(tǒng)化”到“智能化、數(shù)字化”的新一輪迭代升級(jí),數(shù)字化轉(zhuǎn)型是知識(shí)經(jīng)濟(jì)和技術(shù)變革的必然趨勢(shì)。作為傳統(tǒng)規(guī)劃策劃行業(yè)項(xiàng)目,大部分?jǐn)?shù)據(jù)的統(tǒng)計(jì)分析工作還依靠紙質(zhì)或者電子的報(bào)表和表單。數(shù)據(jù)的收集、傳遞、處理與統(tǒng)計(jì)都依靠人力完成,效率低下易出錯(cuò)。隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和普及,應(yīng)用數(shù)字化技術(shù)的相關(guān)產(chǎn)品越來(lái)越成為數(shù)據(jù)、信息交換的主要平臺(tái)和渠道。
因此,我們嘗試將數(shù)字化技術(shù)運(yùn)用到規(guī)劃策劃項(xiàng)目,主要著眼于文化設(shè)施業(yè)務(wù),通過(guò)Web網(wǎng)頁(yè)的形式,整理和分析特定地區(qū)的代表性文化產(chǎn)業(yè)設(shè)施的分布和運(yùn)營(yíng)情況,作為文化設(shè)施數(shù)據(jù)的門(mén)戶(hù),展示文化設(shè)施及周邊業(yè)態(tài)等信息,為文化設(shè)施項(xiàng)目策劃、規(guī)劃及設(shè)計(jì)提供信息化、數(shù)據(jù)化、數(shù)字化支持。
數(shù)字化技術(shù)指的是通過(guò)電子計(jì)算機(jī)、通信衛(wèi)星等設(shè)備,來(lái)表達(dá)、傳輸和處理所有信息的技術(shù)。數(shù)字化技術(shù)支持于TJAD文化設(shè)施數(shù)字化平臺(tái)建設(shè)的方方面面,聚焦數(shù)據(jù)采集、信息分析處理及至交互平臺(tái)展示,為信息優(yōu)化整合、現(xiàn)代統(tǒng)計(jì)分析、資源全面共享等功能提供強(qiáng)大技術(shù)支持。
文化設(shè)施領(lǐng)域的數(shù)據(jù)采集主要來(lái)源于外部數(shù)據(jù),數(shù)據(jù)可采用公開(kāi)獲取的不同屬性文化設(shè)施數(shù)據(jù),涵蓋公開(kāi)數(shù)據(jù)庫(kù)、地理相關(guān)API、項(xiàng)目主頁(yè)等渠道。這部分?jǐn)?shù)據(jù)包括了文化設(shè)施的地理信息和基本信息,覆蓋了常用的維度與屬性,是后續(xù)統(tǒng)計(jì)分析與成果展示的基礎(chǔ)。
在通過(guò)數(shù)據(jù)管理模塊自動(dòng)完成數(shù)據(jù)的在線收集后,利用數(shù)字化技術(shù)完成數(shù)據(jù)預(yù)處理過(guò)程,并將結(jié)果存入數(shù)據(jù)庫(kù)中做統(tǒng)一存儲(chǔ)工作。數(shù)據(jù)處理時(shí),要根據(jù)數(shù)據(jù)類(lèi)型選擇合適的數(shù)據(jù)處理系統(tǒng)及存儲(chǔ)形式,注重?cái)?shù)據(jù)質(zhì)量、數(shù)據(jù)時(shí)效性及準(zhǔn)確性,以實(shí)現(xiàn)大數(shù)據(jù)質(zhì)量的最優(yōu)化。
數(shù)據(jù)分析是數(shù)字化價(jià)值應(yīng)用中的關(guān)鍵環(huán)節(jié)。在實(shí)踐過(guò)程中,應(yīng)根據(jù)具體的應(yīng)用情境,選擇及精進(jìn)RFM模型、AARRR模型及流量分析等多種分析方法,提高數(shù)據(jù)分析結(jié)果的效率性及準(zhǔn)確性。
數(shù)據(jù)共享應(yīng)用通過(guò)對(duì)將數(shù)據(jù)分析后的結(jié)果以圖像或圖表的直觀方式與用戶(hù)進(jìn)行交互式處理,是影響數(shù)據(jù)可用性和易用性的關(guān)鍵因素。文化設(shè)施數(shù)字化平臺(tái)利用數(shù)字化技術(shù)核心展示實(shí)時(shí)狀態(tài)、圖集展示、圖表統(tǒng)計(jì)與地圖應(yīng)用。
文化設(shè)施數(shù)字化平臺(tái)的核心理念為多階段目標(biāo),即按照總體設(shè)計(jì)、分步實(shí)施原則,進(jìn)行三階段的規(guī)劃設(shè)計(jì)與開(kāi)發(fā)實(shí)施。
第一階段以數(shù)據(jù)積累為主要功能,整合、接入第三方檔案庫(kù)和數(shù)據(jù)資源,打造文化設(shè)施項(xiàng)目數(shù)據(jù)庫(kù)及展示窗口。
第二階段以數(shù)據(jù)分析為主要功能,充分利用平臺(tái)數(shù)據(jù),經(jīng)過(guò)對(duì)大量的、豐富的統(tǒng)計(jì)資料和數(shù)據(jù)進(jìn)行加工制作和分析研究,為文化設(shè)施管理單位運(yùn)營(yíng)及管理相關(guān)工作的科學(xué)判斷提供幫助。
第三階段以數(shù)據(jù)運(yùn)營(yíng)為主要功能,通過(guò)前期數(shù)據(jù)積累,為文化建筑管理部門(mén)和行業(yè)提供信息支持,實(shí)現(xiàn)文化設(shè)施資源共享,同時(shí)開(kāi)放自主上傳大數(shù)據(jù)的權(quán)限完善數(shù)據(jù)庫(kù),形成良性互動(dòng),安全高效數(shù)據(jù)體系。
總體功能架構(gòu)分為三層:數(shù)據(jù)層、中間層、應(yīng)用層。
(1)資源層:依托阿里云ODPS、阿里云RDS、文件服務(wù)器、爬蟲(chóng)數(shù)據(jù),逐步接入建筑行業(yè)文化設(shè)施項(xiàng)目相關(guān)數(shù)據(jù),充分匯集互聯(lián)網(wǎng)相關(guān)數(shù)據(jù),全面集成文化設(shè)施專(zhuān)業(yè)數(shù)據(jù),并按照用戶(hù)需求,搭建面向于所有用戶(hù)的游客版訪問(wèn)界面,構(gòu)建適用于專(zhuān)業(yè)用戶(hù)的文化設(shè)施數(shù)據(jù)庫(kù)。
(2)平臺(tái)層:負(fù)責(zé)數(shù)據(jù)與功能應(yīng)用之間的橋接。主要部分由網(wǎng)站后臺(tái)組成,將數(shù)據(jù)從數(shù)據(jù)表中獲取,適當(dāng)轉(zhuǎn)換數(shù)據(jù)格式或組合處理后交給應(yīng)用層直接展示,從而將數(shù)據(jù)層和應(yīng)用層有效隔離。
(3)應(yīng)用層:負(fù)責(zé)數(shù)據(jù)的展示,展現(xiàn)形式包括且不局限于圖表、圖片、表格等。同時(shí)提供網(wǎng)頁(yè)給用戶(hù)直接交互。
文化設(shè)施數(shù)字化平臺(tái)主要針對(duì)建筑行業(yè)所有文化設(shè)施項(xiàng)目的收集與展現(xiàn),作為專(zhuān)業(yè)資料庫(kù)針對(duì)不同用戶(hù)提供專(zhuān)業(yè)的資料儲(chǔ)備。為滿(mǎn)足本項(xiàng)目搜集相關(guān)的文化設(shè)施項(xiàng)目資料,分析文化產(chǎn)業(yè)設(shè)施的基本信息、運(yùn)營(yíng)信息、客群信息,以及給不同的用戶(hù)提供展示項(xiàng)目的詳情、圖片、文章、資料及相關(guān)新聞的信息展示的需要。
數(shù)據(jù)需要通過(guò)數(shù)據(jù)管理模塊自動(dòng)進(jìn)行在線的數(shù)據(jù)收集,完成數(shù)據(jù)收集工作之后需要進(jìn)行數(shù)據(jù)的處理和清洗,之后存入數(shù)據(jù)庫(kù)中統(tǒng)一存儲(chǔ)。同時(shí),數(shù)據(jù)管理模塊還要負(fù)責(zé)對(duì)進(jìn)行實(shí)時(shí)的分發(fā),在網(wǎng)頁(yè)請(qǐng)求數(shù)據(jù)時(shí),讓網(wǎng)頁(yè)能夠和后臺(tái)數(shù)據(jù)保持?jǐn)?shù)據(jù)一致,同時(shí)保持好數(shù)據(jù)的實(shí)時(shí)性。
對(duì)所有文化設(shè)施的相關(guān)數(shù)據(jù)進(jìn)行分類(lèi),打標(biāo)簽。在網(wǎng)頁(yè)上提供相關(guān)的分類(lèi)篩選功能按鈕,幫助用戶(hù)能快速找到、篩選出自己想要的目標(biāo)信息。
對(duì)各個(gè)文化設(shè)施進(jìn)行圖集的收集和展示,直觀展現(xiàn)和文化設(shè)施相關(guān)的各類(lèi)信息。圖片類(lèi)型包含且不局限于效果圖,平立剖,實(shí)景圖等。
使用地圖形式對(duì)文化設(shè)施地理空間相關(guān)的信息進(jìn)行展示。例如根據(jù)經(jīng)緯度,將文化設(shè)施在地圖上繪制成點(diǎn)或者其他標(biāo)注。同時(shí),地圖模塊還應(yīng)該具備一定地圖附加功能,如:周邊搜索、周邊地點(diǎn)導(dǎo)航、路徑規(guī)劃、實(shí)時(shí)交通情況預(yù)覽、街景等一系列對(duì)地圖功能體驗(yàn)提升有幫助的功能。
在數(shù)據(jù)量積累足夠的情況下,可以進(jìn)行對(duì)數(shù)據(jù)的建模分析。借助機(jī)器學(xué)習(xí)思想將數(shù)據(jù)進(jìn)行訓(xùn)練建模,做一些簡(jiǎn)單的分析預(yù)測(cè)功能。
針對(duì)各大網(wǎng)站數(shù)據(jù)的爬取,由于難度、需求不同,技術(shù)可大致分為兩種:非登錄爬取和需登錄爬取。非登錄爬取較為簡(jiǎn)單,使用python的WebScraper庫(kù),爬取對(duì)應(yīng)標(biāo)簽即可完成。針對(duì)需登錄爬取,需要在WebScraper庫(kù)的基礎(chǔ)上,使用selenium瀏覽器內(nèi)核模擬登錄過(guò)程,再爬取對(duì)應(yīng)標(biāo)簽數(shù)據(jù)。同時(shí),爬蟲(chóng)工具的定時(shí)數(shù)據(jù)錄入可考慮在系統(tǒng)層面設(shè)置定時(shí)任務(wù),約定好更新時(shí)間,可以實(shí)現(xiàn)定時(shí)爬取、入庫(kù),保證前端數(shù)據(jù)的實(shí)時(shí)性和更新及時(shí)。
使用關(guān)系型數(shù)據(jù)庫(kù)作為基礎(chǔ),如SQLServer,Oracle等。對(duì)于空間維度數(shù)據(jù),單獨(dú)建表,需要存儲(chǔ)文化設(shè)施的經(jīng)緯度,周邊其他設(shè)施數(shù)量,關(guān)聯(lián)關(guān)系等。對(duì)于時(shí)間維度數(shù)據(jù),也需要單獨(dú)建表,使用時(shí)間戳作為標(biāo)記,長(zhǎng)期更新文化設(shè)施的各項(xiàng)屬性。
前端部分使用HTML+CSS+JS的傳統(tǒng)模式。布局使用BootStrap框架??紤]到網(wǎng)站之后可能存在多人同時(shí)訪問(wèn)的場(chǎng)景,屬于I/O密集型,因此服務(wù)端使用Node.js搭建,提升性能。
考慮到圖表、表格類(lèi)型的多樣性,實(shí)現(xiàn)使用Echarts、Highchart組件。支持餅圖、柱圖、雷達(dá)圖、折線圖、樹(shù)狀圖等多種展現(xiàn)形式,同時(shí)還可支持圖表的動(dòng)畫(huà)效果,定制能力非常豐富,元素也十分多樣。
地圖展示實(shí)現(xiàn)使用百度地圖JS的API,提供散點(diǎn)圖、熱力圖、區(qū)塊圖等多種地圖形式的展示。同時(shí),百度地圖提供了地圖交互能力,可進(jìn)行點(diǎn)導(dǎo)航、實(shí)景街景、搜索周邊等多種地圖功能。涉及到地理分析功能,例如路徑規(guī)劃,空間分析等,使用Arcgis系統(tǒng)建立地理信息圖層,以及內(nèi)置的多種工具幫助完成分析。
模型分析的形式多種多樣,當(dāng)下機(jī)器學(xué)習(xí)框架中的模型主要?dú)w類(lèi)為兩類(lèi):分類(lèi)模型和回歸模型。分類(lèi)模型可使用決策樹(shù)模型,神經(jīng)網(wǎng)絡(luò),KNN等?;貧w模型可使用線性回歸,邏輯回歸,支持向量機(jī)回歸等。針對(duì)模型過(guò)擬合或欠擬合情況,通過(guò)調(diào)整參數(shù)優(yōu)化模型性能。在手動(dòng)調(diào)參的基礎(chǔ)上,還可使用Grid Search等方法自動(dòng)調(diào)整參數(shù)。
應(yīng)用大數(shù)據(jù)技術(shù)推動(dòng)文化設(shè)施的數(shù)字化轉(zhuǎn)型是應(yīng)對(duì)大數(shù)據(jù)時(shí)代帶來(lái)強(qiáng)大沖擊的必然革新。TJAD文化設(shè)施數(shù)字化平臺(tái)融合現(xiàn)代統(tǒng)計(jì)分析技術(shù)與數(shù)據(jù)共享功能等為一體,集中滿(mǎn)足全國(guó)各界對(duì)地方文化設(shè)施建設(shè)、學(xué)術(shù)研究、資料查閱等的信息需求,實(shí)現(xiàn)文化設(shè)施項(xiàng)目信息優(yōu)化整合、數(shù)據(jù)管理的有效融通、數(shù)據(jù)資源的開(kāi)放共享,滿(mǎn)足用戶(hù)個(gè)性化需求,打造文化行業(yè)數(shù)字化新標(biāo)準(zhǔn)。
進(jìn)一步挖掘,企業(yè)可以進(jìn)一步提供以數(shù)據(jù)分析和處理為主的高級(jí)數(shù)據(jù)服務(wù),以數(shù)據(jù)分析作為服務(wù)產(chǎn)品,打造新的細(xì)分市場(chǎng),打造協(xié)助政府管理調(diào)控和企業(yè)經(jīng)營(yíng)決策的重要工具。