陳文浩
(汕頭市測(cè)繪研究院,廣東汕頭 515041)
基于SPSS的沉降觀測(cè)數(shù)據(jù)異常值探測(cè)與回歸分析
陳文浩?
(汕頭市測(cè)繪研究院,廣東汕頭 515041)
沉降觀測(cè)數(shù)據(jù)受各種因素影響,觀測(cè)數(shù)據(jù)的處理極其重要,本文提出利用SPSS軟件對(duì)建筑物沉降觀測(cè)數(shù)據(jù)進(jìn)行異常值探測(cè)并進(jìn)行科學(xué)取舍的思路和方法,并經(jīng)過樣本測(cè)試,分析比較對(duì)實(shí)測(cè)數(shù)據(jù)的回歸分析法中幾種曲線擬合法在預(yù)測(cè)沉降點(diǎn)變化中的各自的有效性和精確性。
SPSS;建筑物;沉降;觀測(cè);異常值;探測(cè);回歸分析
隨著社會(huì)的不斷進(jìn)步與發(fā)展、先進(jìn)科學(xué)技術(shù)與新型材料在建筑領(lǐng)域中的廣泛應(yīng)用,高層與超高層建(構(gòu))筑物的出現(xiàn)越來越多,為保證高層建筑物本身的正常使用壽命與安全性以及考慮對(duì)周邊建筑群體帶來的復(fù)雜變形影響,必須從施工到竣工直至沉降穩(wěn)定階段進(jìn)行周期性的沉降觀測(cè),研究其沉降原因和規(guī)律,為建筑物的設(shè)計(jì)、施工、運(yùn)營(yíng)維護(hù)及科學(xué)研究提供可靠資料,及時(shí)反饋信息,預(yù)防不均勻沉降和裂縫的出現(xiàn)。
沉降觀測(cè)中對(duì)觀測(cè)數(shù)據(jù)的處理極其重要,但是觀測(cè)數(shù)據(jù)受各種復(fù)雜因素的影響,存在各種誤差甚至粗差。通常的做法是在沉降觀測(cè)前采取各種措施預(yù)先防止各種系統(tǒng)誤差和偶然誤差的產(chǎn)生,通過內(nèi)外業(yè)數(shù)據(jù)檢查剔除粗差后再對(duì)沉降觀測(cè)數(shù)據(jù)進(jìn)行平差計(jì)算得到當(dāng)期沉降數(shù)據(jù),最后通過對(duì)多期觀測(cè)數(shù)據(jù)的分析對(duì)建筑物的穩(wěn)定性做出相應(yīng)的評(píng)價(jià)和預(yù)測(cè)[1]。
本文以某新建高層建筑物的沉降量曲線出現(xiàn)的異常抖動(dòng)現(xiàn)象為研究對(duì)象,使用SPSS統(tǒng)計(jì)分析軟件,對(duì)數(shù)據(jù)進(jìn)行異常值探測(cè),排除異常的數(shù)據(jù),從而達(dá)到優(yōu)化計(jì)算數(shù)據(jù)并更好地體現(xiàn)出沉降規(guī)律的目的,最后通過回歸分析進(jìn)行穩(wěn)定性的預(yù)測(cè),以指導(dǎo)后期施工和設(shè)備安裝。
在靜態(tài)沉降觀測(cè)中,幾乎所有的新建建筑物的沉降總是一個(gè)緩慢沉降并趨于穩(wěn)定的過程,各沉降點(diǎn)的沉降速度均勻且趨于平坦,如圖1所示。
但是通過觀察沉降點(diǎn)的沉降量曲線,會(huì)發(fā)現(xiàn)這些曲線并不是平緩的,各期之間的沉降差也不是均勻的,沉降量曲線在某幾個(gè)周期會(huì)出現(xiàn)異常抖動(dòng)的情況,如圖2所示。
圖1 建筑物X2號(hào)沉降點(diǎn)最后100 d沉降速度線
圖2 建筑物X2號(hào)沉降點(diǎn)沉降過程線
通過現(xiàn)場(chǎng)荷載試驗(yàn)[2]的結(jié)論可知當(dāng)荷載小于其臨界荷載時(shí),p-s之間呈直線關(guān)系,即可排除荷載對(duì)沉降量異常的影響;通過外業(yè)檢查,排除了工作基點(diǎn)和監(jiān)測(cè)點(diǎn)被破壞的情況。下面通過統(tǒng)計(jì)學(xué)分析,對(duì)這些由于偶然誤差以及外界條件的影響而造成異常的數(shù)據(jù)進(jìn)行檢驗(yàn),科學(xué)地對(duì)數(shù)據(jù)進(jìn)行取舍。
2.1 數(shù)據(jù)異常值探測(cè)
數(shù)據(jù)曲線擬合及分析的傳統(tǒng)方法是采用最小二乘法和坐標(biāo)紙作圖法,這種手工做法計(jì)算量大,精度不高,數(shù)據(jù)的計(jì)算機(jī)處理已經(jīng)成為趨勢(shì)。目前常見的方法是使用自編程序或Excel、Grapher等軟件。自編軟件往往功能單一,可視化功能差;Excel軟件功能雖然較強(qiáng),但對(duì)數(shù)據(jù)的處理過程中針對(duì)性不強(qiáng),數(shù)據(jù)分析能力弱。而SPSS數(shù)據(jù)分析軟件適合于中小型數(shù)據(jù)庫(kù)的處理、分析和可視化表達(dá),應(yīng)用比較廣泛。
(1)SPSS探索分析過程
SPSS的探索性分析(Explore)過程,適用于對(duì)數(shù)值型的變量(連續(xù)型或比率型)進(jìn)行分析,能夠生成關(guān)于所有個(gè)案、或不同分組個(gè)案的綜合統(tǒng)計(jì)量及圖形,并進(jìn)行數(shù)據(jù)篩選工作,還可以進(jìn)行假設(shè)檢驗(yàn)。此過程對(duì)數(shù)據(jù)的分布沒有特定限制。以該新建建筑物X2號(hào)點(diǎn)的沉降觀測(cè)數(shù)據(jù)為例,通過探索性分析對(duì)這些數(shù)據(jù)加以詳細(xì)描述,并進(jìn)行數(shù)據(jù)的篩選。
(2)數(shù)據(jù)描述
該沉降點(diǎn)于2009年11月25日開始首次觀測(cè),于2010年10月14日結(jié)束觀測(cè),共觀測(cè)38期,觀測(cè)數(shù)據(jù)如表1所示。
表1 X2沉降點(diǎn)沉降觀測(cè)數(shù)據(jù)
(3)異常值探測(cè)結(jié)果
①不考慮日期間隔的影響
選取期沉降量為因變量進(jìn)行探測(cè),描述性輸出結(jié)果如表2所示,直方圖如圖3所示,箱圖如圖4所示。
表2 描述性輸出
由圖4可知,第2期以及第8期數(shù)據(jù)存在值偏低的異常,第7期以及第9期數(shù)據(jù)存在值偏高的異常。
圖3 直方圖
圖4 箱圖
②考慮時(shí)間間隔的影響
使用期沉降量作為因變量,同時(shí)選取時(shí)間間隔(天為單位)作為因子,考察在相同時(shí)間間隔下的數(shù)據(jù)異常。正態(tài)性檢驗(yàn)結(jié)果如表3所示,其中時(shí)間間隔為7 d的直方圖如圖5所示,散點(diǎn)圖如圖6所示,箱圖如圖7所示。
表3 正態(tài)性檢驗(yàn)
圖5 直方圖(時(shí)間間隔7 d)
圖6 趨降標(biāo)準(zhǔn)散點(diǎn)圖(時(shí)間間隔7 d)
圖7 箱圖
由圖7可知,在考慮時(shí)間間隔的情況下,第8期和第9期的數(shù)據(jù)存在異常。
通過兩種探測(cè)思路的綜合分析,得出第8期以及第9期的數(shù)據(jù)屬于異常,需要在計(jì)算時(shí)進(jìn)行排除。
2.2 數(shù)據(jù)異常值探測(cè)的檢驗(yàn)
利用SPSS中的頻數(shù)分析功能,通過比較去除異常值前后的計(jì)算結(jié)果,來對(duì)去除的效果進(jìn)行檢驗(yàn),異常值消除前后頻數(shù)分析如表4所示,直方圖比較如圖8所示。
表4 異常值消除前后頻數(shù)分析
圖8 消除異常值前后直方圖比較
從偏度和峰度來看,消除異常值后的數(shù)據(jù)確實(shí)能更好地表達(dá)沉降趨勢(shì)。
SPSS的曲線估計(jì)模塊能夠自動(dòng)擬合包括線性模型、對(duì)數(shù)曲線模型、二次曲線模型和指數(shù)模型在內(nèi)的十幾種曲線模型。輸出的統(tǒng)計(jì)量包括模型的回歸系數(shù)、復(fù)向光系數(shù)、調(diào)整R方和方差分析表等。
由于沉降數(shù)據(jù)中存在非正數(shù)值,所以不能進(jìn)行冪模型和指數(shù)模型計(jì)算。選取線性模型、二次曲線模型、對(duì)數(shù)模型,使用時(shí)間序列對(duì)該沉降點(diǎn)的累計(jì)沉降量進(jìn)行回歸分析,比較模型如表5、圖9所示,數(shù)值比較如表6所示。
表5 模型與參數(shù)估計(jì)值輸出(因變量:累計(jì)沉降量)
圖9 三種模型曲線擬合圖
表6 三種模型計(jì)算數(shù)據(jù)比較表(最后10期)
通過比較可以看出,線性模型達(dá)到的預(yù)測(cè)效果最好。
基于誤差理論及精度控制,運(yùn)用數(shù)理統(tǒng)計(jì)知識(shí)和SPSS軟件,提出了對(duì)建筑物沉降觀測(cè)數(shù)據(jù)進(jìn)行異常值探測(cè)并進(jìn)行科學(xué)取舍的思路和方法。經(jīng)過樣本測(cè)試,得到了回歸分析法的曲線擬合法在預(yù)測(cè)沉降點(diǎn)變化中的各自的有效性和精確性。
本文研究的出發(fā)點(diǎn)僅是從單一變量對(duì)沉降量的影響進(jìn)行考量,但是往往現(xiàn)場(chǎng)觀測(cè)具有復(fù)雜性和沉降環(huán)境的多變性,因此對(duì)于不同的觀測(cè)環(huán)境和地基條件,還待于獲得更多資料進(jìn)行更為詳細(xì)的研究。
[1] 陳小榮,雷勁松.高層建筑沉降觀測(cè)數(shù)據(jù)處理與分析新方法[J].四川建筑科學(xué)研究,2009(6):119~124.
[2] 游祖吉,樊功瑜.測(cè)量平差教程[M].北京:測(cè)繪出版社, 1991:279~281.
[3] 杜強(qiáng)賈麗燕.SPSS統(tǒng)計(jì)分析從入門到精通[M].北京:人民郵電出版社,2009.
[4] 陳東東,馬大喜.某小區(qū)高層建筑沉降觀測(cè)技術(shù)及數(shù)據(jù)分析[J].城市勘測(cè),2013(5):127~130.
[5] 胡杰.形變分析中的模型精化研究[J].城市勘測(cè),2012 (6):148~151.
Detection of Outliers and Regression Analysis Based on Observational Data SPSS for Settlement
Chen Wenhao
(Shantou Institute of Surveying and Mapping,Shantou 515041,China)
Settlement observation data affected by various factors,treatment is extremely important observation data, we propose the use of SPSS software for building settlement observation data to detect abnormal values and trade-offs of scientific ideas and methods,and after sample tests,analysis and comparison of the measured data several regression analysis predicting subsidence curve fitting point in changing their validity and accuracy.
SPSS;building;settlement;observations;outliers;probe;regression analysis
2014—02—02
陳文浩(1973—),男,工程師,現(xiàn)主要從事測(cè)繪技術(shù)與經(jīng)營(yíng)管理工作。