国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于OPTICS聚類(lèi)算法的流場(chǎng)結(jié)構(gòu)特征分析方法

2021-11-13 07:19辛大波歐進(jìn)萍
關(guān)鍵詞:結(jié)構(gòu)特征流場(chǎng)間距

王 銳,辛大波,歐進(jìn)萍

(1. 哈爾濱工業(yè)大學(xué) 土木工程學(xué)院,哈爾濱 150090;2. 東北林業(yè)大學(xué) 土木工程學(xué)院,哈爾濱 150040)

0 引言

長(zhǎng)大跨度橋梁、遠(yuǎn)距離大跨度的輸電塔線(xiàn)、高聳通訊塔桅等基礎(chǔ)設(shè)施,分別構(gòu)成了交通網(wǎng)絡(luò)、能源網(wǎng)絡(luò)和通訊網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),是我國(guó)乃至世界各國(guó)經(jīng)濟(jì)社會(huì)發(fā)展所需要的基礎(chǔ)設(shè)施工程。這些工程結(jié)構(gòu)往往具備長(zhǎng)、柔的特征,對(duì)風(fēng)荷載敏感,易產(chǎn)生顯著的風(fēng)致靜力和振動(dòng)響應(yīng)[1-3]。因此,對(duì)長(zhǎng)、柔結(jié)構(gòu)物的風(fēng)工程問(wèn)題進(jìn)行研究,對(duì)于提高結(jié)構(gòu)抗風(fēng)能力,保障基礎(chǔ)設(shè)施網(wǎng)絡(luò)的安全性、可靠性和魯棒性具有十分重要的意義。

流場(chǎng)結(jié)構(gòu)特征分析是風(fēng)工程研究中的重要內(nèi)容,是揭示結(jié)構(gòu)物周?chē)牧鲌?chǎng)結(jié)構(gòu),歸納流動(dòng)規(guī)律,分析結(jié)構(gòu)的風(fēng)荷載成因與控制方法的必要途徑。一般結(jié)構(gòu)物附近的流場(chǎng)可以由基于計(jì)算流體動(dòng)力學(xué)(CFD)的數(shù)值模擬手段獲得[4-7]。近年來(lái),隨著如粒子圖像測(cè)速(PIV)這樣的流場(chǎng)可視化技術(shù)的發(fā)展,利用風(fēng)洞試驗(yàn)也可以獲取結(jié)構(gòu)周?chē)鲌?chǎng)[8-9]。

流場(chǎng)數(shù)據(jù)一般包含流場(chǎng)區(qū)域中各點(diǎn)對(duì)應(yīng)的速度、渦量、湍動(dòng)能等數(shù)據(jù),是一種典型的高維數(shù)據(jù)。對(duì)流場(chǎng)數(shù)據(jù)的分析要依賴(lài)于各種各樣的降階模型[10]。本征正交分解(POD)是一種在流場(chǎng)動(dòng)力分析中常用的降階方法,其假設(shè)每一個(gè)流場(chǎng)樣本可以視為不同流場(chǎng)模態(tài)的線(xiàn)性組合,并通過(guò)對(duì)特征值問(wèn)題的求解,獲取各流場(chǎng)模態(tài)的統(tǒng)計(jì)顯著程度[11-12]。動(dòng)模態(tài)分解(DMD)則假設(shè)每一個(gè)流場(chǎng)樣本可由上一時(shí)刻的流場(chǎng)樣本通過(guò)線(xiàn)性映射矩陣獲得。相對(duì)于POD,DMD的系統(tǒng)矩陣中囊括了更多的時(shí)序信息,從而能夠獲取更準(zhǔn)確的模態(tài)頻率[13-14]。無(wú)論是POD還是DMD,都需要依賴(lài)于一些動(dòng)力學(xué)假設(shè),但這些假設(shè)相對(duì)于湍流這樣復(fù)雜的動(dòng)力學(xué)問(wèn)題過(guò)于簡(jiǎn)單。因此,有必要研究不依賴(lài)于動(dòng)力學(xué)假設(shè)的流場(chǎng)結(jié)構(gòu)特征分析方法。

Kaiser等提出將聚類(lèi)分析方法引入到流場(chǎng)分析技術(shù)中[10]。聚類(lèi)分析是一種由數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法,用于將樣本數(shù)據(jù)分組為不同類(lèi),每一類(lèi)中的樣本具有一定程度的相似性[10]。聚類(lèi)分析完全依托于流場(chǎng)數(shù)據(jù),不依賴(lài)于動(dòng)力學(xué)假設(shè),因此在流場(chǎng)分析的應(yīng)用上更有前途。目前有一些聚類(lèi)分析在PIV試驗(yàn)[15]和數(shù)值模擬[10,16]結(jié)果分析的應(yīng)用,在對(duì)流場(chǎng)結(jié)構(gòu)特征的分析中取得了較好的結(jié)果。值得注意的是,上述研究中普遍采用的是聚類(lèi)分析中的k-means算法。k-means算法是一種基于平均值的聚類(lèi)算法,即:在所有數(shù)據(jù)中隨機(jī)選取k個(gè)作為初始聚類(lèi)中心,通過(guò)對(duì)樣本和聚類(lèi)中心歐氏距離的計(jì)算和比較,將樣本歸于距離最近的聚類(lèi)中心;分類(lèi)完成后以各類(lèi)樣本平均值作為新的聚類(lèi)中心替換初始聚類(lèi)中心,重復(fù)上述計(jì)算直至本次迭代得到的新聚類(lèi)中心與本次迭代的初始聚類(lèi)中心重合[17]。這樣的算法就意味著,k值的選取不唯一,計(jì)算得到的結(jié)果不唯一,且最終得到的分類(lèi)在樣本中均勻分布。對(duì)于識(shí)別流場(chǎng)的結(jié)構(gòu)特征,k-means算法稍顯粗糙。

考慮到聚類(lèi)算法在流場(chǎng)結(jié)構(gòu)特征分析中的優(yōu)越性和目前常用的k-means方法的一些缺陷,本文將關(guān)注于尋找一種算法以改善基于k-means算法的流場(chǎng)聚類(lèi)分析方法。本文選取了一種基于密度的聚類(lèi)算法OPTICS (Ordering Points To Identify the Clustering Structure),并通過(guò)引入相關(guān)距離的概念替換歐氏距離,形成了基于相關(guān)距離的OPTICS算法。利用基于大渦模擬(LES)的計(jì)算流體動(dòng)力學(xué)(CFD)數(shù)值模擬,獲取了經(jīng)典圓柱繞流尾流中的順流向渦渦量場(chǎng)樣本。以識(shí)別順流向渦脫落狀態(tài)和其A模式分布的展向間距為目標(biāo),檢驗(yàn)基于相關(guān)距離的OPTICS算法的有效性,并分別與原始的OPTICS算法和k-means算法對(duì)比。結(jié)果表明,基于相關(guān)距離的OPTICS算法是一種有效的用于流場(chǎng)結(jié)構(gòu)特征分析的聚類(lèi)分析算法。

1 基于OPTICS算法的流場(chǎng)聚類(lèi)分析

1.1 OPTICS聚類(lèi)算法的基本概念

OPTICS是一種基于密度的聚類(lèi)分析算法,即以數(shù)據(jù)點(diǎn)的空間密度作為判別標(biāo)準(zhǔn),將每個(gè)高密度區(qū)域中的數(shù)據(jù)點(diǎn)作為一類(lèi)。相對(duì)于k-means算法需要由人工設(shè)置初始聚類(lèi)數(shù)目且聚類(lèi)結(jié)果不唯一,OPTICS算法能夠基于初始參數(shù)識(shí)別樣本中的高密度數(shù)據(jù)點(diǎn)集,從而相對(duì)客觀地找到樣本中的高密度區(qū)域,給出符合樣本分布規(guī)律的聚類(lèi)。對(duì)于確定的樣本,其數(shù)據(jù)分布可以唯一確定,因此基于密度判別的OPTICS算法可以獲得相對(duì)穩(wěn)定的聚類(lèi)中心。針對(duì)于流場(chǎng)結(jié)構(gòu)特征分析,當(dāng)選取合理的相似度指標(biāo),OPTICS算法識(shí)別出的高密度數(shù)據(jù)集即意味著該數(shù)據(jù)集中的流場(chǎng)樣本高度相似,也即具備同一特征。那么通過(guò)OPTICS算法的聚類(lèi),就可以相對(duì)客觀地判別流場(chǎng)樣本所包含的結(jié)構(gòu)特征。

假設(shè)已經(jīng)獲得了n組流場(chǎng)數(shù)據(jù)X= [x1,x2,···,xi,··· ,xn],其中xi代表第i個(gè)流場(chǎng)數(shù)據(jù)。每個(gè)流場(chǎng)數(shù)據(jù)為一個(gè)m維向量,代表了流場(chǎng)中的m個(gè)測(cè)量值,也代表了m維歐氏空間中的一個(gè)點(diǎn)。OPTICS算法的關(guān)鍵概念,是對(duì)每一個(gè)xi建立一個(gè)半徑為ε的鄰域Nε(xi),且應(yīng)有不少于MinPts個(gè)數(shù)據(jù)點(diǎn)在該領(lǐng)域中。據(jù)此我們可以引入以下概念[18-19]:

1)密度直達(dá):如果X中的兩個(gè)流場(chǎng)xi、xj(i≠j)滿(mǎn)足:xi∈Nε(xj)且card(Nε(xj)) ≥MinPts,則稱(chēng)xi可由xj密度直達(dá)。其中,card(Nε(xj))表示集合Nε(xj)包含的元素?cái)?shù),card(Nε(xj)) ≥MinPts的條件被稱(chēng)作核心對(duì)象條件,xj可以被稱(chēng)為核心對(duì)象,其他流場(chǎng)數(shù)據(jù)只能由核心對(duì)象密度直達(dá)。

2)密度可達(dá):如果存在一系列X中的流場(chǎng)數(shù)據(jù)xr、xr+1、···、xr+s,當(dāng)i∈[r,r+s? 1]時(shí)xi可由xi+1密度直達(dá),則稱(chēng)xr可由xr+s密度可達(dá)。

3)密度相連:如果X中的流場(chǎng)數(shù)據(jù)xi和xj(i≠j)均可由X中的另一流場(chǎng)數(shù)據(jù)xk(k≠i且k≠j)密度可達(dá),則稱(chēng)xi和xj密度相連。

4)類(lèi):類(lèi)是聚類(lèi)分析得到的結(jié)果,一類(lèi)流場(chǎng)數(shù)據(jù)Y是X的一個(gè)非空子集,且滿(mǎn)足以下兩點(diǎn):①對(duì)任意xi、xj(i≠j)∈X,如果xj∈Y且xi可由xj密度可達(dá),則xi∈Y;②對(duì)任意xi、xj(i≠j)∈X,xi和xj密度相連。如果有些X中的流場(chǎng)數(shù)據(jù)沒(méi)有被分在任何一類(lèi)中,則稱(chēng)之為噪聲。

5)核心距離:從xi到其鄰域Nε(xi)中某一數(shù)據(jù)點(diǎn),使xi成為核心對(duì)象的最小距離,可以數(shù)學(xué)表達(dá)為:

式中:dc(xi)是xi的核心距離;為在xi的鄰域Nε(xi)中,距離xi第MinPts近的流場(chǎng)數(shù)據(jù);d(xi,表示xi和之間的距離。

6)可達(dá)距離:對(duì)xi、xj(i≠j)∈X,xi關(guān)于xj的可達(dá)距離可以定義為:

其含義是,使xi可由xj密度直達(dá)和xj為一個(gè)核心對(duì)象同時(shí)成立的最小距離。

1.2 OPTICS聚類(lèi)算法用于流場(chǎng)聚類(lèi)的步驟

執(zhí)行OPTICS聚類(lèi)算法,需要首先輸入流場(chǎng)數(shù)據(jù)序列X,其次是鄰域半徑ε和鄰域集合最小元素?cái)?shù)MinPts,然后執(zhí)行以下步驟[18]:

1)在X中隨機(jī)選擇一組數(shù)據(jù)xi作為當(dāng)前對(duì)象(執(zhí)行中往往選擇第一組數(shù)據(jù)),將其標(biāo)記為已處理,并描繪在決策圖順序軸的第一個(gè)位置,其對(duì)應(yīng)的可達(dá)距離是無(wú)意義的,一般在程序中賦予一個(gè)較大值。

2)計(jì)算X中所有其他流場(chǎng)數(shù)據(jù)關(guān)于當(dāng)前對(duì)象的可達(dá)距離。

3)找到關(guān)于當(dāng)前對(duì)象可達(dá)距離最小的一組數(shù)據(jù),用該組數(shù)據(jù)替換當(dāng)前對(duì)象并標(biāo)記為已處理,將該組數(shù)據(jù)按處理順序和可達(dá)距離描繪在決策圖對(duì)應(yīng)位置。

4)依次計(jì)算未處理數(shù)據(jù)關(guān)于當(dāng)前對(duì)象的可達(dá)距離,如果這些可達(dá)距離中存在小于步驟3)中計(jì)算出的可達(dá)距離,則將其對(duì)應(yīng)的數(shù)據(jù)替換為當(dāng)前對(duì)象;否則保持原有當(dāng)前對(duì)象不變。

5)重復(fù)步驟3)、4)直至X中所有數(shù)據(jù)處理完畢。

OPTICS算法得到的結(jié)果用決策圖表示。如圖1所示,其橫軸表示流場(chǎng)數(shù)據(jù)的處理順序,其縱軸表示該流場(chǎng)數(shù)據(jù)關(guān)于處理時(shí)當(dāng)前對(duì)象的可達(dá)距離。通過(guò)與已經(jīng)設(shè)置好的鄰域半徑ε對(duì)比,若可達(dá)距離dr<ε,則該可達(dá)距離有意義,其對(duì)應(yīng)的流場(chǎng)數(shù)據(jù)被聚為一類(lèi)。圖1的決策圖表示該組數(shù)據(jù)被聚為三類(lèi)。

圖1 OPTICS算法的決策圖示意Fig. 1 An example of the reachability-plot of OPTICS

2 基于相關(guān)距離的OPTICS聚類(lèi)算法

2.1 基于歐氏距離OPTICS聚類(lèi)算法的缺陷

OPTICS聚類(lèi)算法依賴(lài)于鄰域半徑、核心距離和可達(dá)距離等距離概念,基于這些距離來(lái)判別數(shù)據(jù)的分布密度。傳統(tǒng)的OPTICS算法往往采用歐氏距離[18-19],即將流場(chǎng)數(shù)據(jù)X中的xi和xj視為m維歐式空間中的兩個(gè)點(diǎn),將xi和xj中的元素作為其在m維歐式空間中各個(gè)維度上的坐標(biāo),計(jì)算兩點(diǎn)間的幾何間距。采用歐氏距離定義清晰,計(jì)算方便,但卻忽略了流場(chǎng)數(shù)據(jù)的空間分布特性,割裂了一個(gè)流場(chǎng)數(shù)據(jù)內(nèi)各個(gè)元素間的聯(lián)系,這對(duì)于識(shí)別流場(chǎng)的模式和結(jié)構(gòu)特征是不利的。

2.2 常用相似度指標(biāo)在流場(chǎng)結(jié)構(gòu)特征識(shí)別中的適用性

常見(jiàn)的衡量高維數(shù)組間距離的相似度指標(biāo)包括歐氏距離、切比雪夫距離、閔可夫斯基距離、馬氏距離、相關(guān)系數(shù)、夾角余弦等,其定義如表1所示。根據(jù)這些指標(biāo)的定義,可以將其簡(jiǎn)單分為兩類(lèi),其一是以空間坐標(biāo)間距(ai -bi)為核心的距離概念,包括歐氏距離、曼哈頓距離、切比雪夫距離、閔可夫斯基距離和馬氏距離;其二則是以統(tǒng)計(jì)相關(guān)性為核心的相關(guān)系數(shù)概念,包括夾角余弦、Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)。

表1 衡量高維數(shù)組間相似程度的常見(jiàn)相似度指標(biāo)Table 1 Common indexes for evaluating the similarity among high-dimensional arrays

流場(chǎng)樣本往往是一套以空間坐標(biāo)標(biāo)記的物理量,該物理量可以是流速、壓力、渦量、湍流度、或湍動(dòng)能等。在對(duì)流場(chǎng)結(jié)構(gòu)特征進(jìn)行識(shí)別和分析時(shí),需要將流場(chǎng)樣本的空間坐標(biāo)按一定規(guī)律映射于一個(gè)一維數(shù)組的元素角標(biāo),而該一維數(shù)組中的元素為各角標(biāo)對(duì)應(yīng)的物理量,從而將原始的流場(chǎng)樣本組織為高維數(shù)組。流場(chǎng)的結(jié)構(gòu)特征主要體現(xiàn)在物理量的空間分布,其含義既包括物理量本身的大小,也包括特定大小的物理量出現(xiàn)的空間位置。例如根據(jù)流速和渦量的空間分布,可以識(shí)別流場(chǎng)中旋渦的形狀、位置與強(qiáng)度;根據(jù)鈍體邊界層中壓力的空間分布,可以識(shí)別到鈍體繞流的分離點(diǎn)。因此,識(shí)別流場(chǎng)的結(jié)構(gòu)特征,對(duì)流場(chǎng)樣本進(jìn)行相似度的度量,既需要關(guān)注物理量本身的大小,即流場(chǎng)樣本數(shù)組中的元素大?。灰残枰P(guān)注物理量的空間坐標(biāo),即流場(chǎng)樣本數(shù)組中的元素角標(biāo)。

為了說(shuō)明基于統(tǒng)計(jì)相關(guān)性的相似度指標(biāo)在流場(chǎng)分析中的優(yōu)勢(shì),這里舉例如下。假設(shè)存在三組簡(jiǎn)單的流 場(chǎng) 樣 本:a= [1,0,1]T,b= [0,2,0]T,c= [3,0,3]T。a和c的元素大小不同,但其中較大值的元素出現(xiàn)在相同的位置,即元素的分布規(guī)律相似,這代表著這兩個(gè)樣本具有相似的流場(chǎng)結(jié)構(gòu);a和b中較大值的元素出現(xiàn)在不同位置,這代表著這兩個(gè)樣本的流場(chǎng)結(jié)構(gòu)顯然不同。按上述指標(biāo)計(jì)算a、b之間和a、c之間的距離,結(jié)果如表2所示。顯然,基于空間坐標(biāo)間距(ai-bi)的距離指標(biāo)普遍沒(méi)能識(shí)別出a和c之間具有更加相似的物理量分布,而基于統(tǒng)計(jì)相關(guān)性的夾角余弦、Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)均體現(xiàn)出了這一點(diǎn)。

表2 基于不同相似度指標(biāo)計(jì)算的a、b、c之間的距離Table 2 Distances among a,b and c calculated by different similarity indexes

當(dāng)對(duì)流場(chǎng)樣本這樣的高維數(shù)組進(jìn)行相似度度量時(shí),以空間坐標(biāo)間距(ai-bi)為核心的距離指標(biāo),更加注重元素大小的衡量,而忽略各個(gè)維度間的聯(lián)系;以統(tǒng)計(jì)相關(guān)性為核心的相關(guān)系數(shù)指標(biāo)則偏重于關(guān)注對(duì)元素分布的衡量,這一特性對(duì)于識(shí)別流場(chǎng)物理量的空間分布更加有利。具體分析各個(gè)指標(biāo),其中歐氏距離、曼哈頓距離和切比雪夫距離分別是閔可夫斯基距離在p= 2、p= 1和p趨于正無(wú)窮時(shí)的特殊情況,這一類(lèi)的指標(biāo)顯然割裂了不同維度的元素間的聯(lián)系。馬氏距離的定義式中包含了樣本的協(xié)方差矩陣的逆矩陣,這就要求樣本的協(xié)方差矩陣滿(mǎn)秩,對(duì)于流場(chǎng)樣本這種維度往往在104以上數(shù)量級(jí)而樣本數(shù)相對(duì)少的樣本矩陣,其協(xié)方差矩陣通常不能滿(mǎn)足滿(mǎn)秩的條件。如果采用POD方法對(duì)流場(chǎng)樣本降維處理,又會(huì)引入線(xiàn)性系統(tǒng)的假設(shè)。所以馬氏距離在流場(chǎng)結(jié)構(gòu)特征識(shí)別中只能有限應(yīng)用于樣本量不少于樣本維度的情況。夾角余弦和Pearson相關(guān)系數(shù)形式接近,當(dāng)樣本A和B的均值均為0時(shí),Pearson相關(guān)系數(shù)就可以寫(xiě)作夾角余弦的形式,也即Pearson相關(guān)系數(shù)是排除了樣本元素均值影響的夾角余弦。當(dāng)樣本元素的均值存在較大波動(dòng),基于夾角余弦的相似度衡量可能受到均值的影響。Spearman相關(guān)系數(shù)基于樣本A和B的秩次獲得,也就是忽略樣本中元素的具體數(shù)值,而利用其在所有元素中的大小排序進(jìn)行計(jì)算。Spearman相關(guān)系數(shù)完全忽略了樣本元素的具體數(shù)值,對(duì)于流場(chǎng)這種包含同一物理量的樣本集并不適用。綜上所述,Pearson相關(guān)系數(shù)相對(duì)更適合于作為衡量樣本相似度指標(biāo),應(yīng)用于基于OPTICS聚類(lèi)算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別。

2.3 基于相關(guān)距離的OPTICS聚類(lèi)算法

基于對(duì)流場(chǎng)樣本數(shù)據(jù)特征和各類(lèi)距離指標(biāo)的分析,本文引入基于Pearson相關(guān)系數(shù)的相關(guān)距離的概念,并用相關(guān)距離替換了傳統(tǒng)OPTICS算法采用的歐氏距離,以使OPTICS聚類(lèi)算法更加適用于識(shí)別流場(chǎng)結(jié)構(gòu)特征。首先,Pearson相關(guān)系數(shù)的概念可以按下式定義:

式中:A、B表示兩組相同維度的向量;ρAB為向量A、B的相關(guān)系數(shù);Cov(A,B)為A,B的協(xié)方差;E(A)和E(B)表示A和B的期望;σA和σB表示A和B的標(biāo)準(zhǔn)差。根據(jù)Pearson相關(guān)系數(shù)可以定義向量A、B的相關(guān)距離如下式:

式中:dAB表示向量A、B的相關(guān)距離。相關(guān)距離越小,表明向量A和B越相似;反之則表明向量A和B差異越大。

3 典型圓柱繞流場(chǎng)結(jié)構(gòu)分析實(shí)例

3.1 流場(chǎng)結(jié)構(gòu)特征識(shí)別對(duì)象

圓柱繞流是一種經(jīng)典的鈍體繞流現(xiàn)象,實(shí)際工程結(jié)構(gòu)中具有大量的圓柱形彈性結(jié)構(gòu),例如大跨橋梁的斜拉索、吊索、長(zhǎng)大跨度輸電線(xiàn)、海洋管道等。這些結(jié)構(gòu)極易受到來(lái)流作用而發(fā)生流致響應(yīng),導(dǎo)致結(jié)構(gòu)的疲勞損傷甚至破壞。對(duì)圓柱形結(jié)構(gòu)的三維繞流場(chǎng)進(jìn)行流場(chǎng)結(jié)構(gòu)分析,對(duì)于研究其流致響應(yīng)機(jī)制,開(kāi)發(fā)流動(dòng)控制方法具有重要的作用。因此,本文以識(shí)別圓柱尾流中順流向渦的A模式[20]為目標(biāo),通過(guò)CFD數(shù)值計(jì)算手段獲取流場(chǎng)分析對(duì)象,用來(lái)說(shuō)明基于相關(guān)距離的OPTICS聚類(lèi)算法的優(yōu)越性。數(shù)值模擬對(duì)象為一個(gè)沉浸于均勻流中且與來(lái)流方向正交的靜止圓柱體,長(zhǎng)l= 0.2 m,直徑d= 0.01 m,長(zhǎng)細(xì)比20∶1,其軸線(xiàn)與z軸重合。計(jì)算域?yàn)橐粋€(gè)高20d,半徑為35d,軸線(xiàn)與圓柱模型軸線(xiàn)重合的圓柱體,如圖2所示。計(jì)算域各邊界條件如圖2所示,來(lái)流風(fēng)是U= 0.35 m/s的均勻流,從入口沿x軸方向進(jìn)入,從出口自由流出。計(jì)算的雷諾數(shù)Re約為240。

圖2 計(jì)算域幾何特征與邊界條件Fig. 2 Geometry features and boundary conditions of the calculation domain

計(jì)算域采用結(jié)構(gòu)化網(wǎng)格劃分,共計(jì)包含2187416個(gè)六面體網(wǎng)格。計(jì)算域被沿圓柱軸線(xiàn)等分為67層,每層網(wǎng)格如圖3所示。其中靠近圓柱壁面的網(wǎng)格約為0.1 mm×0.1 mm的正方形,沿周向等分,沿徑向按擴(kuò)散率1.05向外側(cè)擴(kuò)大。圓柱模型表面的壁面y+如圖4所示,模型表面各點(diǎn)的y+均小于0.5,說(shuō)明第一層網(wǎng)格足夠精細(xì)以滿(mǎn)足計(jì)算需求。計(jì)算利用商業(yè)軟件Fluent執(zhí)行瞬態(tài)模擬,采用三維大渦模擬(LES),亞尺度模型選用WALE。動(dòng)量按二階迎風(fēng)格式離散,壓力和瞬態(tài)方程采用二階格式離散。計(jì)算時(shí)間步長(zhǎng)為5×10?5s。

圖3 網(wǎng)格劃分示意Fig. 3 A schematic of the mesh

圖4 圓柱壁面y+Fig. 4 y+ on the surface of the circular cylinder

為了驗(yàn)證數(shù)值計(jì)算結(jié)果的準(zhǔn)確性,本文對(duì)圓柱模型氣動(dòng)力系數(shù)的統(tǒng)計(jì)值和斯托拉哈數(shù)(St)與相關(guān)參考文獻(xiàn)提供的其他試驗(yàn)結(jié)果的擬合值進(jìn)行了對(duì)比,對(duì)比結(jié)果如表3所示。數(shù)值計(jì)算獲得的圓柱阻力系數(shù)時(shí)均值與試驗(yàn)擬合結(jié)果的偏差均小于5%,數(shù)值計(jì)算的St與試驗(yàn)擬合結(jié)果的偏差約為5%,數(shù)值計(jì)算結(jié)果可信。

表3 氣動(dòng)力系數(shù)驗(yàn)證Table 3 The comparison of the numerical and experimental aerodynamic forces

流場(chǎng)分析的識(shí)別目標(biāo)是在x= 2.5d切面上,識(shí)別圓柱尾流中順流向渦的A模式旋渦脫落的兩種狀態(tài)與樣本中包含的兩種展向間距(如圖5所示)。順流向渦的A模式是指在雷諾數(shù)超過(guò)190左右時(shí),圓柱尾流中除卡門(mén)渦之外,出現(xiàn)了旋轉(zhuǎn)軸沿來(lái)流方向的旋渦。其出現(xiàn)方式為一系列沿展向按間距約4d排列的方向相反的旋渦對(duì),與卡門(mén)渦呈相同頻率脫落,并且每半個(gè)卡門(mén)渦脫周期發(fā)生一次旋轉(zhuǎn)方向的變化。由于數(shù)值計(jì)算存在的數(shù)值誤差和尾流中順流向渦本身的不穩(wěn)定性,相當(dāng)于流場(chǎng)本身存在不屬于標(biāo)準(zhǔn)模式的噪聲。有效的流場(chǎng)分析方法應(yīng)當(dāng)能識(shí)別到x= 2.5d切面上,順流向渦的展向分布間距和旋渦脫落的兩個(gè)狀態(tài),并排除噪聲流場(chǎng)的干擾。流場(chǎng)樣本共計(jì)按時(shí)間步長(zhǎng)0.005 s采樣2000份,從流動(dòng)的第4 s采樣至第14 s。樣本數(shù)據(jù)為x= 2.5d切面上的x方向渦量場(chǎng)。

圖5 圓柱尾流中順流向渦的旋渦脫落與A模式示意Fig. 5 The vortex shedding and the A-mode of the streamwise vortices in a circular cylinder wake flow

3.2 基于k-means聚類(lèi)算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別

k-means聚類(lèi)算法中,聚類(lèi)數(shù)目N作為初始參數(shù)輸入,需要利用總方差的概念對(duì)初始聚類(lèi)數(shù)目N進(jìn)行判別。對(duì)于每一類(lèi),可以獲得各樣本圍繞該聚類(lèi)中心的統(tǒng)計(jì)方差,各個(gè)類(lèi)的方差之和即為總方差。理論上當(dāng)N= 1時(shí),總方差達(dá)到最大;當(dāng)N與樣本總數(shù)n相同時(shí),總方差為0,最優(yōu)的聚類(lèi)數(shù)目N應(yīng)當(dāng)在較小的總方差和較少的聚類(lèi)數(shù)目中取得平衡。一般地,最佳聚類(lèi)數(shù)目可以經(jīng)由總方差的“肘形判據(jù)”獲取[10]。本例中嘗試將初始聚類(lèi)數(shù)目N設(shè)置在2~12范圍內(nèi),獲得總方差如圖6所示??偡讲铍S著聚類(lèi)數(shù)目N的增長(zhǎng)單調(diào)下降,斜率逐漸減?。坏乔€(xiàn)上并不能明顯找到“肘部”,“肘形判據(jù)”并不能明確給出最合理的聚類(lèi)數(shù)目。

圖6 k-means算法的方差與初始聚類(lèi)設(shè)置的關(guān)系Fig. 6 The number of initial clusters as a function of the variances of the k-means algorithm

圖7展示了聚類(lèi)數(shù)目分別為2、4、6和8時(shí)的流場(chǎng)分析結(jié)果,每一類(lèi)流場(chǎng)的分析結(jié)果為各類(lèi)流場(chǎng)的聚類(lèi)中心。當(dāng)N= 2時(shí),兩類(lèi)流場(chǎng)分別對(duì)應(yīng)順流向渦脫落的兩個(gè)狀態(tài),可以認(rèn)為捕捉到了順流向渦脫落;但是A模式應(yīng)當(dāng)具有的約4d展向間距的順流向旋渦對(duì)在這兩個(gè)結(jié)果中體現(xiàn)不明顯,兩種展向間距沒(méi)能得到區(qū)分。當(dāng)N> 2時(shí),順流向渦的A模式在部分類(lèi)別中得到體現(xiàn),但由于分類(lèi)增多,出現(xiàn)了兩個(gè)問(wèn)題:其一,順流向渦的脫落狀態(tài)不能被這些類(lèi)明確;其二,當(dāng)N=8時(shí),出現(xiàn)了類(lèi)似的多個(gè)聚類(lèi),即過(guò)度分類(lèi)。

圖7 k-means算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別結(jié)果Fig. 7 The identified flow structures by the k-means algorithm

總的來(lái)說(shuō),k-means算法難以在識(shí)別順流向渦脫落和順流向渦展向間距之間取得平衡。另外k-means算法的輸出結(jié)果嚴(yán)重依賴(lài)輸入的初始聚類(lèi)數(shù)目N,且難以找到相對(duì)最優(yōu)的N。k-means算法在計(jì)算中隨機(jī)選取初始聚類(lèi)中心,所以其聚類(lèi)結(jié)果存在隨機(jī)性,同一組樣本數(shù)據(jù)多次聚類(lèi)的結(jié)果并不一致。

3.3 基于原始OPTICS算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別

OPTICS算法不需要像k-means算法一樣設(shè)置初始聚類(lèi)數(shù)目,其初始參數(shù)是ε鄰域Nε(xi)中最小點(diǎn)數(shù)MinPts和鄰域半徑ε,而最終的聚類(lèi)結(jié)果由決策圖獲得?;贠PTICS算法的流場(chǎng)分析結(jié)果如圖8所示,共計(jì)采用60~200間的六組MinPts,Ni表示第i類(lèi)中的樣本數(shù)量,每個(gè)流場(chǎng)的聚類(lèi)結(jié)果由各類(lèi)中流場(chǎng)樣本的平均場(chǎng)表示。圖8(a)顯示,當(dāng)MinPts= 60,令ε= 1010,可以在決策圖中找到兩個(gè)聚類(lèi),分別對(duì)應(yīng)順流向渦脫落的兩個(gè)狀態(tài),且順流向渦的A模式比較明顯。但是僅識(shí)別到順流向渦對(duì)的4d展向間距,5d的展向間距沒(méi)能在聚類(lèi)結(jié)果中體現(xiàn);且由于MinPts取值較小,造成聚類(lèi)中樣本數(shù)量偏小,大量的樣本被識(shí)別為了噪聲。圖8(b~f)給出了MinPts≥80的5種情況,其決策圖中均只能找到一個(gè)聚類(lèi),這一類(lèi)的聚類(lèi)中心既不能體現(xiàn)順流向渦的脫落,也不能體現(xiàn)A模式渦對(duì)的展向分布。也就是說(shuō),MinPts≥80時(shí),OPTICS算法不能夠識(shí)別出順流向渦渦量場(chǎng)的狀態(tài)。

圖8 原始OPTICS算法的決策圖與聚類(lèi)中心Fig. 8 The reachability-plots and cluster centers of the original OPTICS algorithm

3.4 基于閔可夫斯基距離的OPTICS算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別

閔可夫斯基距離是一種典型的以空間坐標(biāo)間距(ai-bi)為核心的距離指標(biāo),原始OPTICS算法采用的歐氏距離即對(duì)應(yīng)于p= 2時(shí)的閔可夫斯基距離?;陂h可夫斯基距離的OPTICS算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別結(jié)果與原始的基于歐氏距離的OPTICS算法類(lèi)似,圖9列出了p= 5時(shí)的流場(chǎng)分析的決策圖與聚類(lèi)中心,可見(jiàn)MinPts取值在60~120之間時(shí),選取適宜的鄰域半徑ε,都可以得到分別對(duì)應(yīng)于順流向渦脫落的兩個(gè)狀態(tài)的兩個(gè)聚類(lèi)中心。相對(duì)于p= 2時(shí)的聚類(lèi)結(jié)果,能夠識(shí)別旋渦脫落的MinPts取值范圍大幅增大,但仍然沒(méi)能識(shí)別出5d的順流向渦展向間距。

圖9 基于閔可夫斯基距離(p = 5) OPTICS算法的決策圖與聚類(lèi)中心Fig. 9 The reachability-plots and cluster centers of the OPTICS algorithm based on the Minkowski distance (p = 5)

參數(shù)p取值對(duì)閔可夫斯基距離的定義十分重要,對(duì)基于閔可夫斯基距離的OPTICS算法的流場(chǎng)結(jié)構(gòu)識(shí)別結(jié)果也有影響。表4列出了參數(shù)p的取值對(duì)聚類(lèi)中心數(shù)目的影響。當(dāng)利用基于閔可夫斯基距離的OPTICS算法對(duì)順流向渦結(jié)構(gòu)進(jìn)行識(shí)別時(shí),若識(shí)別出兩個(gè)聚類(lèi)中心,其結(jié)果往往對(duì)應(yīng)于順流向渦脫落的兩個(gè)狀態(tài);若識(shí)別出一個(gè)聚類(lèi)中心,則意味著沒(méi)能區(qū)分出任何結(jié)構(gòu)特征。隨著參數(shù)p取值的增加,能夠識(shí)別旋渦脫落特征的MinPts取值范圍逐漸增大。但當(dāng)采用切比雪夫距離,當(dāng)MinPts= 60時(shí)出現(xiàn)了過(guò)度分類(lèi),在識(shí)別出順流向渦脫落特征的同時(shí),將順流向渦脫落的其中一個(gè)狀態(tài)識(shí)別成兩種狀態(tài);而MinPts≥80時(shí)無(wú)法區(qū)分出任何流場(chǎng)結(jié)構(gòu)特征。需要指出的是,當(dāng)聚類(lèi)中心個(gè)數(shù)相同時(shí),基于閔可夫斯基距離的OPTICS算法獲取的決策圖圖形類(lèi)似,聚類(lèi)中樣本數(shù)量普遍偏少,大量的樣本被識(shí)別成了噪聲。

表4 p的取值對(duì)聚類(lèi)數(shù)目的影響Table 4 The effects of p on the number of clustering centers

3.5 基于相關(guān)距離的OPTICS算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別

基于相關(guān)距離的OPTICS算法的初始參數(shù)與原始OPTICS算法一致,區(qū)別僅在于其鄰域半徑ε用相關(guān)距離表達(dá)而非歐氏距離。相關(guān)距離可以根據(jù)夾角余弦、Pearson相關(guān)系數(shù)或者Spearman相關(guān)系數(shù)構(gòu)造,本節(jié)將比較這些不同的相似度指標(biāo)對(duì)基于相關(guān)距離的OPTICS算法的影響。

圖10列出了基于Pearson相關(guān)距離的OPTICS算法獲得的決策圖和對(duì)應(yīng)的聚類(lèi)中心。對(duì)于全部的MinPts的取值,均可以找到適宜的鄰域半徑ε,對(duì)渦量場(chǎng)樣本的特征實(shí)施聚類(lèi)。當(dāng)MinPts取60和80時(shí),能夠找到6個(gè)明顯的聚類(lèi)中心,其中1~4號(hào)聚類(lèi)對(duì)應(yīng)于間距約為5d的順流向渦對(duì)的脫落狀態(tài),由于z= 0.08 m處渦核形狀存在差異,出現(xiàn)了過(guò)度分類(lèi)的情況;5~6號(hào)聚類(lèi)分別對(duì)應(yīng)于間距約為4d的順流向渦對(duì)的兩個(gè)脫落狀態(tài)。兩種間距的順流向渦均可以被視為A模式,其間距差別源于流動(dòng)的動(dòng)力不穩(wěn)定。值得注意的是,前四種聚類(lèi)中心與后兩種聚類(lèi)中心需要分別通過(guò)兩種鄰域半徑ε1和ε2在決策圖中獲得,這就表明,獲取前四種聚類(lèi)與后兩種聚類(lèi)的密度評(píng)估標(biāo)準(zhǔn)不同,也即意味著聚類(lèi)結(jié)果的判別標(biāo)準(zhǔn)不統(tǒng)一。當(dāng)MinPts取100和120時(shí),能夠利用同一鄰域半徑ε找到4個(gè)明顯的聚類(lèi)中心,分別對(duì)應(yīng)于間距約為5d和4d的順流向渦對(duì)的兩個(gè)脫落狀態(tài)。此時(shí)相對(duì)于MinPts< 100的情況,在保證特征識(shí)別準(zhǔn)確的同時(shí),聚類(lèi)數(shù)目也更加合理。當(dāng)MinPts進(jìn)一步增加,聚類(lèi)中心縮減為兩個(gè),分別對(duì)應(yīng)于順流向渦脫落的兩個(gè)狀態(tài),但沒(méi)有能夠區(qū)分兩種渦對(duì)展向間距的情況,這也導(dǎo)致聚類(lèi)中心呈現(xiàn)的渦對(duì)出現(xiàn)了不清晰的情況??梢?jiàn),當(dāng)MinPts取100~120時(shí),基于Pearson相關(guān)距離的OPTICS算法能夠通過(guò)合適的鄰域半徑,識(shí)別到順流向渦結(jié)構(gòu)的展向分布間距和旋渦脫落狀態(tài)。

圖11列出了基于夾角余弦相關(guān)距離的OPTICS算法獲得的決策圖和對(duì)應(yīng)的聚類(lèi)中心。對(duì)比圖10和圖11,會(huì)發(fā)現(xiàn)基于夾角余弦的流場(chǎng)結(jié)構(gòu)識(shí)別結(jié)果與基于Pearson相關(guān)距離的流場(chǎng)結(jié)構(gòu)識(shí)別結(jié)果高度相似,參數(shù)規(guī)律也完全相同。區(qū)別僅在于部分聚類(lèi)的樣本數(shù)目有微小差距。由表1中兩者的定義,可以知道,Pearson相關(guān)系數(shù)相當(dāng)于排除均值后樣本的夾角余弦,所以采用兩種指標(biāo)計(jì)算的核心距離與可達(dá)距離應(yīng)當(dāng)具備相同的規(guī)律,僅在具體數(shù)值上有所區(qū)別。同時(shí),對(duì)于本文選取的渦量場(chǎng)樣本,每個(gè)樣本中除了渦出現(xiàn)的位置存在顯著的渦量值,其他大范圍的背景渦量值接近于0,這導(dǎo)致各個(gè)渦量場(chǎng)樣本的均值也接近于0,從而夾角余弦和Pearson相關(guān)系數(shù)對(duì)于渦量場(chǎng)樣本的計(jì)算結(jié)果也差別極小。采用兩種指標(biāo)進(jìn)行基于OPTICS算法的聚類(lèi),其決策圖和聚類(lèi)結(jié)果也應(yīng)當(dāng)十分接近。

圖10 基于Pearson相關(guān)距離的OPTICS算法的決策圖與聚類(lèi)中心Fig. 10 The reachability-plots and cluster centers of the OPTICS algorithm based on the Pearson-correlation distance

圖11 基于夾角余弦相關(guān)距離的OPTICS算法的決策圖與聚類(lèi)中心Fig. 11 The reachability-plots and cluster centers of the OPTICS algorithm based on the cosine-correlation distance

圖12列出了基于Spearman相關(guān)距離的OPTICS算法獲得的決策圖和對(duì)應(yīng)的聚類(lèi)中心。Spearman相關(guān)系數(shù)僅考慮了流場(chǎng)樣本中渦量值的排序關(guān)系,而忽略了其具體的數(shù)值的影響,這對(duì)OPTICS算法的聚類(lèi)結(jié)果產(chǎn)生了明顯影響。當(dāng)MinPts取60和80時(shí),能夠找到8個(gè)明顯的聚類(lèi)中心,但其中僅能清晰識(shí)別到間距約為4d的順流向渦對(duì)的脫落狀態(tài),而其他的聚類(lèi)結(jié)果并不能清晰地體現(xiàn)渦量場(chǎng)的結(jié)構(gòu)特征。當(dāng)MinPts= 100時(shí),可以識(shí)別出四個(gè)聚類(lèi)中心,分別對(duì)應(yīng)于間距約為5d和4d的順流向渦對(duì)的兩個(gè)脫落狀態(tài);其中間距為5d的順流向渦的脫落狀態(tài)不如采用Pearson相關(guān)系數(shù)或夾角余弦時(shí)的結(jié)果清晰。而MinPts> 100時(shí),可以找到對(duì)應(yīng)于間距約為5d和4d的兩種順流向渦分布,但無(wú)法區(qū)分旋渦脫落的狀態(tài)。這樣的結(jié)果證明,基于Spearman相關(guān)距離的OPTICS算法并不適于流場(chǎng)結(jié)構(gòu)特征的分析。

圖12 基于Spearman相關(guān)距離的OPTICS算法的決策圖與聚類(lèi)中心Fig. 12 The reachability-plots and cluster centers of the OPTICS algorithm based on the Spearman-correlation distance

表5列出了本節(jié)討論的各種聚類(lèi)算法用于流場(chǎng)結(jié)構(gòu)特征分析算例的結(jié)果對(duì)比,結(jié)合具體的聚類(lèi)中心分析結(jié)果,基于Pearson相關(guān)距離和基于夾角余弦的OPTICS算法在本算例的流場(chǎng)結(jié)構(gòu)分析中獲得了準(zhǔn)確的分析結(jié)果。

表5 不同流場(chǎng)結(jié)構(gòu)特征分析聚類(lèi)算法的對(duì)比Table 5 A comparison of among the different clustering algorithms for analyzing flow structure characteristics

4 基于相關(guān)距離的OPTICS聚類(lèi)算法進(jìn)行流場(chǎng)結(jié)構(gòu)特征識(shí)別的魯棒性分析

本節(jié)考慮基于前述數(shù)值模擬獲取的流場(chǎng)樣本實(shí)例,通過(guò)在樣本中加入噪聲的方式,分析樣本噪聲強(qiáng)度和噪聲樣本的數(shù)量對(duì)聚類(lèi)分析結(jié)果魯棒性的影響。

4.1 測(cè)試樣本的構(gòu)造方法與聚類(lèi)結(jié)果的評(píng)判指標(biāo)

前述數(shù)值模擬共計(jì)獲得2000個(gè)流場(chǎng)樣本,在這些樣本中隨機(jī)抽取一定數(shù)量的樣本,按下式添加高斯噪聲:

式中:xi′表示流場(chǎng)樣本X中已添加噪聲的樣本,xi表示流場(chǎng)樣本X中被隨機(jī)選中的待添加噪聲的原始樣本,e表示均值為0標(biāo)準(zhǔn)差為1的高斯隨機(jī)序列,δ則為高斯隨機(jī)序列的縮放系數(shù),可以表征噪聲的強(qiáng)度。測(cè)試樣本由未被抽取的原始樣本和隨機(jī)抽取后添加噪聲的樣本混合構(gòu)造,每種參數(shù)工況按3種不同的隨機(jī)序列分別構(gòu)造3個(gè)測(cè)試樣本。

考慮到數(shù)值模擬獲得的渦量場(chǎng)樣本,其渦量為101~102量級(jí),所以本節(jié)探討以下7種δ取值:0.1、0.3、1、3、10、30、100,它們對(duì)應(yīng)的噪聲樣本如圖13所示。隨機(jī)抽取用以添加噪聲的樣本數(shù)目則利用樣本代換率Rs表示:

圖13 添加不同強(qiáng)度噪聲的流場(chǎng)樣本示例Fig. 13 The flow fields with different intensities of the Gaussian-noise

本節(jié)討論的Rs取值情況為:1%、2%、5%、15%和50%。

由于流場(chǎng)本身動(dòng)力系統(tǒng)的復(fù)雜性,較難提取到標(biāo)準(zhǔn)的流場(chǎng)結(jié)構(gòu)特征聚類(lèi)。所以聚類(lèi)分析結(jié)果的評(píng)判,要基于測(cè)試樣本聚類(lèi)結(jié)果相對(duì)于原始樣本聚類(lèi)結(jié)果的偏移,即衡量測(cè)試樣本聚類(lèi)中心和原始樣本聚類(lèi)中心的相關(guān)距離。這一衡量指標(biāo)可以按下式定義為各個(gè)聚類(lèi)中心偏移量的算術(shù)平均:

式中:dcenter為基于相關(guān)距離的聚類(lèi)中心偏移指標(biāo),N為聚類(lèi)數(shù)目,dc′,c,i表示測(cè)試樣本C′與原始樣本C的第i個(gè)聚類(lèi)中心的相關(guān)距離。在原始樣本的聚類(lèi)結(jié)果中(圖10),MinPts= 100且ε= 0.644的結(jié)果可以作為用于衡量聚類(lèi)結(jié)果魯棒性的基準(zhǔn)聚類(lèi)中心。

4.2 噪聲強(qiáng)度δ對(duì)聚類(lèi)結(jié)果的影響規(guī)律

圖14列出了各種樣本代換率下,dcenter隨噪聲強(qiáng)度δ的變化規(guī)律??梢?jiàn)針對(duì)所有的Rs設(shè)置,dcenter均隨δ的增長(zhǎng)而增加;在對(duì)數(shù)坐標(biāo)下,dcenter的增長(zhǎng)隨著δ的增長(zhǎng)而趨緩。這表明,當(dāng)噪聲強(qiáng)度較大時(shí),噪聲強(qiáng)度對(duì)聚類(lèi)中心的偏移影響減小。當(dāng)樣本代換率Rs≤5%,噪聲強(qiáng)度造成的聚類(lèi)中心偏移的相關(guān)距離普遍不超過(guò)0.05,也即意味著此時(shí)測(cè)試樣本的聚類(lèi)中心與原始樣本的聚類(lèi)中心高度相關(guān),聚類(lèi)結(jié)果穩(wěn)定。此時(shí),流場(chǎng)樣本的噪聲對(duì)流場(chǎng)結(jié)構(gòu)識(shí)別結(jié)果幾乎沒(méi)有影響。當(dāng)樣本代換率Rs≥15%,在引入較小噪聲(δ≤10)時(shí),測(cè)試樣本的聚類(lèi)中心偏移量最大約為0.10,此時(shí)測(cè)試樣本的聚類(lèi)中心與原始樣本的聚類(lèi)中心仍然高度相關(guān)。但當(dāng)引入較大噪聲(δ≥30)時(shí),部分測(cè)試樣本已經(jīng)無(wú)法被識(shí)別到對(duì)應(yīng)于原始樣本聚類(lèi)中心的四種聚類(lèi),因此在圖14(d)和圖14(e)中缺失了部分樣本δ≥30的數(shù)據(jù)點(diǎn),此時(shí)基于相關(guān)距離的OPTICS聚類(lèi)算法無(wú)法在原有的初始參數(shù)設(shè)置下實(shí)現(xiàn)流場(chǎng)結(jié)構(gòu)特征分析識(shí)別。

圖14 噪聲強(qiáng)度δ對(duì)聚類(lèi)中心偏移量dcenter的影響Fig. 14 Effects of the noise intensity (δ) on the displacements of the clustering centers (dcenter)

4.3 樣本代換率Rs對(duì)聚類(lèi)結(jié)果的影響規(guī)律

圖15列出了噪聲強(qiáng)度0.1≤δ≤10時(shí),dcenter隨樣本代換率Rs的變化規(guī)律。針對(duì)所有的δ設(shè)置,dcenter均隨Rs的增長(zhǎng)而呈現(xiàn)大致增長(zhǎng)的趨勢(shì);在對(duì)數(shù)坐標(biāo)下,dcenter的增長(zhǎng)率隨著δ的增加而下降。這表明,當(dāng)噪聲強(qiáng)度增加時(shí),樣本代換率對(duì)聚類(lèi)中心的偏移影響減小。根據(jù)圖15,當(dāng)噪聲強(qiáng)度有限時(shí),樣本代換率幾乎不影響基于相關(guān)距離的OPTICS算法的流場(chǎng)結(jié)構(gòu)特征識(shí)別的結(jié)果。

圖15 樣本代換率Rs對(duì)聚類(lèi)中心偏移量dcenter的影響Fig. 15 Effects of the sample-replacement ratio (Rs) on the displacements of the clustering centers (dcenter)

5 結(jié)論

本文基于OPTICS聚類(lèi)算法,在分析流場(chǎng)數(shù)據(jù)特征與多種相似度評(píng)判指標(biāo)的基礎(chǔ)上,引入相關(guān)距離的概念加以改進(jìn),提出利用基于相關(guān)距離的OPTICS算法進(jìn)行流場(chǎng)結(jié)構(gòu)特征分析。該方法依托基于Pearson相關(guān)系數(shù)的相關(guān)距離指標(biāo),不需要?jiǎng)恿W(xué)假設(shè),僅依靠數(shù)據(jù)驅(qū)動(dòng)。本文通過(guò)基于LES的CFD數(shù)值模擬,對(duì)經(jīng)典的圓柱繞流問(wèn)題進(jìn)行瞬態(tài)計(jì)算,獲取了2000個(gè)流場(chǎng)樣本。以識(shí)別順流向渦的旋渦脫落狀態(tài)和A模式分布為目標(biāo),對(duì)比了k-means、原始的OPTICS、基于閔可夫斯基距離的OPTICS和基于相關(guān)距離的OPTICS等聚類(lèi)算法的有效性,并對(duì)基于Pearson相關(guān)距離的OPTICS識(shí)別流場(chǎng)結(jié)構(gòu)特征的魯棒性進(jìn)行了分析。結(jié)果表明:

1)相對(duì)于k-means算法、原始的OPTICS算法和基于閔可夫斯基距離的OPTICS算法,基于Pearson相關(guān)距離的OPTICS算法可以有效識(shí)別出圓柱尾流中順流向渦脫落的兩種狀態(tài),以及A模式順流向渦的兩種不同的展向間距。針對(duì)本文的算例,基于夾角余弦相關(guān)距離的OPTICS算法也可以獲得與基于Pearson相關(guān)距離的OPTICS算法高度相似的結(jié)果,其原因在于算例樣本的元素均值幾乎為0,樣本元素均值對(duì)于夾角余弦的影響很?。欢赟pearman相關(guān)距離的OPTICS算法的識(shí)別結(jié)果相對(duì)不夠清晰,適宜的初始參數(shù)范圍較小。

2)基于Pearson相關(guān)距離的OPTICS算法,可以在MinPts取100~120時(shí),通過(guò)設(shè)置合適的鄰域半徑,識(shí)別到順流向渦結(jié)構(gòu)的展向分布間距和旋渦脫落狀態(tài)。MinPts取值小于100會(huì)導(dǎo)致流場(chǎng)結(jié)構(gòu)聚類(lèi)結(jié)果的過(guò)度分類(lèi),而MinPts取值大于120時(shí)會(huì)失去識(shí)別順流向渦展向間距的能力。

3)相對(duì)于k-means算法,基于各種相似度指標(biāo)的OPTICS算法均提升了聚類(lèi)結(jié)果的穩(wěn)定性,降低了聚類(lèi)結(jié)果對(duì)初始參數(shù)的敏感性,保證了在確定的初始參數(shù)下,聚類(lèi)結(jié)果唯一。相關(guān)距離概念的引入則改善了原始OPTICS算法對(duì)流場(chǎng)結(jié)構(gòu)特征的識(shí)別能力,其中以Pearson相關(guān)系數(shù)和夾角余弦為指標(biāo)計(jì)算的相關(guān)距離效果最佳。

4)基于Pearson相關(guān)距離的OPTICS算法,當(dāng)初始參數(shù)設(shè)置為MinPts= 100時(shí),在噪聲樣本量少于總樣本量的5%時(shí),可以在高強(qiáng)度高斯噪聲(δ≤100)樣本的干擾下,依然識(shí)別到清晰的流場(chǎng)結(jié)構(gòu)特征,噪聲樣本造成的聚類(lèi)中心偏移的相關(guān)距離不超過(guò)0.05;而當(dāng)噪聲樣本量超過(guò)樣本總量15%時(shí),基于相關(guān)距離的OPTICS算法可以在引入δ≤10的噪聲強(qiáng)度下實(shí)現(xiàn)較穩(wěn)定的流場(chǎng)結(jié)構(gòu)特征識(shí)別,噪聲造成的聚類(lèi)中心偏移的相關(guān)距離不超過(guò)0.10。

猜你喜歡
結(jié)構(gòu)特征流場(chǎng)間距
論莫言小說(shuō)的復(fù)線(xiàn)式結(jié)構(gòu)特征
車(chē)門(mén)關(guān)閉過(guò)程的流場(chǎng)分析
液力偶合器三維渦識(shí)別方法及流場(chǎng)時(shí)空演化
開(kāi)始和結(jié)束
淮南花家湖輪蟲(chóng)群落結(jié)構(gòu)特征及季節(jié)變化
基于機(jī)器學(xué)習(xí)的雙橢圓柱繞流場(chǎng)預(yù)測(cè)
缺氮脅迫對(duì)小麥根際土壤微生物群落結(jié)構(gòu)特征的影響*
調(diào)整圖標(biāo)間距讓桌面布局更個(gè)性
非均勻間距的低副瓣寬帶微帶陣列天線(xiàn)設(shè)計(jì)
真實(shí)流場(chǎng)中換熱管流體誘導(dǎo)振動(dòng)特性研究
嵊州市| 留坝县| 家居| 汤阴县| 泸西县| 永宁县| 兴城市| 白山市| 新巴尔虎左旗| 漳浦县| 镇宁| 习水县| 襄垣县| 绥宁县| 英超| 阳谷县| 神池县| 沙田区| 郴州市| 景泰县| 大渡口区| 顺平县| 凤阳县| 吉安市| 通许县| 兴山县| 武穴市| 浦城县| 泊头市| 山西省| 天水市| 神木县| 九龙县| 虎林市| 伊宁县| 彝良县| 资中县| 大连市| 柘荣县| 新兴县| 龙里县|