求解廣義Fermat-Torricelli問(wèn)題的多層鄰近梯度算法

2019-07-25 08:29:56馬麗麗謝秋玲胡清潔

桂林電子科技大學(xué)學(xué)報(bào) 2019年2期

馬麗麗，謝秋玲，胡清潔

(桂林電子科技大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院，廣西桂林 541004)

Fermat-Torricelli問(wèn)題最初由法國(guó)數(shù)學(xué)家Pierre de Fermat提出，即給定平面上的3點(diǎn)，找到1個(gè)點(diǎn)，使其與3點(diǎn)的歐幾里德距離之和最小。這個(gè)問(wèn)題引發(fā)了對(duì)位置科學(xué)的研究興趣，意大利數(shù)學(xué)家Evangelista·Torricelli最早研究該問(wèn)題。隨后這個(gè)問(wèn)題被稱(chēng)為Fermat-Torricelli問(wèn)題。該問(wèn)題一直是優(yōu)化領(lǐng)域中的一個(gè)研究熱點(diǎn)，在優(yōu)化網(wǎng)絡(luò)[1]、設(shè)施選址[2]、計(jì)算幾何[3]、定位科學(xué)、物流等方面具有廣泛應(yīng)用。l2范數(shù)下廣義Fermat-Torricelli問(wèn)題模型為

(1)

其中：ai∈Rn,i=1,2,…,m；Ω為Rn上的非空閉凸集。集合的廣義Fermat-Torricelli問(wèn)題模型為

(2)

其中：Ωi(i=1,2,…,m)為目標(biāo)集。

近年來(lái)，F(xiàn)ermat-Torricelli問(wèn)題得到廣泛關(guān)注。Weiszfeld[4]首次提出求解Fermat-Torricelli問(wèn)題的算法，隨后，許多研究者對(duì)該算法進(jìn)行了修正和改進(jìn)[5-7]。Nam等[8]提出用Nesterov光滑技術(shù)求解廣義Fermat-Torricelli問(wèn)題，其主要思想是對(duì)原目標(biāo)函數(shù)構(gòu)造光滑逼近，利用加速梯度法求解，并用數(shù)值實(shí)驗(yàn)說(shuō)明算法的有效性。Parpas等[9]基于多層優(yōu)化方法，提出用多層加速梯度鏡面下降算法求解大規(guī)模人臉識(shí)別問(wèn)題，并用數(shù)值實(shí)驗(yàn)驗(yàn)證了該算法的可行性。

為求解廣義Fermat-Torricelli問(wèn)題，基于文獻(xiàn)[9-10]，提出多層鄰近梯度算法，并給出相關(guān)收斂速度分析和數(shù)值實(shí)驗(yàn)。

1 預(yù)備知識(shí)

定義1給定集合Ω?Rn，則

稱(chēng)為集合Ω的示性函數(shù)。

定義2[8]點(diǎn)x到Rn上非空閉凸集Ω的歐式投影為

π(x;Ω)={w∈Ω|d(x;Ω)=‖x-w‖}。

特別地，點(diǎn)x到以δ為中心、r為半徑的立方體集合Ω上的投影為

PΩ(x)=max{δi-r,min{xi,δi+r}}。

2 算法描述

對(duì)模型(1)的目標(biāo)函數(shù)進(jìn)行μ光滑[11]和引入示性函數(shù)，則原問(wèn)題可轉(zhuǎn)化為

同樣地，模型(2)的問(wèn)題可轉(zhuǎn)化為

將上述2個(gè)問(wèn)題的一般形式記為

(3)

其中：f:Rn→R為光滑凸函數(shù)；g:Rn→R為連續(xù)凸函數(shù)不一定光滑。

QL(x,y)=f(x)+〈y-x,f(x)〉+

定義PL(x)=argmin{QL(x,y),y∈Rn}。

多層算法需要在層次之間使用適當(dāng)?shù)男畔鬟f機(jī)制。為了在層次之間傳遞信息，引入線(xiàn)性限制算子R:Rn×nH和延拓算子P:RnH×n，其中nH

σP=RT，

其中σ>0，不失一般性，假設(shè)σ=1。算子的選取參見(jiàn)文獻(xiàn)[12]。

為求解粗糙子問(wèn)題，引入一個(gè)光滑參數(shù)ε>0，對(duì)g(x)進(jìn)行光滑化得到gε(x)，光滑后的目標(biāo)函數(shù)為

Fε(x)=f(x)+gε(x)。

粗糙模型的關(guān)鍵屬性是初始點(diǎn)xH,0處2個(gè)模型的最優(yōu)性條件相匹配，可通過(guò)在粗略模型的目標(biāo)函數(shù)中引入線(xiàn)性項(xiàng)來(lái)實(shí)現(xiàn)。粗糙模型的目標(biāo)函數(shù)為

FH,ε(xH)=fH(xH)+gH,ε(xH)+〈vH,xH〉。

其中：fH(xH)、gH,ε(xH)均為光滑函數(shù)；vH=RFε(x)-(fH(Rx)+gH,ε(Rx))。

迭代過(guò)程中，算法是否使用粗糙模型構(gòu)建搜索方向取決于當(dāng)前迭代點(diǎn)xk的最優(yōu)性條件。進(jìn)行粗糙迭代應(yīng)滿(mǎn)足以下2個(gè)條件：

(4)

為滿(mǎn)足相容性，用xH,0=Rxk開(kāi)始粗糙迭代，通過(guò)一階優(yōu)化方法求解粗糙模型并構(gòu)造搜索方向，

dk(xk)=P(xH,NH-Rxk)，

其中xH,NH∈RnH為執(zhí)行NH次迭代后粗糙模型的近似解。由于通常找不到精確解，利用Nesterov加速梯度算法[8]求解該子問(wèn)題，得到一個(gè)可接受的解xH,NH。

多層鄰近梯度算法的步驟為：

1)選取L>0，τ>0,ε>0,0

2)若粗糙條件(4)不滿(mǎn)足，轉(zhuǎn)步驟3)，否則執(zhí)行NH次粗糙迭代得xH,NH，計(jì)算dk=P(xH,NH-Rxk)。由Armijo線(xiàn)搜索求得步長(zhǎng)sk，

Fε(xk+skdk)≤Fε(xk)+cskFε(xk)Tdk。

3)計(jì)算yk=PL(xk)，若‖xk-yk‖<τ，迭代終止，輸出yk作為近似極小點(diǎn)，否則轉(zhuǎn)步驟4)。

3 收斂速度分析

為了分析多層鄰近梯度算法的收斂速度，首先給出如下4個(gè)引理。

引理1若x∈Rn，存在L>0，使得

Fε(PL(x))≤Q(PL(x),x)

成立，則對(duì)?y∈Rn，有

L〈x-y,PL(x)-x〉。

引理2設(shè){xk}和{yk}是由多層鄰近梯度算法產(chǎn)生的序列，則對(duì)?k≥1，有

其中

vk=Fε(yk)-Fε(y*),uk=tkyk-(tk-1)yk-1-1。

2〈xk+1-yk,yk+1-xk+1〉。

(5)

2〈xk+1-y*,yk+1-xk+1〉。

(6)

‖tk+1(yk+1-xk+1)‖2+2tk+1×

〈tk+1xk+1-(tk+1-1)yk-y*,yk+1-xk+1〉=

‖tk+1yk+1-(tk+1-1)yk-y*‖2-

‖tk+1xk+1-(tk+1-1)yk-y*‖2=

‖tk+1yk+1-(tk+1-1)yk-y*‖2-

‖tkyk-(tk-1)yk-1-y*‖2。

由uk的定義得

引理得證。

引理3[10]設(shè){ak}和{bk}都是正實(shí)數(shù)序列，假設(shè)對(duì)于?k≥1，a1+b1≤c，c>0，ak-ak+1≥bk+1-bk成立，則對(duì)?k≥1，ak≤c也成立。

引理4[10]設(shè){tk}是由多層鄰近梯度算法產(chǎn)生的序列，且t1=1，則對(duì)?k≥1，tk≥(k+1)/2成立。

基于上述4個(gè)引理，估計(jì)該算法的收斂速度。

定理1設(shè){yk}是由多層鄰近梯度算法產(chǎn)生的序列，則對(duì)?k≥1，a1+b1≤c，c>0，有

Fε(y*)-Fε(y1)=Fε(y*)-Fε(PL(y1))≥

等價(jià)于

‖y1-y*‖2-‖x1-y*‖2。

即a1+b1≤c成立，由引理2得ak-ak+1≥bk+1-bk成立，由引理3得

從而可得

定理得證。

4 數(shù)值實(shí)驗(yàn)

為檢驗(yàn)算法的有效性，考慮文獻(xiàn)[8]的數(shù)值算例，采用Matlab編制程序，其測(cè)試環(huán)境為Window 10操作系統(tǒng)，Intel (R) Core (TM) i5-6500 CPU @ 3.20 GHz，8.00 GB RAM。

算例1給定1217個(gè)美國(guó)城市的經(jīng)緯度，其數(shù)據(jù)可從文獻(xiàn)[8]提供的網(wǎng)址找到。為更符合實(shí)際分布情況，將其經(jīng)度乘以-1由正轉(zhuǎn)負(fù)?，F(xiàn)在需要找到一個(gè)點(diǎn)，使得該點(diǎn)到給定美國(guó)城市點(diǎn)的距離之和最小。選取初始點(diǎn)y0=(20,-100)，限制算子R=[1/4 1/2]，粗糙參數(shù)η=0.2，θ=0.8，M=30，利普希茨常數(shù)L=70，精度τ=10-5，得到近似最優(yōu)解y*≈(38.63,-97.35)。美國(guó)各城市及其最優(yōu)點(diǎn)的分布結(jié)果如圖1所示。將多層鄰近梯度算法(MPGA)與迭代收縮閾值算法(FISTA)算法進(jìn)行比較，結(jié)果如表1所示。從表1可看出，在相同的初始值和最優(yōu)解達(dá)到相同精度時(shí)，多層鄰近梯度算法迭代次數(shù)和運(yùn)行時(shí)間較少。

圖1 美國(guó)城市及其最優(yōu)點(diǎn)的分布結(jié)果圖

算法迭代數(shù)運(yùn)行時(shí)間/s近似最優(yōu)解y*MPGA161.43(38.63,-97.35)FISTA222.21(38.63,-97.35)

算例2與算例1的設(shè)置相同，以上述1217個(gè)美國(guó)城市為中心點(diǎn)，半徑r=1.5的1217個(gè)正方形，現(xiàn)在需要在直線(xiàn)x-y=180上找到一個(gè)點(diǎn)，使得該點(diǎn)到1217個(gè)正方形的距離之和最小。選取初始點(diǎn)y0=(0,180)，其他參數(shù)的選取同算例1，最后得到近似最優(yōu)解y*≈(56.84,-123.16)，各廣場(chǎng)及其最優(yōu)點(diǎn)的分布結(jié)果如圖2所示。將多層臨近梯度算法(MPGA)與迭代收縮閾值算法(FISTA)進(jìn)行比較，結(jié)果如表2所示。從表2可看出，在相同的初始值和最優(yōu)解達(dá)到相同精度時(shí)，多層鄰近梯度算法迭代次數(shù)較少，但運(yùn)行時(shí)間略多于FISTA算法。

圖2 美國(guó)廣場(chǎng)及其最優(yōu)點(diǎn)的分布結(jié)果圖

算法迭代數(shù)運(yùn)行時(shí)間/s近似最優(yōu)解y*MPGA381.51(56.84,-123.16)FISTA401.36(56.84,-123.16)

算例3考慮以(-6,6,-4)，(-5,-3,-6)，(2,3,4)，(4,-4,-5)，(5,6,-6)，(-5,-2,4)六個(gè)點(diǎn)為中心，半徑r=1.5的6個(gè)正方體，現(xiàn)在需要找到一個(gè)點(diǎn)，使得該點(diǎn)到6個(gè)正方體的距離之和最小。選取初始點(diǎn)y0=(-6,6,2)，限制算子R=[1/4 1/2 1/4]，粗糙參數(shù)和精度的選取與算例1相同，利普希茨常數(shù)L=0.8，得到近似最優(yōu)解y*≈(-1.040 5,0.840 2,-1.432 2)，正方體及其最優(yōu)點(diǎn)的分布結(jié)果如圖3所示。將多層鄰近梯度算法(MPGA)與迭代收縮閾值算法(FISTA)進(jìn)行比較，結(jié)果如表3所示。從表3可看出，在相同的初始值和最優(yōu)解達(dá)到相同精度時(shí)，多層鄰近梯度算法迭代次數(shù)和運(yùn)行時(shí)間較少。

圖3 正方體及其最優(yōu)點(diǎn)的分布結(jié)果圖

算法迭代數(shù)運(yùn)行時(shí)間/s近似最優(yōu)解y*MPGA110.027 6(-1.040 5,0.840 2,-1.432 2)FISTA160.028 1(-1.040 5,0.802 4,-1.432 2)

5 結(jié)束語(yǔ)