陳世軍
( 福建工程學(xué)院 應(yīng)用技術(shù)學(xué)院, 福建 福州 350001 )
在控制理論、隨機(jī)濾波和超分辨率圖像恢復(fù)等領(lǐng)域,會(huì)遇到形如
X+E1X-1F1+E2X-2F2+E3X-3F3=G
(1)
的含有未知矩陣高次逆冪的非線性矩陣方程[1-4],其中Ei,F(xiàn)i,G,X∈Rn×n(i=1,2,3).文獻(xiàn)[5-8]研究了牛頓算法在求解線性方程和非線性方程中的應(yīng)用.程可欣等[8]研究了方程(1)的特例X-ATX-1A=Q的牛頓迭代解法,證明了牛頓迭代方法產(chǎn)生的矩陣序列包含在確定的閉球內(nèi),且該矩陣序列收斂到閉球內(nèi)唯一的矩陣方程的解.張肖肖等[9]給出了方程(1)對(duì)稱解的雙迭代算法,其先用牛頓算法求出等價(jià)的線性矩陣方程的對(duì)稱解,然后再采用修正共軛梯度算法(MCG算法)求出由牛頓算法每一步迭代計(jì)算導(dǎo)出的線性方程的對(duì)稱解或?qū)ΨQ最小二乘解.目前,對(duì)于方程(1)的中心對(duì)稱解的研究還未見(jiàn)報(bào)道.為此,本文基于文獻(xiàn)[9]的算法原理,將牛頓-MCG算法推廣到求解方程(1)的中心對(duì)稱解上.
定義1劃分n階單位矩陣I=(e1,e2,…,en), 稱Sn=(en,en-1,…,e1)為n階次單位矩陣.若X∈Rn×n滿足SnXSn=X, 稱X為中心對(duì)稱矩陣,用CSRn×n表示中心對(duì)稱矩陣集合.
基于文獻(xiàn)[9]的算法原理,建立求非線性矩陣方程(1)中心對(duì)稱解的牛頓-MCG算法.令X=X-1,則方程(1)可以改寫(xiě)為
X-1+E1XF1+E2X2F2+E3X3F3=G.
(2)
首先用牛頓算法求方程(2)的中心對(duì)稱解,然后采用MCG算法求由牛頓算法每一步迭代計(jì)算導(dǎo)出的線性矩陣方程的中心對(duì)稱解或中心對(duì)稱最小二乘解,以此建立求方程(2)中心對(duì)稱解的牛頓-MCG算法.
根據(jù)定義2可知,當(dāng)-X-1Y的譜半徑小于1時(shí),有
引入下列矩陣函數(shù):
又因?yàn)?/p>
ψ(X+Y)=(X+Y)-1+E1(X+Y)F1+E2(X+Y)2F2+E3(X+Y)3F3-G=
E2YXF2+E3X3F3+E3X2YF3+E3XYXF3+E3XY2F3+E3YX2F3+E3YXYF3+
E3Y2XF3+E3Y3F3-G,
容易導(dǎo)出ψ(X+Y)=ψ(X)+φX(Y)+γX(Y).這里φX(Y)是ψ(X)在“點(diǎn)X”沿著“方向Y”的Frechet導(dǎo)數(shù).
引理1[9]設(shè)X∈CSRn×n是方程(1)的近似解,則求方程(1)的解X等價(jià)于求校正值Y∈CSRn×n使得ψ(X+Y)=O, 并可以線性化為求Y∈CSRn×n, 使得
φX(Y)=-ψ(X).
(3)
參考文獻(xiàn)[9]的算法原理,通過(guò)修改某些矩陣的類型,建立求方程(1)中心對(duì)稱解的牛頓算法,該算法的具體步驟如下:
第1步 給定初始矩陣X(1)∈CSRn×n, 置k∶=1.
第3步 計(jì)算X(k+1)=X(k)+Y(k), 置k∶=k+1, 轉(zhuǎn)第2步.
對(duì)于牛頓算法有如下的收斂性結(jié)論:假設(shè)X*是方程(1)的單根,且初始矩陣X(1)充分接近X*,那么牛頓算法確定的矩陣序列{X(k)}二次收斂于X*.
記A1=E1,B1=F1,A2=E2X,B2=F2,A3=E2,B3=XF2,A4=E3X,B4=XF3,A5=E3X2,B5=F3,A6=E3,B6=X2F3,A7=-X-1,B7=X-1,F(xiàn)=-(X-1+E1XF1+E2X2F2+E3X3F3-G).考慮方程(3)的一般形式:
(4)
其中Ai,Bi,Ci,Di,F∈Rn×n(i=1,2,…,7).本文解決下面兩個(gè)問(wèn)題:
問(wèn)題Ⅰ 設(shè)方程(4)有中心對(duì)稱解,求Y∈CSRn×n, 使Y滿足方程(4).
問(wèn)題Ⅱ 設(shè)方程(4)無(wú)中心對(duì)稱解,求Y∈CSRn×n, 使
(5)
當(dāng)方程(4)有中心對(duì)稱解時(shí),稱問(wèn)題Ⅰ相容;否則,稱問(wèn)題Ⅰ不相容.
第4步 置k∶=k+1, 轉(zhuǎn)第2步.
由以上步驟易見(jiàn),算法1中的矩陣Y(k),Qk∈CSRn×n.下面給出算法1的基本性質(zhì),算法1在有限步計(jì)算之后停止,具體證明可參考文獻(xiàn)[11].
引理2對(duì)任意的A∈Rn×n,Y∈CSRn×n均有tr((A+SnASn)TY)=2tr(ATY).
定理1設(shè)問(wèn)題Ⅰ相容,則對(duì)任意的初始矩陣Y(1)∈CSRn×n,算法1可在有限步計(jì)算后求得問(wèn)題Ⅰ的一組解.問(wèn)題Ⅰ不相容的充要條件是存在正整數(shù)k,使得由算法1得到的Rk≠O而Qk=O.
定理2設(shè)問(wèn)題Ⅰ相容,選取初始矩陣Y(1)∈CSRn×n滿足
則算法1可在有限步計(jì)算后得到問(wèn)題Ⅰ的唯一極小范數(shù)解,即方程(4)的唯一極小范數(shù)解.
根據(jù)定理1,在算法1中當(dāng)Rk≠O而Qk=O時(shí),算法1中斷.這表明線性方程(4)沒(méi)有中心對(duì)稱解,因此需要求解問(wèn)題Ⅱ,即求線性方程(4)的中心對(duì)稱最小二乘解.下面通過(guò)構(gòu)造等價(jià)的線性矩陣方程組,將求矩陣方程(4)中心對(duì)稱最小二乘解問(wèn)題轉(zhuǎn)化為求等價(jià)的正規(guī)方程中心對(duì)稱解問(wèn)題;然后參照算法1,建立求矩陣方程(4)中心對(duì)稱最小二乘解的迭代算法.
定理3求解問(wèn)題Ⅱ等價(jià)于求線性矩陣方程
f(Y)=N
(6)
的中心對(duì)稱解,并且方程(6)一定有中心對(duì)稱解.
證明求解問(wèn)題Ⅱ等價(jià)于求Y∈CSRn×n, 使得
(7)
參照算法1以及MCG算法的基本原理,建立求矩陣方程(6)中心對(duì)稱解的算法,即求解問(wèn)題Ⅱ的MCG算法.求解問(wèn)題Ⅱ的MCG算法(算法2)的具體步驟如下:
第4步 置k∶=k+1, 轉(zhuǎn)第2步.
由以上步驟易見(jiàn),算法2中的矩陣Y(k),Qk∈CSRn×n.對(duì)于算法2有類似于算法1的收斂定理.
定理4對(duì)任意的初始矩陣Y(1)∈CSRn×n, 算法2可在有限步計(jì)算后求得問(wèn)題Ⅱ的一組解,即矩陣方程(6)的中心對(duì)稱最小二乘解.若取初始矩陣Y(1)滿足Y(1)=f(H) (?H∈CSRn×n), 則算法2可在有限步計(jì)算后得到矩陣方程(6)的唯一極小范數(shù)中心對(duì)稱解.
用上述建立的算法1和算法2求矩陣方程(1)的一組中心對(duì)稱解和中心對(duì)稱最小二乘解.取方程(1)的系數(shù)矩陣均為塊對(duì)角矩陣,且均為5n階方陣.系數(shù)矩陣、初始矩陣和終止準(zhǔn)則如下:
A為三對(duì)角矩陣,其中ai,i=3,ai,i -1=2,ai -1,i=2 (i=1,2,…,5n), 其余元素均為0;
E1=-AT,F(xiàn)1=A,E2=O,F(xiàn)2=O,E3=O,
F3=O,G=I,X1=I,ε=10-9(終止準(zhǔn)則).
選取初始矩陣Y1=2I, 按照算法1和算法2可求得矩陣方程(1)的一組中心對(duì)稱解,結(jié)果見(jiàn)表1.表1中, 5n為系數(shù)矩陣的階數(shù),t為計(jì)算時(shí)間,k1為算法1的迭代次數(shù),k12為算法1的中斷次數(shù),k2為算法2的迭代次數(shù),error為實(shí)際誤差的范數(shù).
表1 矩陣方程(1)的計(jì)算結(jié)果
從表1可以看出,運(yùn)用算法1和算法2求解方程(1)是有效的.當(dāng)算法1中斷時(shí),可以通過(guò)算法2計(jì)算方程(1)的中心對(duì)稱矩陣最小二乘解.若修改算法1中矩陣Qk的類型,則可以建立求其他特殊矩陣解的迭代算法.