黃玉蓮, 羅顯康
(1.宜賓學院 理學部, 四川 宜賓 644000; 2. 宜賓市南溪職業(yè)技術學校, 四川 宜賓 644100)
研究非線性矩陣方程
X+A*(R+B*XB)-tA=Q
(1)
的Hermite正定解, 其中t≥1是正實數,A,B,R,Q是n階非奇異復矩陣且R,Q正定. 非線性矩陣方程是數值代數的研究熱點之一, 在最優(yōu)控制理論、動態(tài)規(guī)劃、統(tǒng)計學、隨機過程、動態(tài)規(guī)劃和梯形網絡等領域的應用十分廣泛[1-5]. 矩陣方程(1)是時間代數Riccati方程特殊情形的推廣, 眾多專家學者對其各種簡化形式進行了討論[6-8]. 近年來, 不斷有學者對形如方程(1)的非線性矩陣方程進行了系統(tǒng)研究, 取得很多豐碩成果. 文獻[9]利用Thompson度量的性質和系數矩陣的特征值刻畫了矩陣方程X-A*(R+BXB*)-tA=Q的Hermite正定解, 構造出帶步長參數的迭代算法. 文獻[10]給出方程X=H+AHX(I+GX)-1A存在Hermite正定解的充分條件, 提出了一種加速算法. 文獻[11]利用矩陣方程X=Q-A*(Im?X-C)-tA的等價形式, 提出計算方程Hermite正定解的牛頓迭代法. 文獻[12]構造出幾種求解矩陣方程X+A*(R+B*XB)-tA=Q(0 符號說明: 本文用M>0(M≥0)表示M是正定(半正定)矩陣,M>N(M≥N)表示M-N是正定(半正定)矩陣,A*表示復矩陣A的共軛轉置. 對于正定矩陣Q, 用λmax(Q)和λmin(Q)分別表示矩陣Q的最大特征值和最小特征值. ‖H‖表示矩陣H的譜范數.B-*=(B-1)*. 本節(jié)先給出方程(1)存在Hermite正定解的充分條件, 證明在給定條件下方程存在唯一Hermite正定解. 同時得到方程Hermite正定解的取值范圍及性質. 引理1[3]若A>B>0(A≥B>0), 則當α∈(0,1]時, 有Aα>Bα>0(Aα≥Bα>0); 當α∈[-1,0)時, 有0 引理2[3]對任意正定矩陣E,F≥bI>O及正數t, 都有 引理3[3]若C和P是相同階數的Hermite矩陣且P可逆, 則CPC+P-1≥2C. 引理4[13]設A,B是Hilbert空間H上的正算子, 且滿足M1I≥A≥m1I,M2I≥B≥m2I和B≥A≥O, 則對任意的t∈[1,+∞), 有 引理5[13]設矩陣A,B,D∈Cn×n, 且A,A-BD和DA-1B-I非奇異, 則 (A-BD)-1=A-1-A-1B(DA-1B-I)-1BA-1. 定理1若方程(1)存在Hermite正定解, 則 (B*)-1[(AQ-1A*)1/t-R]B-1 證明因X是矩陣方程(1)的Hermite正定解, 則有 X 因此(R+B*XB)-t<(A*)-1QA-1, 從而(R+B*XB)t>AQ-1A*. 再根據引理1, 有 X>(B*)-1[(AQ-1A*)1/t-R]B-1. 于是(B*)-1[(AQ-1A*)1/t-R]B-1 定理2若(AQ-1A*)1/t>R且 顯然Ω是一個非空的有界閉凸集, 且F(X)在Ω上是連續(xù)的. 因為 則對任意的X∈Ω, 都有 (2) 又因為F(X)=(B*)-1[(A(Q-X)-1A*)1/t-R]B-1>(B*)-1[(AQ-1A*)1/t-R]B-1>O, 則有F(X)∈Ω.因此F(X)?Ω, 由Brouwer不動點定理知,F(X)在Ω上存在不動點, 即X=F(X)=(B*)-1[(A(Q-X)-1A*)1/t-R]B-1. 此不動點即為矩陣方程(1)的一個Hermite正定解. 由定理1知?X1,X2∈Ω, 有X1,X2≥(B*)-1[(AQ-1A*)1/t-R]B-1, 那么 (R+B*X1B),(R+B*X2B)≥ (AQ-1A*)1/t≥λmin(AQ-1A*)1/t, (3) 令λmin(AQ-1A*)1/t=b, 由(3)式和引理2可知 定理3若矩陣方程(1)有Hermite正定解X, 則X∈[N,M]. 其中 證明由定理1知 (B*)-1[(AQ-1A*)1/t-R]B-1 則有R+B*XB 于是有 進而 因此 即有 A*(R+B*QB)-tA=M. 由引理5得 (R+B*XB)t=A(Q-X)-1A*=A[Q-1-Q-1(XQ-1-I)-1XQ-1]A*=AQ-1A*-AQ-1(XQ-1-I)-1XQ-1A*=AQ-1A*-AQ-1(Q-1-X-1)-1Q-1A*=AQ-1A*+AQ-1(X-1-Q-1)-1Q-1A*>AQ-1A*+AQ-1(B[(AQ-1A*)1/t-R]-1B*-Q-1)-1Q-1A*. 因此 X>(B*)-1[[AQ-1A*+AQ-1(B[(AQ-1A*)1/t-R]-1B*-Q-1)-1Q-1A*]1/t-R]B-1=N. 即X∈[N,M]. 證畢. 定理4若矩陣方程(1)存在Hermite正定解, 則有 證明因X為矩陣方程(1)的Hermite正定解, 即X+A*(R+B*XB)-tA=Q.則有 0 由引理1得 X>(B*)-1[(AQ-1A*)1/t-R]B-1. 因此 R+B*QB>R+B*XB= [A(Q-X)-1A*]1/t> [A(Q-(B*)-1[(AQ-1A*)1/t-R]B-1)-1A*]1/t. (4) 即 證畢. 本節(jié)給出求解矩陣方程(1)的迭代算法, 并分別證明其收斂性. 先討論如下迭代: (5) 定理5在定理2的條件下, 由算法公式(5)生成的序列{Xk}收斂到矩陣方程(1)的一個Hermite正定解. 證明由定理2可知矩陣方程(1)存在Hermite正定解, 即 X=(B*)-1[(A(Q-X)-1A*)1/t-R]B-1>X0. 根據算法公式(5)知 X1=(B*)-1[(A(Q-X0)-1A*)1/t-R]B-1= (B*)-1[(AQ-1A*)1/t-R]B-1>O=X0,X1=(B*)-1[(A(Q-X0)-1A*)1/t-R]B-1< (B*)-1[(A(Q-X)-1A*)1/t-R]B-1=X. 假設對任意k≥1有Xk-1 Xk+1=(B*)-1[(A(Q-Xk)-1A*)1/t-R]B-1> (B*)-1[(A(Q-Xk-1)-1A*)1/t-R]B-1=Xk,Xk+1=(B*)-1[(A(Q-Xk)-1A*)1/t-R]B-1< (B*)-1[(AQ-X)-1A*)1/t-R]B-1=X. 由數學歸納法和矩陣偏序可知迭代序列{Xk}單調遞增有上確界, 收斂于矩陣方程(1)的一個Hermite正定解.證畢. 下面對算法公式(5)進行改進 (6) 對于算法公式(6), 有如下結論. 定理6若存在實數ξ,η(0<ξ≤η<1)滿足 則算法公式(6)生成的序列{Xk}收斂于矩陣方程(1)的一個Hermite正定解X, 且有ξQ≤X≤ηQ. 證明因為Q是Hermite 正定矩陣, 則AQ-1A*也為Hermite 正定矩陣, 那么 λmin(AQ-1A*)I≤AQ-1A*≤λmax(AQ-1A*)I. 并且 根據算法公式(6)可知 假設對任意k≥1有Xk≥Xk-1, 那么 Xk+1=(B*)-1[(A(Q-Xk)-1A*)1/t-R]B-1≥ (B*)-1[(A(Q-Xk-1)-1A*)1/t-R]B-1=Xk. 由歸納法知迭代序列{Xk}單調遞減有下界ξQ.下面證明迭代序列{Xk}有上界ηQ, 由于X0=ξQ≤ηQ,易知 假設對任意k≥1有Xk≤ηQ, 那么 綜上所述, 由算法公式(6)生成的序列{Xk}單調遞增有上界, 由單調有界定理知, 序列{Xk}收斂于矩陣方程(1)的一個Hermite正定解, 且滿足ξQ≤X≤ηQ.證畢. 定理7若存在實數ξ,η(0<ξ≤η<1)滿足 則矩陣方程(1)存在Hermite正定解且有 ‖Xk-X‖≤p‖Xk-1-X‖≤pk(η-ξ)‖Q‖. 證明由定理6知, 算法公式(6)產生的序列{Xk}收斂到矩陣方程(1)的一個Hermite正定解, 令M=A(Q-Xk-1)-1A*,N=A(Q-X)-1A*, 則 M,N≥ξ·B*QB+R≥λmin(ξ·B*QB+R)I. 取b=λmin(ξ·B*QB+R), 對范數‖Xk-X‖進行估計 因此 ‖Xk-X‖≤q‖Xk-1-X‖≤ qk‖X0-X‖≤qk(η-ξ)‖Q‖. 證畢. 為降低運算復雜度, 避免每步迭代過程中矩陣求逆引起的誤差, 提出如下免逆迭代: (7) 定理8在定理2的條件下, 由算法公式(7)生成的序列{Xk}和{Yk}滿足 證明由定理2知方程(1)的Hermite正定解滿足X=(B*)-1[(A(Q-X)-1A*)1/t-R]B-1. 則 X1=(B*)-1[(AY0A*)1/t-R]B-1= (B*)-1[(AQ-1A*)1/t-R]B-1 由引理3得 Y1=[2I-Y0(Q-X1)]Y0= 2Y0-Y0(Q-X1)Y0≤(Q-X1)-1≤(Q-X)-1,Y1-Y0=Y0-Y0(Q-X1)Y0=Q-1X1Q-1>O. 則有 X0 假設 Xk-1 那么 Xk+1=(B*)-1[(AYkA*)1/t-R]B-1< (B*)-1[(A(Q-X)-1A*)1/t-R]B-1=X,Xk+1=(B*)-1[(AYkA*)1/t-R]B-1> (B*)-1[(AYk-1A*)1/t-R]B-1=Xk,Yk+1=2Yk-Yk(Q-Xk+1)Yk≤ (Q-Xk+1)-1≤(Q-X)-1,Yk+1-Yk=Yk-Yk(Q-Xk+1)Yk=Yk[Yk-1-(Q-Xk+1)]Yk>Yk[Yk-1-(Q-X)]Yk>0. 綜上所述, 由算法公式(7)生成的序列{Xk}和{Yk}皆單調遞增有上界, 根據單調有界定理知, 序列{Xk}收斂于矩陣方程(1)的一個Hermite正定解. 證畢. 本節(jié)利用數值算例驗證本文的理論成果, 說明所提迭代算法的有效性. 算法實現的軟件環(huán)境是MATLAB R2018b, PC機為Intel(R) Core(TM) i7-8750H cpu @ 2.20GHz. 實驗報告中, 用k、MM、NN、Error和Time分別代表迭代次數、算法所需矩陣乘法運算次數、矩陣求逆次數、終止時的殘差和計算所需時間. 算法停止條件為 Rk=‖Xk+A*(R+B*XkB)-t-Q‖≤1.0×10-10. 例1給定n階復矩陣A,B,R,Q∈Cn×n,且R,Q為Hermite正定矩陣. 試求矩陣方程X+A*(R+B*XB)-1.8A=Q的Hermite正定解. 解當n=5時, 直接驗證可知滿足定理2矩陣方程存在Hermite正定解的條件. 取ξ=0.1,η=0.7, 滿足定理6的條件. 殘差與迭代次數結果如圖1所示, 迭代計算結果如下: 表1 例1迭代計算結果 圖1 例1殘差迭代結果 當n=100,500,1 000時, 計算結果如表1所示. 例2給定n階復矩陣A,B,R,Q∈Cn×n, 且R,Q為Hermite正定矩陣. 試求矩陣方程X+A*(R+B*XB)-3A=Q的Hermite正定解. 解當n=5時, 直接驗證可知滿足定理2矩陣方程存在Hermite正定解的條件. 取ξ=0.2,η=0.8, 滿足定理6的條件. 殘差與迭代次數結果如圖2所示, 迭代計算結果如下: 圖2 例2殘差結果 表2 例2迭代計算結果 當n=100,500,1 000時, 計算結果如表2所示. 表1、表2結果顯示, 三種迭代算法經較少迭代次數均能達到預設誤差精度, 收斂速度較高. 不動點迭代算法涉及的矩陣求逆次數比無逆迭代算法次數多, 但涉及的矩陣乘法次數較少.迭代公式(6)在選取適當參數時, 其收斂速度更快, 迭代公式(7)的優(yōu)勢在于每步迭代過程中僅涉及初始矩陣求逆. 非線性矩陣方程X+A*(R+B*XB)-tA=Q是離散時間代數Riccati方程的特殊情形. 本文在一定條件下討論其Hermite正定解, 給出Hermite正定解的一些性質及其取值區(qū)間. 構造出計算此方程的不動點迭代算法和無逆迭代算法, 從降低矩陣求逆運算誤差的角度對比分析了兩類算法的特點. 數值算例表明, 所提出的算法對求解此類非線性矩陣方程可行、有效.1 解的存在性及上下界估計
2 求解矩陣方程(1)的迭代算法
3 數值算例
4 結論