數百年來,化約主義(reductionism)強力主導科學和工程研究方法論,基本思想是將複雜的系統或現象化解為各部分的組合,透過分析各組件從而理解並描述原來的複雜系統或現象。線性代數也是如此,例如,類似對多項式因式分解,高斯消去法可將任意可逆矩陣分解為一組基本矩陣的乘積。這篇短文介紹基本矩陣的一般形式,證明基本矩陣是可逆的,且其逆矩陣也為基本矩陣。
設 $$\mathbf{u}$$ 和 $$\mathbf{v}$$ 為 $$n$$-維向量,且 $$\mathbf{v}^T\mathbf{u}\neq -1$$,具有形式 $$I+\mathbf{u}\mathbf{v}^T$$ 的矩陣叫做基本矩陣(elementary matrix),也就是說,基本矩陣為單位矩陣與秩-1(rank-one)矩陣之和並滿足上述不等條件。請注意,$$\mathbf{u}\mathbf{v}^T$$ 是 $$n\times n$$ 階矩陣,而 $$\mathbf{v}^T\mathbf{u}$$ 是純量。(註:在中國大陸,基本矩陣稱為“初等矩陣”,而基本列運算則稱為“初等行變換”。)
基本矩陣是可逆矩陣,完整的推導請見“每週問題 March 23, 2009”。下面展示一個直接的論證,我們大膽猜測基本矩陣的逆矩陣也為基本矩陣,設
$$(I+\mathbf{u}\mathbf{v}^T)^{-1}=I+k\mathbf{u}\mathbf{v}^T$$
計算乘積,
$$(I+\mathbf{u}\mathbf{v}^T)\left(I+k\mathbf{u}\mathbf{v}^T\right)=I+\mathbf{u}\mathbf{v}^T+k\mathbf{u}\mathbf{v}^T+k\mathbf{u}(\mathbf{v}^T\mathbf{u})\mathbf{v}^T$$
$$=I+\left(1+k+k\mathbf{v}^T\mathbf{u}\right)\mathbf{u}\mathbf{v}^T$$
令 $$k=-(1+\mathbf{v}^T\mathbf{u})^{-1}$$,基本矩陣 $$I+\mathbf{u}\mathbf{v}^T$$ 的逆矩陣因此為
$$(I+\mathbf{u}\mathbf{v}^T)^{-1}=I-(1+\mathbf{v}^T\mathbf{u})^{-1}\mathbf{u}\mathbf{v}^T$$
上式說明為何 $$1+\mathbf{v}^T\mathbf{u}$$ 不得為零。
參考“矩陣和之行列式 (上)”,基本矩陣的行列式可由下式計算:
$$\mathrm{det}(I+\mathbf{u}\mathbf{v}^T)=\mathrm{det}I+\mathbf{v}^T(\mathrm{adj}I)\mathbf{u}$$
因為 $$\mathrm{det}I=1$$,$$\mathrm{adj}I=I$$,得到更簡潔的公式:
$$\mathrm{det}(I+\mathbf{u}\mathbf{v}^T)=1+\mathbf{v}^T\mathbf{u}$$
每個基本列運算都對應一個基本矩陣,基本列運算分為三類:
(1) 交換列 $$i$$ 和列 $$j$$
(2) 列 $$i$$ 通乘非零常數 $$c$$
(3) 將列 $$i$$ 通乘非零常數 $$c$$ 的結果加至列 $$j$$
對單位矩陣執行基本列運算其結果即為基本矩陣,以三階基本矩陣為例,考慮
$$E_1=\begin{bmatrix}
0&1&0\\
1&0&0\\
0&0&1
\end{bmatrix}$$,$$E_2=\begin{bmatrix}
1&0&0\\
0&c&0\\
0&0&1
\end{bmatrix}$$,$$E_3=\begin{bmatrix}
1&0&0\\
c&1&0\\
0&0&1
\end{bmatrix}$$
$$E_1$$ 代表交換列 $$1$$ 和列 $$2$$,$$E_2$$ 由列 $$2$$ 乘以 $$c$$ 而得,$$E_3$$ 則表示將列 $$1$$ 乘以 $$c$$ 再加到列 $$2$$。直接計算矩陣乘法可驗證左乘基本矩陣相當於執行一次同樣的基本列運算:
$$E_1A=\begin{bmatrix}
0&1&0\\
1&0&0\\
0&0&1
\end{bmatrix}\begin{bmatrix}
a_{11}&a_{12}&a_{13}\\
a_{21}&a_{22}&a_{23}\\
a_{31}&a_{32}&a_{33}
\end{bmatrix}=\begin{bmatrix}
a_{21}&a_{22}&a_{23}\\
a_{11}&a_{12}&a_{13}\\
a_{31}&a_{32}&a_{33}
\end{bmatrix}$$
$$E_2A=\begin{bmatrix}
1&0&0\\
0&c&0\\
0&0&1
\end{bmatrix}\begin{bmatrix}
a_{11}&a_{12}&a_{13}\\
a_{21}&a_{22}&a_{23}\\
a_{31}&a_{32}&a_{33}
\end{bmatrix}=\begin{bmatrix}
a_{11}&a_{12}&a_{13}\\
ca_{21}&ca_{22}&ca_{23}\\
a_{31}&a_{32}&a_{33}
\end{bmatrix}$$
$$E_3A=\begin{bmatrix}
1&0&0\\
c&1&0\\
0&0&1
\end{bmatrix}\begin{bmatrix}
a_{11}&a_{12}&a_{13}\\
a_{21}&a_{22}&a_{23}\\
a_{31}&a_{32}&a_{33}
\end{bmatrix}$$
$$=\begin{bmatrix}
a_{11}&a_{12}&a_{13}\\
ca_{11}+a_{21}&ca_{12}+a_{22}&ca_{13}+a_{23}\\
a_{31}&a_{32}&a_{33}
\end{bmatrix}$$
上述三種基本矩陣都可用標準形式 $$I+\mathbf{u}\mathbf{v}^T$$ 表達,做法是以單位向量 $$\mathbf{e}_i$$ 配合常數乘積取代 $$\mathbf{u}$$ 和 $$\mathbf{v}$$,如下:
$$E_1=I+\begin{bmatrix}
-1&1&0\\
1&-1&0\\
0&0&0
\end{bmatrix}=I+\begin{bmatrix}
1\\
-1\\
0
\end{bmatrix}\begin{bmatrix}
-1&1&0
\end{bmatrix}$$
$$=I+(\mathbf{e}_1-\mathbf{e}_2)(\mathbf{e}_2-\mathbf{e}_1)^T$$
$$E_2=I+\begin{bmatrix}
0&0&0\\
0&c-1&0\\
0&0&0
\end{bmatrix}=I+(c-1)\begin{bmatrix}
0\\
1\\
0
\end{bmatrix}\begin{bmatrix}
0&1&0
\end{bmatrix}=I+(c-1)\mathbf{e}_2\mathbf{e}_2^T$$
$$E_3=I+\begin{bmatrix}
0&0&0\\
c&0&0\\
0&0&0
\end{bmatrix}=I+c\begin{bmatrix}
0\\
1\\
0
\end{bmatrix}\begin{bmatrix}
1&0&0
\end{bmatrix}=I+c\mathbf{e}_2\mathbf{e}_1^T$$
由此歸納出一般結果:
(1) 交換列 $$i$$ 和列 $$j$$
$$E_1=I+(\mathbf{e}_i-\mathbf{e}_j)(\mathbf{e}_j-\mathbf{e}_i)^T$$
(2) 列 $$i$$ 通乘非零常數 $$c$$
$$E_2(c)=I+(c-1)\mathbf{e}_i\mathbf{e}_i^T$$
(3) 將列 $$i$$ 通乘非零常數 $$c$$ 的結果加至列 $$j$$
$$E_3(c)=I+c\mathbf{e}_j\mathbf{e}_i^T$$
最後我們利用前述公式計算基本矩陣的行列式與逆矩陣。
■基本矩陣 $$E_1$$
令 $$\mathbf{u}=\mathbf{e}_i-\mathbf{e}_j$$,$$\mathbf{v}=\mathbf{e}_j-\mathbf{e}_i$$,則 $$\mathbf{v}^T\mathbf{u}=-(\mathbf{e}_i^T\mathbf{e}_i+2\mathbf{e}_i^T\mathbf{e}_j+\mathbf{e}_j^T\mathbf{e}_j)=-2$$,所以 $$\mathrm{det}E_1=1-2=-1$$,逆矩陣為
$$E_1^{-1}=I-(1-2)^{-1}\mathbf{u}\mathbf{v}^T=I+\mathbf{u}\mathbf{v}^T=E_1$$
$$E_1$$ 交換二列改變矩陣行列式的正負號,$$E_1$$ 的逆矩陣為其自身,連續交換二次列 $$i$$ 和列 $$j$$ 等於什麼事也沒做。
■基本矩陣 $$E_2$$
令 $$\mathbf{u}=(c-1)\mathbf{e}_i$$,$$\mathbf{v}=\mathbf{e}_i$$,則 $$\mathbf{v}^T\mathbf{u}=c-1$$,$$c\neq 0$$,就有 $$\mathrm{det}E_2(c)=1+c-1=c$$,而
$$E_2(c)^{-1}=I-(1+(c-1))^{-1}(c-1)\mathbf{e}_i\mathbf{e}_i^T=I+(\frac{1}{c}-1)\mathbf{e}_i\mathbf{e}_i^T=E_2(\frac{1}{c})$$
對應 $$E_2^{-1}$$ 的基本列運算是將列 $$i$$ 通乘 $$\frac{1}{c}$$。
■基本矩陣 $$E_3$$
令 $$\mathbf{u}=c\mathbf{e}_j$$,$$\mathbf{v}=\mathbf{e}_i$$, $$\mathbf{v}^T\mathbf{u}=0$$,則 $$\mathrm{det}E_3(c)=1+0=1$$,而
$$E_3(c)^{-1}=I-(1+0)^{-1}c\mathbf{e}_j\mathbf{e}_i^T=I+(-c)\mathbf{e}_j\mathbf{e}_i^T=E_3(-c)$$
對應 $$E_3^{-1}$$ 的基本列運算是將列 $$i$$ 通乘非零常數 $$-c$$ 的結果加至列 $$j$$。
林教授的思路方法,是可以幫忙推導公式,但是不rigorus
回覆刪除不過用來不rigorus推導,還挺方便的.我去討論區用站內的數學公式輸入法來寫1下
$$(I-A)^{-1}=I+A+A^2+\cdots$$
回覆刪除的成立條件是 $$A$$ 的特徵值滿足 $$\vert\lambda\vert<1$$。不嚴格(rigorous)是指這個吧!?房子是不能建在沙灘上的。