矩陣的行空間維度稱為行秩,列空間維度稱為列秩。行空間維度由線行獨立的行向量個數決定,“行秩=列秩”一文曾基於此性質通過操作矩陣乘法運算證明了矩陣的行秩等於列秩。證明歸證明,讀者心中可能依然困惑:矩陣的線性獨立行向量個數怎麼會恰好等於線性獨立的列向量個數呢?本文再提供一個證明,想法很簡單:利用高斯消去法挑選出矩陣的線性獨立行與列,並以一特殊分解式呈現獨立行與獨立列。這個證明屬計算導向,雖未直接表達行秩等於列秩的幾何特性,但由所得的矩陣分解式我們可以“目視”原矩陣的行空間和列空間,兩者確實擁有相等的基底向量數。
下面我用一個例子來說明證明計算過程。考慮 $$3\times 4$$ 階矩陣
$$A=\begin{bmatrix}
1&2&1&1\\
1&2&-1&-3\\
1&2&0&-1
\end{bmatrix}$$
利用高斯消去法化簡增廣矩陣 $$\begin{bmatrix}
A&I_3
\end{bmatrix}$$,加入 $$I_3$$ 的用意是藉此三階分塊記錄執行過的基本列運算,結果如下:
$$\begin{bmatrix}
1&2&1&1&\vline&1&0&0\\
1&2&-1&-3&\vline&0&1&0\\
1&2&0&-1&\vline&0&0&1
\end{bmatrix}\rightarrow\begin{bmatrix}
1&2&0&-1&\vline&0&0&1\\
0&0&1&2&\vline&1&0&-1\\
0&0&0&0&\vline&1&1&-2
\end{bmatrix}$$
消去過程可以解讀為一連串的基本矩陣乘法,總效果為 $$E\begin{bmatrix}
A&I_3
\end{bmatrix}=\begin{bmatrix}
EA&EI_3
\end{bmatrix}=\begin{bmatrix}
R&E
\end{bmatrix}$$,其中
$$R=\begin{bmatrix}
1&2&0&-1\\
0&0&1&2\\
0&0&0&0
\end{bmatrix}$$,$$E=\begin{bmatrix}
0&0&1\\
1&0&-1\\
1&1&-2
\end{bmatrix}$$
方陣 $$E$$ 表示所執行的基本矩陣乘積,因此是可逆的,$$R=EA$$ 為 $$A$$ 的最簡列梯形矩陣。所以 $$A$$ 也可表示為 $$A=E^{-1}R$$,這個式子將留待稍後使用。
在最簡列梯形矩陣 $$R$$ 右乘一適當的排列矩陣 $$P$$ 使軸行擺放在最左側:
$$RP=\begin{bmatrix}
1&2&0&-1\\
0&0&1&2\\
0&0&0&0
\end{bmatrix}\begin{bmatrix}
1&0&0&0\\
0&0&1&0\\
0&1&0&0\\
0&0&0&1
\end{bmatrix}=\begin{bmatrix}
1&0&2&-1\\
0&1&0&2\\
0&0&0&0
\end{bmatrix}$$
這樣便有分塊形式 $$RP=\begin{bmatrix}
I_2&F\\
0&0
\end{bmatrix}$$,如欲進一步消去分塊 $$F$$,可對 $$(RP)^T=\begin{bmatrix}
I_2&0\\
F^T&0
\end{bmatrix}$$ 施行消去法。同樣為了記錄列運算過程,我們對增廣矩陣 $$\begin{bmatrix}
(RP)^T&I_4
\end{bmatrix}$$ 執行消去運算,如下:
$$\begin{bmatrix}
1&0&0&\vline&1&0&0&0\\
0&1&0&\vline&0&1&0&0\\
2&0&0&\vline&0&0&1&0\\
-1&2&0&\vline&0&0&0&1
\end{bmatrix}\rightarrow\begin{bmatrix}
1&0&0&\vline&1&0&0&0\\
0&1&0&\vline&0&1&0&0\\
0&0&0&\vline&-2&0&1&0\\
0&0&0&\vline&1&-2&0&1
\end{bmatrix}$$
上面的計算過程可用矩陣乘積表示為 $$G\begin{bmatrix}
(RP)^T&I_4
\end{bmatrix}=\begin{bmatrix}
G(RP)^T&GI_4
\end{bmatrix}=\begin{bmatrix}
G(RP)^T&G
\end{bmatrix}$$,其中
$$G=\begin{bmatrix}
1&0&0&0\\
0&1&0&0\\
-2&0&1&0\\
1&-2&0&1
\end{bmatrix}$$
令 $$J^T=G(RP)^T=GP^TR^T=\begin{bmatrix}
I_2&0\\
0&0
\end{bmatrix}$$,基本矩陣乘積 $$G$$ 與排列矩陣 $$P$$ 都是可逆的,且 $$P^{-1}=P^T$$,因此 $$R^T=PG^{-1}J^T$$,再取轉置可得 $$R=J(G^T)^{-1}P^T$$。
整理上述演算法得到的結果。第一個步驟的表達式為 $$A=E^{-1}R$$,第二個步驟為 $$R=J(G^T)^{-1}P^T$$,合併兩式可得
$$A=E^{-1}J(G^T)^{-1}P^T$$
代入數值計算,結果為
$$\begin{bmatrix}
1&2&1&1\\
1&2&-1&-3\\
1&2&0&-1
\end{bmatrix}=\begin{bmatrix}
1&1&0\\
1&-1&1\\
1&0&0
\end{bmatrix}\begin{bmatrix}
1&0&0&0\\
0&1&0&0\\
0&0&0&0
\end{bmatrix}\begin{bmatrix}
1&2&0&-1\\
0&0&1&2\\
0&1&0&0\\
0&0&0&1
\end{bmatrix}$$
從上例的演算過程得知任意 $$m\times n$$ 階矩陣 $$A$$ 可分解為
$$A=X\begin{bmatrix}
I_r&0\\
0&0
\end{bmatrix}Y$$
上式中 $$X=E^{-1}=\begin{bmatrix}
X_1&X_2
\end{bmatrix}$$ 為 $$m\times m$$ 階可逆矩陣,$$X_1$$ 由左邊的 $$r$$ 個行構成,$$Y=(G^T)^{-1}P^T=\begin{bmatrix}
Y_1\\
Y_2
\end{bmatrix}$$ 為 $$n\times n$$ 階可逆矩陣,$$Y_1$$ 由上方的 $$r$$ 個列構成。將 $$A$$ 展開:
$$A=\begin{bmatrix}
X_1&X_2
\end{bmatrix}\begin{bmatrix}
I_r&0\\
0&0
\end{bmatrix}Y=\begin{bmatrix}
X_1I_r&0
\end{bmatrix}Y=\begin{bmatrix}
X_1&0
\end{bmatrix}Y$$
解讀上式,$$A$$ 的每個行向量都是 $$X_1$$ 行向量的線性組合,但 $$X_1$$ 包含 $$r$$ 個線性獨立行向量,故 $$A$$ 的行空間維度受限於 $$r$$,即 $$\mathrm{dim}C(A)\le r$$。另一方面,考慮 $$\begin{bmatrix}
X_1&0
\end{bmatrix}=AY^{-1}$$,此式指出 $$X_1$$ 的 $$r$$ 個獨立行向量全屬於 $$A$$ 的行空間,故 $$r=\mathrm{dim}C(X_1)\le\mathrm{dim}C(A)$$,因此推得 $$A$$ 的行秩等於 $$r$$。再將 $$A$$ 寫為
$$A=X\begin{bmatrix}
I_r&0\\
0&0
\end{bmatrix}\begin{bmatrix}
Y_1\\
Y_2
\end{bmatrix}=X\begin{bmatrix}
I_rY_1\\
0
\end{bmatrix}=X\begin{bmatrix}
Y_1\\
0
\end{bmatrix}$$
運用同樣推理方式可知 $$A$$ 的每個列都是 $$Y_1$$ 列的線性組合,且 $$Y_1$$ 的各列屬於 $$A$$ 的列空間,故 $$A$$ 的列秩也等於 $$r$$。綜合以上結果也就證得矩陣的行秩與列秩都等於 $$r$$,簡稱為矩陣秩。
這個計算證明結果顯示如果 $$m\times n$$ 階矩陣 $$A$$ 的秩為 $$r$$,則 $$A$$ 可分解如
$$A=X_1Y_1$$
其中 $$m\times r$$ 階矩陣 $$X_1$$ 的 $$r$$ 個行即為 $$A$$ 的行空間基底,而 $$r\times n$$ 階矩陣 $$Y_1$$ 的 $$r$$ 個列為 $$A$$ 的列空間基底。上例中,$$A$$ 可分解為
$$\begin{bmatrix}
1&2&1&1\\
1&2&-1&-3\\
1&2&0&-1
\end{bmatrix}=\begin{bmatrix}
1&1\\
1&-1\\
1&0
\end{bmatrix}\begin{bmatrix}
1&2&0&-1\\
0&0&1&2
\end{bmatrix}$$
我不清楚這個分解式是否已被正式命名,在此姑且稱它為“行列分解”(Column-Row factorization),簡稱 CR 分解。事實上,每週問題曾經刊登過 CR 分解(參閱“每週問題 April 20, 2009”),不過此分解式不太起眼,可能沒有引起讀者的注意。CR 分解具有哪些實際用途呢?CR 分解既不像 LU 分解或 QR 分解可以用來解線性方程,也不如奇異值分解(SVD)具備對應良好的正交基底,CR 分解似乎只有展示行空間基底和列空間基底的作用。本文則利用它來解釋線性代數的一個重要基石:矩陣的行秩等於列秩。
沒有留言:
張貼留言