美國數學家 Morris Kline (1908-1992) 說[1]:「矩陣理論在被創造前就已發展完善(the subject of matrix theory was well developed before it was created)。」這句話讓人聽得一頭霧水,要弄清楚這話的意思必須從矩陣的發展歷史說起。西元十七至十九世紀中葉,數學活動在歐洲以快速的步伐朝各領域繁盛發展,此時關於陣列(array)運算的研究全部集中於行列式理論,令人不解的是矩陣代數並未隨著行列式進行,矩陣理論足足落後行列式兩百年之久。西元 1850年,英國數學家 James Joseph Sylvester (1814-1897) 將矩形陣列命名為矩陣(matrix),但他並未定義矩陣乘法。1857 年,英國數學家 Arthur Cayley (1821-1895) 發表 A Memoir on the Theory of Matrices,他將矩陣從行列式抽離出來,視之為單獨數學物件,並定義完備的矩陣代數運算,此篇論文被後世公認為近代矩陣理論和線性代數的基石。這段歷史顯示矩陣乘法——矩陣理論最重要的一個代數運算——絕對不是如數學課本所述那般理所當然;矩陣乘法定義隱含深層的意涵,否則為何眾多優秀數學家竟然看不出矩陣理當如此相乘。今天我們事後諸葛,已然明瞭矩陣代數之所以遲至十九世紀中葉才誕生的最主要原因在於人們一直無法確定矩陣的內涵和本質究竟為何。
據我所知,不少高中學生曾經發明各式各樣的創意矩陣乘法,例如,有人將兩相同尺寸矩陣乘積以如下方式計算:
$$\begin{bmatrix}
1&2\\
3&-2
\end{bmatrix}\begin{bmatrix}
2&-1\\
1&3
\end{bmatrix}=\begin{bmatrix}
1\cdot 2&2\cdot (-1)\\
3\cdot 1&(-2)\cdot 3
\end{bmatrix}=\begin{bmatrix}
2&-2\\
3&-6
\end{bmatrix}$$
無疑地,這個矩陣乘積被視為數學上的無知,認真負責的老師立刻將它更正為
$$\begin{bmatrix}
1&2\\
3&-2
\end{bmatrix}\begin{bmatrix}
2&-1\\
1&3
\end{bmatrix}=\begin{bmatrix}
1\cdot 2+2\cdot 1&1\cdot (-1)+2\cdot 3\\
3\cdot 2+(-2)\cdot 1&3\cdot (-1)+(-2)\cdot 3
\end{bmatrix}=\begin{bmatrix}
4&5\\
4&-9
\end{bmatrix}$$
上面這個被老師糾正的創意發明稱為 Hadamard 乘積,應用見於 JPEG 影像壓縮。對於具有相同尺寸的矩陣 $$A$$ 和 $$B$$,Hadamard 乘積定義為 $$(A\circ B)_{ij}=A_{ij}\cdot B_{ij}$$,因此也稱作分元(entrywise)乘積。老師和課本指定的矩陣乘法稱為一般矩陣乘積,也就是目前線性代數採用的“正確”運算方式。請讀者仔細想想,除非我們先設定矩陣乘積的意義與其用途,否則何從判斷這兩種乘法的對錯?多數學生想不出更好的辯駁理由,最後只能默默地接受這個看似無厘頭的定義,並且相信老師的善意忠告:大學線性代數會給大家一個清楚的交代。
大學線性代數果真就說清楚講明白了嗎?恐怕未必。與其照本宣科重述一次高中數學課本給出的矩陣乘積定義,我們不妨尋思 Cayley 是根據什麼理念設計出矩陣乘法規則。西元 1894年,Cayley 對蘇格蘭數學物理學家 Peter G. Tait (1831-1901) 道出引領他至矩陣記號的動機並非四元數(quaternion),而是源於行列式或為了方便表達線性方程[2]:
“I certainly did not get the notation of a matrix in any way through quaternions: it was either directly from that of a determinant; or as a convenient mode of expression of the equations
$$x^{\prime}=ax+by$$
$$y^{\prime}=cx+dy.$$”
西元 1855 年,Cayley 正著手進行線性複合(composition)函數的研究。線性函數涵蓋許多數學主題,這需要做一番說明。設定義域(domain) $$\mathcal{D}$$ 和值域(range)$$\mathcal{R}$$ 為具有加法和純量乘法的集合,我們稱 $$f:\mathcal{D}\rightarrow\mathcal{R}$$ 為線性函數,如果任意 $${x},{y}\in\mathcal{D}$$ 滿足這兩個條件:
$$f({x}+{y})=f({x})+f({y})$$
$$f(c{x})=cf({x})$$
其中 $$c$$ 為一純量。例如,$$f({x})=a{x}$$ 的圖形為 $$\mathbb{R}^2$$ 平面上一穿越原點的直線,它符合線性函數的要求。但 $$f(x)=ax+b$$ 就不是一線性函數,它是線性函數再加上平移量 $$b$$,表現圖形為一條不穿越原點的直線。又如在 $$\mathbb{R}^3$$ 中穿越原點的平面可以表示為 $$f(x,y)=ax+by$$,很容易驗證 $$f$$ 滿足上述線性函數定義。微分和積分運算都是線性函數,因為
$$\frac{d(f+g)}{dx}=\frac{df}{dx}+\frac{df}{dx}$$
$$\frac{d(cf)}{dx}=c\frac{df}{dx}$$
而且
$$\int(f+g)dx=\int fdx+\int gdx$$
$$\int(cf)dx=c\int fdx$$
甚至矩陣的轉置運算也是線性函數,考慮 $$f(A)=A^T$$,$$f$$ 滿足
$$f(A+B)=(A+B)^T=A^T+B^T=f(A)+f(B)$$
$$f(cA)=(cA)^T=cA^T=cf(A)$$
Cayley 和 Tait 的談話提供了重建矩陣乘法發明過程的一些線索。1855 年的一日,Cayley 望著案前的筆記沉思良久,筆記本上寫著[3]:
$$f\left(\begin{matrix}
x\\
y
\end{matrix}\right)=\left(\begin{matrix}
ax+by\\
cx+dy
\end{matrix}\right)$$
$$g\left(\begin{matrix}
x\\
y
\end{matrix}\right)=\left(\begin{matrix}
px+qy\\
rx+sy
\end{matrix}\right)$$
Cayley 從小就著迷於解決複雜的數學難題,眼前這兩個線性函數困擾他很長的一段時間。經過幾番考慮之後,他動筆計算 $$f$$ 和 $$g$$ 的複合函數,整理得到一個新的線性函數:
$$h\left(\begin{matrix}
x\\
y
\end{matrix}\right)=f\left(g\left(\begin{matrix}
x\\
y
\end{matrix}\right)\right)=f\left(\begin{matrix}
px+qy\\
rx+sy
\end{matrix}\right)=\left(\begin{matrix}
a(px+qy)+b(rx+sy)\\
c(px+qy)+d(rx+sy)
\end{matrix}\right)$$
$$=\left(\begin{matrix}
(ap+br)x+(aq+bs)y\\
(cp+dr)x+(cq+ds)y
\end{matrix}\right)$$
Cayley 默想著這個方程式,或許是由行列式得來的靈感,他突然想到為什麼不用陣列來表示線性函數的係數呢?於是便將 $$f$$,$$g$$ 和 $$h$$ 分別表示為
$$F=\begin{bmatrix}
a&b\\
c&d
\end{bmatrix}$$,$$G=\begin{bmatrix}
p&q\\
r&s
\end{bmatrix}$$,$$H=\begin{bmatrix}
ap+br&aq+bs\\
cp+dr&cq+ds
\end{bmatrix}$$
像多數的數學家一樣,Cayley 深信數學基本形式的存在,觀察這三個線性函數的陣列表達讓他更加堅定信念。才氣洋溢的 Cayley 大膽構思 $$H$$ 即為 $$F$$ 和 $$G$$ 的複合(或乘積),他要做的是“乘開”矩陣 $$F$$ 和 $$G$$,然後令矩陣乘積等於 $$H$$,於是他興奮地寫下
$$\begin{bmatrix}
a&b\\
c&d
\end{bmatrix}\begin{bmatrix}
p&q\\
r&s
\end{bmatrix}=\begin{bmatrix}
ap+br&aq+bs\\
cp+dr&cq+ds
\end{bmatrix}$$
頓時矩陣乘法的運算規則誕生了。也許 Cayley 特別幸運,也或許是他的數學直覺特別敏銳,但不論如何,他給出了一個自然而且有用的矩陣乘法定義。
Cayley 的基本思想是用矩陣乘積來表示線性複合函數,但 Cayley 並不是第一個考慮線性複合函數問題的數學家,早在 1801 年,高斯就已經使用這種複合計算,只不過高斯並沒有以陣列形式記錄係數。對許多數學家來說,矩陣乘法談不上精巧的發明,Cayely 將線性複合函數與矩陣乘積聯繫在一起的作為顯得無足輕重,因為他既未解出困難的問題,也沒有證明偉大的定理。然而,矩陣和乘法運算的發明顯示良好設計符號的重要性,同時也點出部分數學家不願意承認的一個事實:外表看似平凡無奇的表述符號可能是具有廣泛應用的重要理論的萌芽條件。最後歷史證明 Cayley 異於常人的洞察力為矩陣理論和線性代數的發展開啟了一扇大門。
參考文獻
[1] Morris Kline, Mathematical Thought from Ancient to Modern Times, 1972.
[2] Eric T. Bell, The Development of Mathematics, 1945.
[3] Carl D. Meyer, Matrix Analysis and Applied Linear Algebra, 2000.
圖片取自
http://www.nutquote.com/thumb/3112-Arthur_Cayley.jpg
矩阵加法的定义也并不是显然的?
回覆刪除如果上課時有學生如此提問,那麼全班同學一定轉過身盯著他(她)瞧?心想:這傢伙是不是來搗亂的?
矩陣加法的定義可能還是得從"矩陣代表何物"解釋。