矩阵
矩阵就是一组数据组成的方阵。
矩阵的迹 t r ( A ) = ∑ i = 1 n a i i \mathrm{tr}(\mathbf{A}) = \sum \limits_{i=1}^n a_{ii} tr ( A ) = i = 1 ∑ n a ii 代表 n n n 阶方阵的主对角线的和
对角矩阵 A = d i a g ( a 11 , a 22 , ⋯ , a n n ) \mathbf{A} = \mathrm{diag}(a_{11}, a_{22}, \cdots, a_{nn}) A = diag ( a 11 , a 22 , ⋯ , a nn ) 代表除了主对角线以外的值都是 0 0 0 的对角矩阵
矩阵运算
矩阵加法
交换律
结合律
单位元为 0 \mathbf{0} 0
矩阵数乘
结合律
分配律
1 A = A 1 \mathbf{A} = \mathbf{A} 1 A = A
k A = 0 ⇔ k = 0 or A = 0 k \mathbf{A} = \mathbf{0} \Leftrightarrow k = 0 \quad \text{or} \quad \mathbf{A} = \mathbf{0} k A = 0 ⇔ k = 0 or A = 0
注意区分 : ∣ k A ∣ = k n ∣ A ∣ \vert k \mathbf{A} \vert = k^n \vert \mathbf{A} \vert ∣ k A ∣ = k n ∣ A ∣ , ( k A ) = k n ( A ) ( k \mathbf{A} ) = k^n ( \mathbf{A} ) ( k A ) = k n ( A )
矩阵乘法
结合律
分配律
不满足交换律
若 A \mathbf{A} A 为方阵,则 A n \mathbf{A}^n A n ,表示 A \mathbf{A} A 的 n n n 次幂
等价矩阵和另一个矩阵的乘积不一定 相等
∣ A B ∣ = ∣ A ∣ ⋅ ∣ B ∣ \vert \mathbf{A} \mathbf{B} \vert = \vert \mathbf{A} \vert \cdot \vert \mathbf{B} \vert ∣ AB ∣ = ∣ A ∣ ⋅ ∣ B ∣
矩阵转置
自反律
分配律
加法的分配律不改变位置
乘法的分配律改变两个矩阵位置
矩阵共轭
矩阵分块后同样满足以上的运算律,不过每一个子块都要运算后有意义才行,也就是行列能满足要求。特别提醒矩阵的转置 ,整个矩阵要转置,子块也要转置,
A T = ( A 11 T A 12 T ⋯ A 1 n T A 21 T A 22 T ⋯ A 2 n T ⋮ ⋮ ⋮ A n 1 T A n 2 T ⋯ A n n T ) \mathbf{A}^T =
\begin{pmatrix}
\mathbf{A}^T_{11} & \mathbf{A}^T_{12} & \cdots & \mathbf{A}^T_{1n} \\
\mathbf{A}^T_{21} & \mathbf{A}^T_{22} & \cdots & \mathbf{A}^T_{2n} \\
\vdots & \vdots & & \vdots \\
\mathbf{A}^T_{n1} & \mathbf{A}^T_{n2} & \cdots & \mathbf{A}^T_{nn} \\
\end{pmatrix} A T = A 11 T A 21 T ⋮ A n 1 T A 12 T A 22 T ⋮ A n 2 T ⋯ ⋯ ⋯ A 1 n T A 2 n T ⋮ A nn T
行列变换
r i ÷ ( × ) k r_{i} \div(\times) k r i ÷ ( × ) k (或 c i ÷ ( × ) k c_{i} \div(\times) k c i ÷ ( × ) k ):从第 i i i 行(列)中提取公因子(乘以) k k k .
r i + k r j r_{i} + kr_{j} r i + k r j (或 c i + k r j c_{i} + kr_{j} c i + k r j ):将第 j j j 行(列)的 k k k 倍加到第 i i i 行(列)上.
r i ↔ r j r_{i} \leftrightarrow r_{j} r i ↔ r j (或 c i ↔ c j c_{i} \leftrightarrow c_{j} c i ↔ c j ):将第 i i i 行(列)和第 j j j 列互换。
r ( A ) = n r(\mathbf{A}) = n r ( A ) = n ⇔ \Leftrightarrow ⇔ ∣ A ∣ ≠ 0 \vert \mathbf{A} \vert \ne 0 ∣ A ∣ = 0
A , B \mathbf{A}, \mathbf{B} A , B 等价 ⇔ \Leftrightarrow ⇔ r ( A ) = r ( B ) r(\mathbf{A}) = r(\mathbf{B}) r ( A ) = r ( B ) ⇔ \Leftrightarrow ⇔ 矩阵有相等的等价标准型
矩阵阶梯化
满足以下条件的矩阵称为阶梯矩阵
如果一行元素全都为 0 0 0 那么该行下所有元素都为 0 0 0 ;
所有有非零元素的行,最左边的非零元素的列号,从上往下严格递增。
一切矩阵都可以通过初等变换变为阶梯矩阵。
将阶梯矩阵转置后,再通过初等变换可以将矩阵转换成型如:
( E r 0 0 0 ) \begin{pmatrix}
\mathbf{E_r} & \mathbf{0} \\
\mathbf{0} & \mathbf{0} \\
\end{pmatrix} ( E r 0 0 0 )
的矩阵,称为等价标准型 ,其中 r r r 是包含非零元素的行数,也叫矩阵的秩 ,矩阵的秩无法通过初等变换改变。
关于矩阵的秩有一些重要的不等式常常在证明题中使用:
r ( A B ) ≤ = min { r ( A , r ( B ) } r(\mathbf{AB}) \leq = \min \{r(\mathbf{A}, r(\mathbf{B})\} r ( AB ) ≤= min { r ( A , r ( B )} ;
A m × n B n × s = O ⇒ r ( A ) + r ( B ) ≤ n \mathbf{A_{m\times n}B_{n\times s}} = \mathbf{O} \Rightarrow r(\mathbf{A}) + r(\mathbf{B}) \le n A m × n B n × s = O ⇒ r ( A ) + r ( B ) ≤ n ;
r ( A + B ) ≤ r ( A ) + r ( B ) r(\mathbf{A+B}) \le r(\mathbf{A}) + r(\mathbf{B}) r ( A + B ) ≤ r ( A ) + r ( B )
特别地,有两个 n n n 维列 向量 α , β \mathbf{\alpha}, \mathbf{\beta} α , β 通过相乘可以得到一个 n n n 阶矩阵 A = α β T \mathbf{A} = \mathbf{\alpha} \mathbf{\beta}^T A = α β T ,这个矩阵的秩为 1.且有以下规律:A n = l n − 1 A \mathbf{A}^n = l^{n-1}A A n = l n − 1 A 其中 l = t r ( A ) l=\rm{tr}(A) l = tr ( A )
矩阵的逆
A \mathbf{A} A 逆存在 ⇔ \Leftrightarrow ⇔ r ( A ) = n r(\mathbf{A}) = n r ( A ) = n ⇔ \Leftrightarrow ⇔ ∣ A ∣ ≠ 0 |\mathbf{A}| \neq 0 ∣ A ∣ = 0 ⇔ \Leftrightarrow ⇔ A \mathbf{A} A 的特征值中没有 0 ⇔ \Leftrightarrow ⇔ A \mathbf{A} A 的齐次线性方程组 A x = 0 \mathbf{Ax} = \mathbf{0} Ax = 0 只有零解 ⇔ \Leftrightarrow ⇔ A \mathbf{A} A 的行(列)向量组线性无关 ⇔ \Leftrightarrow ⇔ A \mathbf{A} A 与单位矩阵等价
A ∗ = ( A 11 A 21 A 31 ⋯ A n 1 A 12 A 22 A 32 ⋯ A n 2 ⋮ ⋮ ⋮ ⋮ A 1 n A 2 n A 3 n ⋯ A n n ) \mathbf{A}^* =
\begin{pmatrix}
A_{11} & A_{21} & A_{31} & \cdots & A_{n1} \\
A_{12} & A_{22} & A_{32} & \cdots & A_{n2} \\
\vdots & \vdots & \vdots & & \vdots \\
A_{1n} & A_{2n} & A_{3n} & \cdots & A_{nn}
\end{pmatrix} A ∗ = A 11 A 12 ⋮ A 1 n A 21 A 22 ⋮ A 2 n A 31 A 32 ⋮ A 3 n ⋯ ⋯ ⋯ A n 1 A n 2 ⋮ A nn
其中 A i j A_{ij} A ij 矩阵 A A A 的代数余子式。
注意这里的代数余子式的位置,位置 i j ij ij 的代数余子式并不是 A i j A_{ij} A ij ,而是转置。
因为代数余子式有一个很好的性质:
a i 1 A j 1 + a i 2 A j 2 + ⋯ + a i n A j n = { d , i = j , 0 , i ≠ j . a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots + a_{in}A_{jn} = \begin{cases}
d, i = j, \\
0, i \neq j. \\
\end{cases} a i 1 A j 1 + a i 2 A j 2 + ⋯ + a in A jn = { d , i = j , 0 , i = j .
a 1 i A 1 j + a 2 i A 2 j + ⋯ + a n i A n j = { d , i = j , 0 , i ≠ j . a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots + a_{ni}A_{nj} =
\begin{cases}
d, i = j, \\
0, i \neq j. \\
\end{cases} a 1 i A 1 j + a 2 i A 2 j + ⋯ + a ni A nj = { d , i = j , 0 , i = j .
这个性质描述了行列式中第 i i i 行如果使用第 j j j 行的代数余子式进行展开,结果将为 0。
证明 :
由于行列式的行列地位等价,所以对行证明的结论对列也适用。所以先只对行证明。假设对 i i i 行展开, 第 i i i 行不会出现在代数余子式中,i i i 行影响的是 D D D 的展开式中,代数余子式 A i j A_{ij} A ij 的乘数。所以不妨令第 j j j 为第 i i i 行,然后使用第 j j j 行展开,这样的结果与第 i i i 行使用第 j j j 行展开的展开结果是一致的(乘数是第 i i i 行,代数余子式是第 j j j 行的)。由于第 i i i 行和第 j j j 行相等,所以行列式 D D D 的值为 0 0 0 ,结论得证。
A A ∗ = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ) ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋮ ⋮ A 1 n A 2 n ⋯ A n n ) = ( d d ⋱ d ) = d E \begin{aligned}
\mathbf{AA}^*
= &
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix}
\begin{pmatrix}
A_{11} & A_{21} & \cdots & A_{n1} \\
A_{12} & A_{22} & \cdots & A_{n2} \\
\vdots & \vdots & \vdots & \vdots \\
A_{1n} & A_{2n} & \cdots & A_{nn} \\
\end{pmatrix} \\
= &
\begin{pmatrix}
d \\
& d \\
& & \ddots \\
& & & d \\
\end{pmatrix}
= d\mathbf{E}
\end{aligned} AA ∗ = = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn A 11 A 12 ⋮ A 1 n A 21 A 22 ⋮ A 2 n ⋯ ⋯ ⋮ ⋯ A n 1 A n 2 ⋮ A nn d d ⋱ d = d E
于是便得到矩阵 A \mathbf{A} A 的逆: A − 1 = A ∗ d = A ∗ ∣ A ∣ \mathbf{A}^{-1} = \dfrac{\mathbf{A}^*}{d} = \dfrac{\mathbf{A}^*}{|\mathbf{A}|} A − 1 = d A ∗ = ∣ A ∣ A ∗
特别地,我们有:
∣ A ∗ ∣ = ∣ A ∣ n − 1 ∣ A − 1 ∣ = ∣ A ∣ − 1 ( k A ) − 1 = 1 k A − 1 ( B A ) − 1 = A − 1 B − 1 r ( A ∗ ) = { n , r ( A ) = n 1 , r ( A ) = n − 1 0 , r ( A ) < n − 1 \begin{aligned}
\vert \mathbf{A}^{*} \vert = \vert \mathbf{A} \vert ^{n-1} \\
\vert \mathbf{A}^{-1} \vert = \vert \mathbf{A} \vert ^{-1} \\
(k\mathbf{A})^{-1} = \dfrac{1}{k} \mathbf{A}^{-1} \\
(\mathbf{B}\mathbf{A})^{-1} = \mathbf{A}^{-1} \mathbf{B}^{-1} \\
r(\mathbf{A}^*) =
\begin{cases}
n, r(\mathbf{A}) = n \\
1, r(\mathbf{A}) = n-1 \\
0, r(\mathbf{A}) < n-1
\end{cases}
\end{aligned} ∣ A ∗ ∣ = ∣ A ∣ n − 1 ∣ A − 1 ∣ = ∣ A ∣ − 1 ( k A ) − 1 = k 1 A − 1 ( BA ) − 1 = A − 1 B − 1 r ( A ∗ ) = ⎩ ⎨ ⎧ n , r ( A ) = n 1 , r ( A ) = n − 1 0 , r ( A ) < n − 1
矩阵求逆
定义法,找到一个 B \mathbf{B} B 使得 A B = E \mathbf{A}\mathbf{B} = \mathbf{E} AB = E
伴随矩阵 A − 1 = A ∗ ∣ A ∣ \mathbf{A}^{-1} = \dfrac{\mathbf{A}^*}{\vert \mathbf{A} \vert} A − 1 = ∣ A ∣ A ∗
行变换 ( A ∣ E ) → ( E ∣ A − 1 ) (\mathbf{A} | \mathbf{E}) \to (\mathbf{E} | \mathbf{A}^{-1}) ( A ∣ E ) → ( E ∣ A − 1 )
用分块
[ A O O B ] − 1 = [ A − 1 O O B − 1 ] , [ O B A O ] − 1 = [ O A − 1 B − 1 O ] \begin{bmatrix}
\mathbf{A} & \mathbf{O}\\
\mathbf{O} & \mathbf{B}
\end{bmatrix}^{-1} =
\begin{bmatrix}
\mathbf{A}^{-1} & \mathbf{O}\\
\mathbf{O} & \mathbf{B}^{-1}
\end{bmatrix} ,
\begin{bmatrix}
\mathbf{O} & \mathbf{B}\\
\mathbf{A} & \mathbf{O}
\end{bmatrix}^{-1} =
\begin{bmatrix}
\mathbf{O} & \mathbf{A}^{-1}\\
\mathbf{B}^{-1} & \mathbf{O}
\end{bmatrix} [ A O O B ] − 1 = [ A − 1 O O B − 1 ] , [ O A B O ] − 1 = [ O B − 1 A − 1 O ]
初等行列变换
初等矩阵
将矩阵运算和矩阵初等变换联系起来的矩阵,通过左乘(右乘)初等矩阵,就可以实现行(列)变换。
P ( i , j ) = ( 1 1 0 ⋯ 1 ⋮ ⋮ 1 ⋯ 0 1 1 ) ( i ) ( j ) \mathbf{P}(i, j) =
\begin{pmatrix}
1 \\
& 1 \\
& & 0 & \cdots & 1 \\
& & \vdots & & \vdots \\
& & 1 & \cdots & 0 \\
& & & & & 1 \\
& & & & & & 1 \\
\end{pmatrix}
\begin{aligned}
(i) \\
\\
(j) \\
\end{aligned} P ( i , j ) = 1 1 0 ⋮ 1 ⋯ ⋯ 1 ⋮ 0 1 1 ( i ) ( j )
P ( i ( k ) ) = ( 1 ⋱ k ⋱ 1 ) ( i ) \mathbf{P}(i(k)) =
\begin{pmatrix}
1 \\
& \ddots \\
& & k \\
& & & \ddots \\
& & & & 1 \\
\end{pmatrix}
\begin{aligned}
(i)
\end{aligned} P ( i ( k )) = 1 ⋱ k ⋱ 1 ( i )
P ( i , j ( k ) ) = ( 1 ⋱ 1 k ⋱ 1 ⋱ 1 ) ( i ) ( j ) \mathbf{P}(i, j(k)) =
\begin{pmatrix}
1 \\
& \ddots \\
& & 1 & & k \\
& & & \ddots \\
& & & & 1 \\
& & & & & \ddots \\
& & & & & & 1 \\
\end{pmatrix}
\begin{aligned}
(i) \\
\\
(j) \\
\end{aligned} P ( i , j ( k )) = 1 ⋱ 1 ⋱ k 1 ⋱ 1 ( i ) ( j )
以上各初等矩阵用来左乘 A \mathbf{A} A 时代表行变换 ;右乘 时,代表列变换 。
基于以上规律,矩阵的初等变换可以转换为连续左乘和右乘不同的初等矩阵。
正交矩阵
n n n 阶矩阵 A \mathbf{A} A 满足 A A T = E \mathbf{AA}^T = \mathbf{E} AA T = E 那么矩阵 A \mathbf{A} A 被称为正交矩阵;
即矩阵的转置等于矩阵的逆的矩阵称为正交矩阵;
显然有正交矩阵 ∣ A ∣ 2 = 1 |\mathbf{A}|^2 = 1 ∣ A ∣ 2 = 1