线性方程组
非齐次线性方程组
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 , a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 , ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m , (1) \begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1, \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2, \\
\cdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m,
\end{cases} \tag{1} ⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 , a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 , ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a mn x n = b m , ( 1 )
齐次线性方程组
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = 0 , a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = 0 , ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = 0 , (2) \begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = 0, \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = 0, \\
\cdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = 0,
\end{cases} \tag{2} ⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = 0 , a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = 0 , ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a mn x n = 0 , ( 2 )
增广矩阵 A ~ = ( A , b ) \mathbf{\tilde{A}} = (\mathbf{A}, \mathbf{b}) A ~ = ( A , b )
线性方程组解的情况:
唯一解,当且仅当 r ( A ~ ) = r ( A ) = n r(\mathbf{\tilde{A}}) = r(\mathbf{A}) = n r ( A ~ ) = r ( A ) = n ;
有无穷多解,当且仅当 r ( A ~ ) = r ( A ) < n r(\mathbf{\tilde{A}}) = r(\mathbf{A}) \lt n r ( A ~ ) = r ( A ) < n ;
无解,当且仅当 r ( A ~ ) ≠ r ( A ) r(\mathbf{\tilde{A}}) \neq r(\mathbf{A}) r ( A ~ ) = r ( A ) .
自由未知量 ,就是无穷多解的情形,有效方程数小于未知量数,剩下的就是自由未知量。
n n n 维向量空间 :以数域 F F F 的元素为分量的 n n n 维向量全体,包括定义在其中的加法和数量乘积(线性组合),称为数域 F F F 上的 n n n 维向量空间,记为 F n F^n F n 。
基 :在 F n F^n F n 上的 n n n 个线性无关的向量。
基变换公式 :( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) A (\mathbf{\beta_1}, \mathbf{\beta_2}, \cdots, \mathbf{\beta_n}) = (\mathbf{\alpha_1}, \mathbf{\alpha_2}, \cdots, \mathbf{\alpha_n}) \mathbf{A} ( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) A
坐标变换公式 :根据基变换公式得到的公式,不同的基对同一向量有不同的线性组合,当基变换了,坐标就相应的要变换,下面是转换公式,{ y n } \{y_n\} { y n } 对应上面的 { β n } \{\mathbf{\beta_n}\} { β n } 的坐标, { x n } \{x_n\} { x n } 对应 { α n } \{\alpha_n\} { α n } 。
( x 1 x 2 ⋮ x n ) = A ( y 1 y 2 ⋮ y n ) \begin{pmatrix}
x_{1} \\
x_{2} \\
\vdots \\
x_{n} \\
\end{pmatrix} =
\mathbf{A}
\begin{pmatrix}
y_{1} \\
y_{2} \\
\vdots \\
y_{n} \\
\end{pmatrix} x 1 x 2 ⋮ x n = A y 1 y 2 ⋮ y n
线性表出:存在一组不全为零的数 ( k 1 , k 2 , … , k n ) (k_1, k_2, \dots, k_n) ( k 1 , k 2 , … , k n ) 使得向量组 { α 1 , α 2 , … , α n } \{\mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_n}\} { α 1 , α 2 , … , α n } 与之相乘之和等于另一个向量 α \mathbf{\alpha} α ,我们称之为 α \mathbf{\alpha} α 可由向量组 { α 1 , α 2 , … , α n } \{\mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_n}\} { α 1 , α 2 , … , α n } 线性表出。
线性组合:我们将上面的 α \mathbf{\alpha} α 称为向量组 { α 1 , α 2 , … , α n } \{\mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_n}\} { α 1 , α 2 , … , α n } 的线性组合。
线性相关:如果上式的 α = 0 \mathbf{\alpha} = \mathbf{0} α = 0 我们说向量组 { α 1 , α 2 , … , α n } \{\mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_n}\} { α 1 , α 2 , … , α n } 线性相关,反之称为线性无关。
将线性相关和线性方程组联系起来,我们可以把 k k k 看作未知数,一个向量看成一个未知数的一组系数,是否线性相关,就相当于判断一个齐次线性方程组的解的情形,就能用上矩阵的秩进行判断;
极大线性无关组 :一个向量组中,能够容纳的最多的线性无关向量向量组;也就是说在 n n n 个向量的向量组中有 s s s 个向量线性无关,并且再增加任何一个向量之后向量组便线性相关了,这 s s s 个向量构成一个线性无关组。我们可以这样理解 :极大线性无关组包含了整个向量组中最精炼的信息,向量组内的其他信息都可以用这个向量组来线性表出(因为再多一个向量都会变成线性相关组,而该向量组本身是线性无关的);
向量组的秩 :极大线性无关组的向量个数;
一些比较重要的定理:
若向量组 α 1 , α 2 , … , α r \mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_r} α 1 , α 2 , … , α r 被向量组 β 1 , β 2 , … , β s \mathbf{\beta_1}, \mathbf{\beta_2}, \dots, \mathbf{\beta_s} β 1 , β 2 , … , β s 线性表出,且 r > s r \gt s r > s ,那么向量组 α 1 , α 2 , … , α r \mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_r} α 1 , α 2 , … , α r 线性相关。
大的向量组被小的向量组表达了,那么大的向量组肯定包含了冗余的信息。
若向量组 α 1 , α 2 , … , α r \mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_r} α 1 , α 2 , … , α r 被向量组 β 1 , β 2 , … , β s \mathbf{\beta_1}, \mathbf{\beta_2}, \dots, \mathbf{\beta_s} β 1 , β 2 , … , β s 线性表出,且向量组 α 1 , α 2 , … , α r \mathbf{\alpha_1}, \mathbf{\alpha_2}, \dots, \mathbf{\alpha_r} α 1 , α 2 , … , α r 线性无关,那么 r ⩽ s r \leqslant s r ⩽ s .
是上一条命题的逆否命题,也就是一个向量组被另一个向量组表达了,而且被表达的向量组的信息没有冗余,那么被表达的向量组肯定不比另一个向量组大。
若向量组 ( α ) (\mathbf{\alpha}) ( α ) 被向量组 ( β ) (\mathbf{\beta}) ( β ) 线性表出,那么向量组 ( α ) (\mathbf{\alpha}) ( α ) 的秩小于等于向量组 ( β ) (\mathbf{\beta}) ( β ) 的秩。
如果一个向量组被另一个向量组表达了,那么该向量组的信息量必然不超过另一个向量组。
对于矩阵 A m × n \mathbf{A}_{m \times n} A m × n 和矩阵 B n × s \mathbf{B}_{n \times s} B n × s 我们有 r ( A B ) ⩽ min { r ( A ) , r ( B ) } r(\mathbf{AB}) \leqslant \min \{r(\mathbf{A}), r(\mathbf{B})\} r ( AB ) ⩽ min { r ( A ) , r ( B )} .
若矩阵 A B = O \mathbf{A}\mathbf{B} = \mathbf{O} AB = O 则 r ( A ) + r ( B ) < n r(\mathbf{A}) + r(\mathbf{B}) \lt n r ( A ) + r ( B ) < n 。
线性方程组解的结构
我们知道方程组 ( 1 ) (1) ( 1 ) 的情况有三种:
无解 r ( A ) < r ( A ‾ ) r(\mathbf{A}) < r(\mathbf{\overline{A}}) r ( A ) < r ( A )
唯一解 r ( A ) = r ( A ‾ ) = n r(\mathbf{A}) = r(\mathbf{\overline{A}}) = n r ( A ) = r ( A ) = n
无穷解 r ( A ) = r ( A ‾ ) < n r(\mathbf{A}) = r(\mathbf{\overline{A}}) < n r ( A ) = r ( A ) < n
其中包含无穷多解的情形,通过对向量工具的利用,我们是否能够通过有限个解来表达无限个解的情况呢?
为了方便研究我们使用
A X = b , ( α 1 , α 2 , ⋯ , α n ) X = b \begin{aligned}
\mathbf{AX} & = \mathbf{b}, \\
(\mathbf{\alpha_1}, \mathbf{\alpha_2}, \cdots, \mathbf{\alpha_n}) \mathbf{X} & = \mathbf{b}
\end{aligned} AX ( α 1 , α 2 , ⋯ , α n ) X = b , = b
来表示方程组 ( 1 ) (1) ( 1 ) ,
使用
A X = 0 , ( α 1 , α 2 , ⋯ , α n ) X = 0 \begin{aligned}
\mathbf{AX} & = \mathbf{0}, \\
(\mathbf{\alpha_1}, \mathbf{\alpha_2}, \cdots, \mathbf{\alpha_n}) \mathbf{X} & = \mathbf{0}
\end{aligned} AX ( α 1 , α 2 , ⋯ , α n ) X = 0 , = 0
来表示方程组 ( 2 ) (2) ( 2 ) 。
循序渐进,我们先来讨论相对简单的齐次线性方程组的情形。
对于齐次线性方程组 ( 2 ) (2) ( 2 ) 根据之前的讨论,我们知道解的情形和系数矩阵的秩是有关的,而且齐次的时候唯一解就是零解。
定义 :基础解系
对于齐次方程组 ( 2 ) (2) ( 2 ) 有一组解 η 1 , η 2 , ⋯ , η t \mathbf{\eta}_1, \mathbf{\eta}_2, \cdots, \mathbf{\eta}_t η 1 , η 2 , ⋯ , η t 满足以下条件:
( 1 ) (1) ( 1 ) η 1 , η 2 , ⋯ , η t \mathbf{\eta}_1, \mathbf{\eta}_2, \cdots, \mathbf{\eta}_t η 1 , η 2 , ⋯ , η t 线性无关;
( 2 ) (2) ( 2 ) 方程组任何一个解都是它的线性表出;
换言之,这组解是方程组 ( 2 ) (2) ( 2 ) 整个解集的一组极大线性无关组,我们称之为基础解系。
关于方程组 ( 2 ) (2) ( 2 ) 的解,我们有以下性质和定理:
性质 :
若 ξ 1 , ξ 2 \mathbf{\xi}_1, \mathbf{\xi}_2 ξ 1 , ξ 2 是 ( 1 ) (1) ( 1 ) 的两个解,那么 ξ 1 + ξ 2 \mathbf{\xi}_1 + \mathbf{\xi}_2 ξ 1 + ξ 2 也是他的解。
若 ξ \mathbf{\xi} ξ 是 ( 2 ) (2) ( 2 ) 的解,那么 k ξ k\mathbf{\xi} k ξ 也是它的解。
以上的性质说明方程组 ( 2 ) (2) ( 2 ) 的解具有线性性质,联系之前基础解系的定义和先前对于向量空间的知识,我们可以知道,齐次方程组 ( 2 ) (2) ( 2 ) 的所有解都可以使用基础解系进行描述;基础解系对应方程组的解的向量空间的基,以下是一些概念的对应关系:
线性方程组 向量组 向量空间 基础解系 极大线性无关组 向量空间的基 方程组的解 所有解构成的一组向量组 这组向量是一个线性空间
定理 :(其证明过程也是求基础解系的方法)
若方程组 ( 2 ) (2) ( 2 ) 有非零解,则它一定有基础解系,并且基础解系包含的解的个数为 n − r ( A ) n - r(\mathbf{A}) n − r ( A ) 。
证明
若 r ( A ) = n r(\mathbf{A}) = n r ( A ) = n ,那么方程组 ( 2 ) (2) ( 2 ) 只有零解,所以不存在基础解系;
若 r ( A ) < n r(\mathbf{A}) < n r ( A ) < n ,将方程组 ( 2 ) (2) ( 2 ) 的 n − r n - r n − r 个自由未知量转移到右边,得到:
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 r x r = a 1 , r + 1 x r + 1 + ⋯ + a r n x n , a 21 x 1 + a 22 x 2 + ⋯ + a 2 r x r = a 1 , r + 1 x r + 1 + ⋯ + a r n x n , ⋯ a r 1 x 1 + a r 2 x 2 + ⋯ + a r r x r = a r , r + 1 x r + 1 + ⋯ + a r n x n . \begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots + a_{1r}x_r = a_{1, r+1}x_{r+1} + \cdots + a_{rn}x_n, \\
a_{21}x_1 + a_{22}x_2 + \cdots + a_{2r}x_r = a_{1, r+1}x_{r+1} + \cdots + a_{rn}x_n, \\
\cdots \\
a_{r1}x_1 + a_{r2}x_2 + \cdots + a_{rr}x_r = a_{r, r+1}x_{r+1} + \cdots + a_{rn}x_n.
\end{cases} ⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 r x r = a 1 , r + 1 x r + 1 + ⋯ + a r n x n , a 21 x 1 + a 22 x 2 + ⋯ + a 2 r x r = a 1 , r + 1 x r + 1 + ⋯ + a r n x n , ⋯ a r 1 x 1 + a r 2 x 2 + ⋯ + a rr x r = a r , r + 1 x r + 1 + ⋯ + a r n x n .
对于左边的 r r r 个未知量,我们可以在知道右边的值后,使用克拉默法则求解,因此我们先来确定右边的值:
我们依次给定右边 n − r n - r n − r 个自由未知量的值:
( x r + 1 , x r + 2 , ⋯ , x n ) = ( 1 , 0 , ⋯ , 0 ) , ( 0 , 1 , 0 , ⋯ , 0 ) , ⋯ , ( 0 , 0 , ⋯ , 1 ) (x_{r+1}, x_{r+2}, \cdots, x_{n}) = (1, 0, \cdots, 0), (0, 1, 0, \cdots, 0), \cdots, (0, 0, \cdots, 1) ( x r + 1 , x r + 2 , ⋯ , x n ) = ( 1 , 0 , ⋯ , 0 ) , ( 0 , 1 , 0 , ⋯ , 0 ) , ⋯ , ( 0 , 0 , ⋯ , 1 )
于是我们得到基础解系为:
{ η 1 = ( c 11 , c 12 , ⋯ , c 1 r , 1 , 0 , 0 , ⋯ , 0 ) , η 2 = ( c 21 , c 22 , ⋯ , c 2 r , 0 , 1 , 0 , ⋯ , 0 ) , ⋯ η n − r = ( c n − r , 1 , c n − r , 2 , ⋯ , c n − r , r , 0 , 0 , 0 , ⋯ , 1 ) . \begin{cases}
\mathbf{\eta}_1 = (c_{11}, c_{12}, \cdots, c_{1r}, 1, 0, 0, \cdots, 0), \\
\mathbf{\eta}_2 = (c_{21}, c_{22}, \cdots, c_{2r}, 0, 1, 0, \cdots, 0), \\
\cdots \\
\mathbf{\eta}_{n-r} = (c_{n-r, 1}, c_{n-r, 2}, \cdots, c_{n-r, r}, 0, 0, 0, \cdots, 1).
\end{cases} ⎩ ⎨ ⎧ η 1 = ( c 11 , c 12 , ⋯ , c 1 r , 1 , 0 , 0 , ⋯ , 0 ) , η 2 = ( c 21 , c 22 , ⋯ , c 2 r , 0 , 1 , 0 , ⋯ , 0 ) , ⋯ η n − r = ( c n − r , 1 , c n − r , 2 , ⋯ , c n − r , r , 0 , 0 , 0 , ⋯ , 1 ) .
要证明它是基础解系很简单,首先通过行列变换可以证明这个矩阵是满秩的,因此这个向量组是线性无关的;然后通过方程组 ( 2 ) (2) ( 2 ) 的解的线性性质,再根据我们特意给定的后 n − r n - r n − r 个分量的结构(形如:( 1 , 0 , 0 , ⋯ , 0 ) , ( 0 , 1 , 0 , ⋯ , 0 ) , ⋯ (1, 0, 0, \cdots, 0), (0, 1, 0, \cdots, 0), \cdots ( 1 , 0 , 0 , ⋯ , 0 ) , ( 0 , 1 , 0 , ⋯ , 0 ) , ⋯ ),可以控制向量组的后 n − r n - r n − r 个与任意解的后 n − r n - r n − r 个分量保持一致,又因为前 r r r 个分量的值由后面的决定,所以该向量组可以线性表出任意解。因此该向量组是方程组 ( 2 ) (2) ( 2 ) 的基础解系。
下面开始讨论方程组 ( 1 ) (1) ( 1 ) 的解的情形:
我们有一些定理和解的性质:
性质 :
设 γ 1 , γ 2 \gamma_1, \gamma_2 γ 1 , γ 2 是 A X = b \mathbf{AX} = \mathbf{b} AX = b 的解,则 γ 1 − γ 2 \gamma_1 - \gamma_2 γ 1 − γ 2 是 A X = 0 \mathbf{AX} = \mathbf{0} AX = 0 的解。
设 γ \gamma γ 是 A X = b \mathbf{AX} = \mathbf{b} AX = b 的解,η \eta η 是 A X = 0 \mathbf{AX} = \mathbf{0} AX = 0 的解,则 γ + η \gamma + \eta γ + η 也是 A X = b \mathbf{AX} = \mathbf{b} AX = b 的解。
上述性质直接将解代入方程即可得到。
定理 :
线性方程组 ( 1 ) (1) ( 1 ) 有解的充要条件是 b \mathbf{b} b 是可以由向量组 ( α 1 , α 2 , ⋯ , α n ) (\mathbf{\alpha_1}, \mathbf{\alpha_2}, \cdots, \mathbf{\alpha_n}) ( α 1 , α 2 , ⋯ , α n ) 线性表出。
设 γ 0 \gamma_0 γ 0 是方程组 ( 1 ) (1) ( 1 ) 的解(通常为特解),他的任意一个解都可以表示成
γ = γ 0 + η \gamma = \gamma_0 + \eta γ = γ 0 + η
其中 η \eta η 是他的导出组(对应系数矩阵相同的齐次线性方程)。
根据定理,我们知道要表示方程组 ( 2 ) (2) ( 2 ) 的任意一个解,我们需要知道
γ 0 \gamma_0 γ 0 :方程组的任意一个特解
η \eta η :方程组 ( 1 ) (1) ( 1 ) 的通解。通解可以通过计算方程组 ( 1 ) (1) ( 1 ) 的导出组的基础解系得到。
η = k 1 γ 1 + k 2 γ 2 + ⋯ + k n − r γ n − r \eta = k_1 \mathbf{\gamma}_{1} + k_2 \mathbf{\gamma}_{2} + \cdots + k_{n-r} \gamma_{n-r} η = k 1 γ 1 + k 2 γ 2 + ⋯ + k n − r γ n − r
其中 k 1 , k 2 , ⋯ , k n − r k_1, k_2, \cdots, k_{n-r} k 1 , k 2 , ⋯ , k n − r 是任意常数。