矩阵本质:矩阵是一个二维的数值表格,可看作是对向量进行线性变换的工具。例如,对于二维向量 x = ( x 1 , x 2 ) \mathbf{x}=(x_1,x_2) x=(x1,x2) 和矩阵 A = ( a b c d ) A = \begin{pmatrix}a&b\\c&d\end{pmatrix} A=(acbd),矩阵 - 向量乘积 A x = ( a x 1 + b x 2 c x 1 + d x 2 ) A\mathbf{x}=\begin{pmatrix}ax_1 + bx_2\\cx_1 + dx_2\end{pmatrix} Ax=(ax1+bx2cx1+dx2) 表示对向量 x \mathbf{x} x 进行线性变换后得到的新向量。矩阵范数不仅要考虑矩阵自身元素,还要考虑矩阵作为线性变换对向量长度的影响,所以定义方式更为复杂,涉及矩阵的奇异值、行列式、特征值等与线性变换相关的概念。
线性方程组求解:在求解线性方程组 A x = b Ax = b Ax=b 时,矩阵范数可以用于估计解的误差和条件数。条件数 κ ( A ) = ∥ A ∥ 2 ∥ A − 1 ∥ 2 \kappa(A)=\|A\|_2\|A^{-1}\|_2 κ(A)=∥A∥2∥A−1∥2(当 A A A 可逆时)反映了矩阵 A A A 的病态程度。如果条件数很大,说明方程组的解对输入数据 b b b 的微小变化非常敏感,数值求解的误差可能很大。
矩阵范数的数学性质:矩阵范数同样满足非负性、齐次性和三角不等式,但还需要满足与矩阵乘法相容的性质,即 ∥ A B ∥ ≤ ∥ A ∥ ∥ B ∥ \|AB\|\leq\|A\|\|B\| ∥AB∥≤∥A∥∥B∥。这种相容性性质使得矩阵范数在矩阵空间和线性变换的框架下具有更复杂的数学结构和理论体系。例如,矩阵的谱范数与矩阵的奇异值分解密切相关,而矩阵的奇异值分解是矩阵理论中的一个重要概念,涉及到线性代数、数值分析等多个数学领域。
向量范数:向量范数是衡量向量“大小”或“长度”的一种度量方式。对于一个 n n n 维向量 x = ( x 1 , x 2 , ⋯ , x n ) \mathbf{x}=(x_1,x_2,\cdots,x_n) x=(x1,x2,⋯,xn),向量范数 ∥ x ∥ \|\mathbf{x}\| ∥x∥ 是一个非负实数,满足非负性、齐次性和三角不等式等性质。向量范数主要关注向量自身的元素特征。
矩阵范数:矩阵范数是衡量矩阵“大小”或“强度”的一种度量方式。对于一个 m × n m\times n m×n 的矩阵 A = ( a i j ) A=(a_{ij}) A=(aij),矩阵范数 ∥ A ∥ \|A\| ∥A∥ 也是一个非负实数,同样满足非负性、齐次性和三角不等式等性质。但矩阵范数不仅与矩阵自身的元素有关,还与矩阵作为线性变换对向量的作用有关,它反映了矩阵在某种意义下的“放大”能力。
7. 范数计算方式区别
向量范数
L1 范数: ∥ x ∥ 1 = ∑ i = 1 n ∣ x i ∣ \|\mathbf{x}\|_1=\sum_{i = 1}^{n}|x_i| ∥x∥1=∑i=1n∣xi∣,即向量元素绝对值之和。例如,向量 x = ( 3 , − 4 , 2 ) \mathbf{x}=(3, - 4, 2) x=(3,−4,2), ∥ x ∥ 1 = ∣ 3 ∣ + ∣ − 4 ∣ + ∣ 2 ∣ = 9 \|\mathbf{x}\|_1=|3|+|-4|+|2| = 9 ∥x∥1=∣3∣+∣−4∣+∣2∣=9。
L2 范数(欧几里得范数): ∥ x ∥ 2 = ∑ i = 1 n x i 2 \|\mathbf{x}\|_2=\sqrt{\sum_{i = 1}^{n}x_i^2} ∥x∥2=∑i=1nxi2,即向量元素平方和的平方根。例如,向量 x = ( 1 , 2 ) \mathbf{x}=(1,2) x=(1,2), ∥ x ∥ 2 = 1 2 + 2 2 = 5 \|\mathbf{x}\|_2=\sqrt{1^2 + 2^2}=\sqrt{5} ∥x∥2=12+22=5。
L∞ 范数: ∥ x ∥ ∞ = max 1 ≤ i ≤ n ∣ x i ∣ \|\mathbf{x}\|_{\infty}=\max_{1\leq i\leq n}|x_i| ∥x∥∞=max1≤i≤n∣xi∣,即向量元素绝对值的最大值。例如,向量 x = ( − 2 , 1 , 3 ) \mathbf{x}=( - 2,1,3) x=(−2,1,3), ∥ x ∥ ∞ = max { ∣ − 2 ∣ , ∣ 1 ∣ , ∣ 3 ∣ } = 3 \|\mathbf{x}\|_{\infty}=\max\{|-2|,|1|,|3|\}=3 ∥x∥∞=max{∣−2∣,∣1∣,∣3∣}=3。
矩阵范数
L1 范数(列和范数): ∥ A ∥ 1 = max 1 ≤ j ≤ n ∑ i = 1 m ∣ a i j ∣ \|A\|_1=\max_{1\leq j\leq n}\sum_{i = 1}^{m}|a_{ij}| ∥A∥1=max1≤j≤n∑i=1m∣aij∣,即矩阵所有列向量元素绝对值之和的最大值。例如,矩阵 A = ( 1 − 2 3 − 4 5 − 6 ) A=\begin{pmatrix}1& - 2&3\\ - 4&5& - 6\end{pmatrix} A=(1−4−253−6),各列向量元素绝对值之和分别为 5 5 5、 7 7 7、 9 9 9,则 ∥ A ∥ 1 = 9 \|A\|_1 = 9 ∥A∥1=9。
L2 范数(谱范数): ∥ A ∥ 2 = σ 1 \|A\|_2=\sigma_1 ∥A∥2=σ1,其中 σ 1 \sigma_1 σ1 是矩阵 A A A 的最大奇异值。对于矩阵 A = ( 2 0 0 1 ) A=\begin{pmatrix}2&0\\0&1\end{pmatrix} A=(2001),其奇异值为 2 2 2 和 1 1 1,所以 ∥ A ∥ 2 = 2 \|A\|_2 = 2 ∥A∥2=2。
L∞ 范数(行和范数): ∥ A ∥ ∞ = max 1 ≤ i ≤ m ∑ j = 1 n ∣ a i j ∣ \|A\|_{\infty}=\max_{1\leq i\leq m}\sum_{j = 1}^{n}|a_{ij}| ∥A∥∞=max1≤i≤m∑j=1n∣aij∣,即矩阵所有行向量元素绝对值之和的最大值。例如,矩阵 A = ( 1 2 − 3 4 ) A=\begin{pmatrix}1&2\\ - 3&4\end{pmatrix} A=(1−324),各行向量元素绝对值之和分别为 3 3 3 和 7 7 7,则 ∥ A ∥ ∞ = 7 \|A\|_{\infty}=7 ∥A∥∞=7。
向量范数:向量范数之间满足一定的相容性关系,但主要是针对向量自身的运算。例如,对于两个向量 x \mathbf{x} x 和 y \mathbf{y} y,不同向量范数之间的比较和运算相对简单,主要基于向量元素的运算。
矩阵范数:矩阵范数与向量范数之间存在相容性关系,即 ∥ A x ∥ ≤ ∥ A ∥ ∥ x ∥ \|A\mathbf{x}\|\leq\|A\|\|\mathbf{x}\| ∥Ax∥≤∥A∥∥x∥。这表明矩阵 A A A 对向量 x \mathbf{x} x 的线性变换不会使向量的范数放大超过 ∥ A ∥ \|A\| ∥A∥ 倍。这种相容性在分析矩阵 - 向量乘积的误差传播、稳定性等方面非常重要。例如,在数值计算中,当计算矩阵 - 向量乘积时,可以利用这种相容性关系来估计结果的误差范围。