线性代数 | 行图像 / 列图像

注:本文为 “线性代数 | 行图像 / 列图像” 相关合辑。
图片清晰度受引文原图所限。
略作重排,未整理去重。
如有内容异常,请看原文。


MIT 线性代数笔记一 行图像和列图像

线性代数行图像与列图像解析

herosunly 已于 2022-01-25 15:34:26 修改

1. 学习背景回顾

若干年前,王清老师曾讲授线性代数课程。该课程授课音量较小,后排学生难以清晰聆听。根据模糊记忆,课程首讲内容为利用行列式求解方程组(即克莱姆法则),后续依次讲解矩阵的各类运算(包括加法、乘法、求逆与转置)、初等行变换,最终涉及特征值与特征向量的求解。整个学习过程以运算训练为主,却未阐明各类运算的本质意义。当时曾产生疑问:线性代数的核心是否仅为各类运算规则?但该疑问未得到进一步探究。

2. 当前学习规划

自 2018 年(大一时期)起,至今已过去十一年。2022 年新年的首要目标为系统学习李宏毅老师的《机器学习》。在学习“线性回归”章节时,为深化对理论知识的理解,需进行公式推导,此过程涉及矩阵求导公式的应用。为掌握该知识点,制定如下学习笔记。

3. 第一讲 行图像和列图像

3.1 线性方程组的矩阵表示

线性代数的核心问题之一是求解 nnn 元一次方程组。以二元一次方程组为例,其表达式如下:
{2x−y=0−x+2y=3\begin{cases} 2x - y = 0 \\ -x + 2y = 3 \end{cases} {2xy=0x+2y=3
将上述方程组用矩阵形式表示,可得:
[2−1−12][xy]=[03]\begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix} [2112][xy]=[03]
其中,A=[2−1−12]\boldsymbol{A} = \begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix}A=[2112] 称为系数矩阵x=[xy]\boldsymbol{x} = \begin{bmatrix} x \\ y \end{bmatrix}x=[xy] 称为未知数向量,等号右侧的向量记为 b\boldsymbol{b}b。由此,方程组可简化为矩阵方程:Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b

3.2 行图像

https://www.wolframalpha.com/input/?i=2x-y+%3D+0+and+-x%2B2y%3D图片描述

行图像的几何意义与解析几何一致:在二维平面中,每个二元一次方程对应一条直线。绘制方程组中两个方程对应的直线,两条直线的交点坐标即为方程组的解。对于上述方程组,解得 x=1x = 1x=1y=2y = 2y=2

注:上图由 Wolfram Alpha 绘制生成:

  • 2x-y = 0 and -x+2y=3 - Wolfram|Alpha
    https://www.wolframalpha.com/input/?i=2x-y+%3D+0+and+-x%2B2y%3D3

3.3 列图像

3.3.1 列图像的核心思想

列图像分析的核心是将系数矩阵按列分解为若干列向量,此时求解原方程组等价于寻找列向量的线性组合,使其结果等于向量 b\boldsymbol{b}b。对于上述二元一次方程组,按列分解后可表示为:
x⋅[2−1]+y⋅[−12]=[03]x \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} + y \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix} x[21]+y[12]=[03]

3.3.2 线性组合的定义

“向量的线性组合”是线性代数的核心概念之一,其运算包含两部分:

  • 向量加法:需满足平行四边形法则或三角形法则;
  • 向量数乘:对向量进行伸缩变换(系数大于 1 时向量伸展,系数大于 0 且小于 1 时向量收缩,系数小于 0 时向量反向并伸缩)。

特别地,若一组向量构成空间的“基向量”,则该空间内任意向量均可表示为这组基向量的线性组合。

3.3.3 列图像的几何意义

从几何角度看,列图像的求解目标是寻找系数 xxxyyy,使得 xxx 与第一个列向量的数乘结果,与 yyy 与第二个列向量的数乘结果相加后,恰好等于向量 [03]\begin{bmatrix} 0 \\ 3 \end{bmatrix}[03]

3.3.4 列图像的优势(以三元方程组为例)

对于二元方程组,行图像与列图像的优势差异不明显;但对于多元方程组,列图像的优势将显著体现。以三元一次方程组为例:
{x+2y+3z=62x+5y+2z=46x−3y+z=2\begin{cases} x + 2y + 3z = 6 \\ 2x + 5y + 2z = 4 \\ 6x - 3y + z = 2 \end{cases} x+2y+3z=62x+5y+2z=46x3y+z=2
对于矩阵方程 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b

  • 若改变向量 b\boldsymbol{b}b 的数值,行图像中每个方程对应的平面均会发生变化,需重新分析平面间的位置关系;
  • 列图像中,系数矩阵的列向量保持不变,仅需寻找新的线性组合系数即可,求解逻辑更简洁。
3.3.5 方程组有解的充要条件
  1. 核心问题:对于任意向量 b\boldsymbol{b}b,矩阵方程 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 是否均有解?(此处“任意”指所有可能的 b\boldsymbol{b}b
  2. 列图像视角的转化:该问题等价于“系数矩阵的列向量的线性组合是否覆盖整个线性空间?”(选择线性空间作为研究对象,是因为 nnn 元一次方程组的解空间本质为线性空间)。
  3. 无解情况的反例:若系数矩阵的列向量线性相关(例如,第三个列向量恰好等于第一个列向量减去第二个列向量),则所有列向量将共面(二维平面);若向量 b\boldsymbol{b}b 不在该平面内,则列向量的任意线性组合均无法得到 b\boldsymbol{b}b,此时方程组无解。
  4. 奇异矩阵的定义:当列向量线性相关时,系数矩阵 A\boldsymbol{A}A 称为奇异阵(或不可逆矩阵)。在奇异阵条件下,并非所有 b\boldsymbol{b}b 都能使 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 有解。
  5. 一般结论:对于 nnn 维线性空间,若系数矩阵的 nnn 个列向量满足线性无关(即任意一个列向量均不能表示为其他列向量的线性组合),则对于任意 b\boldsymbol{b}b,方程组 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 均有解;若列向量线性相关,则其线性组合无法充满 nnn 维空间,方程组未必有解。
3.3.6 行图像与列图像的维度对比

从行图像视角分析三元方程组的解:

  • 有唯一解:三个平面相交于一点;
  • 无解:至少两个平面平行,或任意两个平面的交线互相平行;
  • 无穷多解:三个平面相交于一条直线。

但当空间维度升高(如 n>3n > 3n>3)时,行图像无法直观绘制,交点位置更难以分析。而列图像通过“线性组合”的思想,将高维空间的解问题转化为向量组合问题,显著降低了分析复杂度。

3.4 总结

线性方程组可等价表示为矩阵方程 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b

  • 从“行视角”分析矩阵 A\boldsymbol{A}A,得到的是方程组中的每个独立方程,其几何意义为空间中的超平面;
  • 从“列视角”分析矩阵 A\boldsymbol{A}A,得到的是系数矩阵的列向量,其核心是通过列向量的线性组合构造向量 b\boldsymbol{b}b

矩阵作为融合两种视角且逻辑自洽的数学工具,是线性代数中的重要创举,为高维线性问题的分析提供了统一框架。


MIT—线性代数笔记 行图像和列图像

三少爷的键 编辑于 2018-10-10 13:33

1 行图像与列图像的基本概念(Row Picture & Column Picture)

1.1 线性方程的几何表示(The Geometry of Linear Equations)

线性代数的核心问题之一是求解 nnn 元一次线性方程组。以二元一次线性方程组为例,其标准形式如下:
{2x−y=0−x+2y=3\begin{cases} 2x - y = 0 \\ -x + 2y = 3 \end{cases} {2xy=0x+2y=3
将上述方程组表示为矩阵形式 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b,可得:
[2−1−12][xy]=[03]\begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix}= \begin{bmatrix} 0 \\ 3 \end{bmatrix} [2112][xy]=[03]
其中各矩阵/向量的定义如下:

  • 系数矩阵(Coefficient Matrix)A=[2−1−12]\boldsymbol{A} = \begin{bmatrix} 2 & -1 \\ -1 & 2 \end{bmatrix}A=[2112],用于存储方程组中未知数的系数;
  • 未知数向量(Unknown Vector):通常记为 x=[xy]\boldsymbol{x} = \begin{bmatrix} x \\ y \end{bmatrix}x=[xy],包含方程组中所有待求的未知量;
  • 常数项向量(Constant Term Vector):记为 b=[03]\boldsymbol{b} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}b=[03],包含方程组等号右侧的常数项。

2 行图像(Row Picture)

2.1 行图像的几何意义

行图像基于解析几何的思想,将线性方程组中的每个方程对应为几何空间中的一条直线(二元情形)或一个平面(三元情形)。对于二元一次方程,通过以下步骤可确定其对应的直线:

  1. 求解方程的两组解(即满足方程的 (x,y)(x, y)(x,y) 坐标对);
  2. x-yx\text{-}yx-y 平面上标记两组解对应的点;
  3. 连接两点形成的直线,即为该方程的行图像。

2.2 行图像的求解原理

线性方程组的解对应于所有方程行图像的交点。对于本节中的二元方程组:

  • 方程 2x−y=02x - y = 02xy=0 的行图像为一条直线;
  • 方程 −x+2y=3-x + 2y = 3x+2y=3 的行图像为另一条直线;
  • 两条直线的交点坐标 (x,y)=(1,2)(x, y) = (1, 2)(x,y)=(1,2),即为方程组的解。

img

3 列图像(Column Picture)

3.1 列图像的核心思想

列图像的本质是将系数矩阵 A\boldsymbol{A}A 按列分解为列向量,将方程组 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 转化为列向量的线性组合问题。对于本节中的二元方程组,系数矩阵的列向量分解形式如下:
x⋅[2−1]+y⋅[−12]=[03]x \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} + y \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix} x[21]+y[12]=[03]
其中,xxxyyy 是线性组合的系数(即方程组的未知数),目标是找到一组 x,yx, yx,y,使得列向量的线性组合结果等于常数项向量 b\boldsymbol{b}b

3.2 线性组合的定义

对于给定的向量 c\boldsymbol{c}cd\boldsymbol{d}d 及标量 xxxyyy,表达式 xc+ydx\boldsymbol{c} + y\boldsymbol{d}xc+yd 称为向量 c\boldsymbol{c}cd\boldsymbol{d}d 的一个线性组合。线性组合是线性代数中的核心概念,贯穿整个课程体系。

3.3 列图像的几何意义与求解

从几何角度看,列图像的求解过程是:找到标量 xxxyyy,使得列向量分别乘以 xxxyyy 后,通过“首尾相接”的向量加法得到 b\boldsymbol{b}b。对于本节的方程组:

  • 蓝色向量为 [2−1]\begin{bmatrix} 2 \\ -1 \end{bmatrix}[21],乘以 x=1x = 1x=1 后得到 1⋅[2−1]=[2−1]1 \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} = \begin{bmatrix} 2 \\ -1 \end{bmatrix}1[21]=[21]
  • 红色向量为 [−12]\begin{bmatrix} -1 \\ 2 \end{bmatrix}[12],乘以 y=2y = 2y=2 后得到 2⋅[−12]=[−24]2 \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} -2 \\ 4 \end{bmatrix}2[12]=[24]
  • 两向量相加:[2−1]+[−24]=[03]=b\begin{bmatrix} 2 \\ -1 \end{bmatrix} + \begin{bmatrix} -2 \\ 4 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix} = \boldsymbol{b}[21]+[24]=[03]=b,因此解得 x=1x = 1x=1y=2y = 2y=2

img

3.4 列向量线性组合的空间覆盖

若任意选取标量 xxxyyy,则列向量 [2−1]\begin{bmatrix} 2 \\ -1 \end{bmatrix}[21][−12]\begin{bmatrix} -1 \\ 2 \end{bmatrix}[12] 的所有线性组合将布满整个 x-yx\text{-}yx-y 平面。下图展示了该过程的几何直观:

img

注:在 D.C.Lay 所著的《线性代数及其应用》中,曾绘制向量 v1=[−11]\boldsymbol{v}_1 = \begin{bmatrix} -1 \\ 1 \end{bmatrix}v1=[11]v2=[12]\boldsymbol{v}_2 = \begin{bmatrix} 1 \\ 2 \end{bmatrix}v2=[12] 的线性组合图像,其整数倍线性组合的端点在平面上形成网格,直观体现了线性组合对平面的覆盖。该书注重通过几何图像辅助理解线性代数概念,英文版已更新至第 5 版,中文版由华章出版社出版。

4 三元线性方程组的行图像与列图像

将上述二元情形的讨论扩展到三元情形,考虑如下三元一次线性方程组(选取 G. Strang 教材中的示例以匹配配图):
{x+2y+3z=62x+5y+2z=46x−3y+z=2\begin{cases} x + 2y + 3z = 6 \\ 2x + 5y + 2z = 4 \\ 6x - 3y + z = 2 \end{cases} x+2y+3z=62x+5y+2z=46x3y+z=2
其矩阵形式为:
[1232526−31][xyz]=[642]\begin{bmatrix} 1 & 2 & 3 \\ 2 & 5 & 2 \\ 6 & -3 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ z \end{bmatrix}= \begin{bmatrix} 6 \\ 4 \\ 2 \end{bmatrix} 126253321xyz=642

4.1 三元方程组的行图像

三元一次方程的行图像为三维空间中的一个平面,方程组的解对应于三个平面的交点:

  • 若三个平面相交于唯一一点,则方程组有唯一解;
  • 若三个平面无公共交点(如存在平行平面、两两交线平行),则方程组无解;
  • 若三个平面相交于一条直线,则方程组有无穷多解。

下图展示了该三元方程组行图像的几何直观(三个平面的相交关系):

img

注:G. Strang 在授课中曾提及自身作图局限性,其教材中通过“两平面交线与第三平面相交”的分步图示展示解的存在性;而 D.C.Lay 的教材则通过单张图更简洁地呈现了三维平面的相交关系。

4.2 三元方程组的列图像

将系数矩阵按列分解,三元方程组的列图像形式为列向量的线性组合:
x⋅[126]+y⋅[25−3]+z⋅[321]=[642]x \cdot \begin{bmatrix} 1 \\ 2 \\ 6 \end{bmatrix} + y \cdot \begin{bmatrix} 2 \\ 5 \\ -3 \end{bmatrix} + z \cdot \begin{bmatrix} 3 \\ 2 \\ 1 \end{bmatrix} = \begin{bmatrix} 6 \\ 4 \\ 2 \end{bmatrix} x126+y253+z321=642
其几何意义为:寻找标量 x,y,zx, y, zx,y,z,使得三个列向量分别数乘后相加得到 b\boldsymbol{b}b。下图为该线性组合的几何示意图:

img

4.3 方程组解的存在性问题

对于三元方程组 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b,一个核心问题是:是否对所有的 b\boldsymbol{b}b,方程组均有解?

从列图像角度,该问题等价于:系数矩阵 A\boldsymbol{A}A 的列向量的线性组合是否能覆盖整个三维空间?

  • 若三个列向量“线性无关”(即不存在一个列向量可由另外两个列向量线性表示),则其线性组合可覆盖整个三维空间,对任意 b\boldsymbol{b}b,方程组均有解;
  • 若三个列向量“线性相关”(如列 3 = 列 1 + 列 2),则所有列向量共面,其线性组合仅能覆盖该平面。若 b\boldsymbol{b}b 不在此平面内,方程组无解。此时矩阵 A\boldsymbol{A}A 称为奇异矩阵(Singular Matrix)不可逆矩阵(Non-invertible Matrix)

下图对比了 G. Strang 与 D.C.Lay 教材中对三元方程组行图像(平面相交关系)的作图差异:

img

5 矩阵与向量的乘法规则

矩阵与向量的乘法 Ax\boldsymbol{A}\boldsymbol{x}Ax 有两种等价的计算方式,分别对应列图像与行图像的思想。

5.1 基于列向量线性组合的计算(列图像视角)

将矩阵 A\boldsymbol{A}A 按列分解为列向量,Ax\boldsymbol{A}\boldsymbol{x}Ax 即为列向量的线性组合。以矩阵 A=[2513]\boldsymbol{A} = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix}A=[2153] 与向量 x=[12]\boldsymbol{x} = \begin{bmatrix} 1 \\ 2 \end{bmatrix}x=[12] 为例:
Ax=[2513][12]=1⋅[21]+2⋅[53]=[2+101+6]=[127]\boldsymbol{A}\boldsymbol{x} = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} 1 \\ 2 \end{bmatrix} = 1 \cdot \begin{bmatrix} 2 \\ 1 \end{bmatrix} + 2 \cdot \begin{bmatrix} 5 \\ 3 \end{bmatrix} = \begin{bmatrix} 2 + 10 \\ 1 + 6 \end{bmatrix} = \begin{bmatrix} 12 \\ 7 \end{bmatrix} Ax=[2153][12]=1[21]+2[53]=[2+101+6]=[127]

5.2 基于行向量点积的计算(行图像视角)

将矩阵 A\boldsymbol{A}A 的每一行视为行向量,Ax\boldsymbol{A}\boldsymbol{x}Ax 的每个分量为对应行向量与 x\boldsymbol{x}x 的点积。仍以上述矩阵与向量为例:
Ax=[2513][12]=[(2⋅1+5⋅2)(1⋅1+3⋅2)]=[2+101+6]=[127]\boldsymbol{A}\boldsymbol{x} = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} 1 \\ 2 \end{bmatrix} = \begin{bmatrix} (2 \cdot 1 + 5 \cdot 2) \\ (1 \cdot 1 + 3 \cdot 2) \end{bmatrix} = \begin{bmatrix} 2 + 10 \\ 1 + 6 \end{bmatrix} = \begin{bmatrix} 12 \\ 7 \end{bmatrix} Ax=[2153][12]=[(21+52)(11+32)]=[2+101+6]=[127]

两种计算方式的结果完全一致,分别从列图像(线性组合)与行图像(点积)的角度诠释了矩阵与向量乘法的本质。


矩阵的几何意义:行图像与列图像的系统解析

孙梓轩 编辑于 2025-08-08 10:10・美国

1. 行空间的几何意义与方程组解的关联

线性方程组的行图像,本质是将方程组中每个方程对应为其所在维度空间中的“解空间”,方程组的解即为所有解空间的交集。以下从二维情形出发,逐步剖析行图像的几何特征与方程组可解性的关系。

1.1 二元一次方程组的行图像示例(有解情形)

以二元一次方程组为例:
{x+2y=52x+3y=7\begin{cases} x + 2y = 5 \\ 2x + 3y = 7 \end{cases} {x+2y=52x+3y=7
该方程组中,每个方程对应 2 维空间(R2\mathbb{R}^2R2 中的一条直线:

  • 方程 x+2y=5x + 2y = 5x+2y=5 的解空间是一条斜率为 −12-\frac{1}{2}21 的直线;
  • 方程 2x+3y=72x + 3y = 72x+3y=7 的解空间是一条斜率为 −23-\frac{2}{3}32 的直线。

两条直线的交点即为方程组的解(x=−1,y=3x = -1, y = 3x=1,y=3)。从几何上看,只要不同方程对应的直线不平行,就存在唯一交点,方程组有唯一解。

需注意:直线在空间中沿其延伸方向无限延展,并非局限于有限坐标范围(如 x∈[−10,10],y∈[−10,10]x \in [-10,10], y\in [-10,10]x[10,10],y[10,10]),因此解的存在性仅由直线的相对位置决定,与坐标范围无关。

二元方程组有解的行图像

1.2 二元一次方程组的行图像示例(无解情形)

考虑无解的二元一次方程组:
{x+2y=52x+4y=7\begin{cases} x + 2y = 5 \\ 2x + 4y = 7 \end{cases} {x+2y=52x+4y=7
其对应的行图像为两条平行直线(斜率均为 −12-\frac{1}{2}21),无任何交点,因此方程组无解。

从系数角度分析:两条直线平行的充要条件是“方程中未知数系数成比例,且常数项不成比例”。具体表现为系数矩阵的两行成比例——设系数矩阵 A=[a1b1a2b2]\boldsymbol{A} = \begin{bmatrix} a_1 & b_1 \\ a_2 & b_2 \end{bmatrix}A=[a1a2b1b2],则 a1a2=b1b2≠c1c2\frac{a_1}{a_2} = \frac{b_1}{b_2} \neq \frac{c_1}{c_2}a2a1=b2b1=c2c1($ c_1, c_2 $ 为常数项)。

二元方程组无解的行图像

1.3 二元一次方程组的行图像示例(无穷多解情形)

若方程组满足“系数成比例且常数项成比例”,则对应的直线完全重合,解空间为整条直线,方程组有无穷多解。例如:
{x+2y=52x+4y=10\begin{cases} x + 2y = 5 \\ 2x + 4y = 10 \end{cases} {x+2y=52x+4y=10
系数矩阵 A=[1224]\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 4 \end{bmatrix}A=[1224] 的两行成比例(第二行是第一行的 2 倍),且常数项 555101010 也成 2 倍比例,因此两条直线完全重合,所有满足 x+2y=5x + 2y = 5x+2y=5(x,y)(x,y)(x,y) 均为解。

二元方程组无穷多解的行图像

1.4 行向量的线性相关性与方程组可解性

将系数矩阵 A\boldsymbol{A}A 的每一行视为一个 行向量(如上述示例中,r1=[12],r2=[24]\boldsymbol{r}_1 = \begin{bmatrix} 1 & 2 \end{bmatrix}, \boldsymbol{r}_2 = \begin{bmatrix} 2 & 4 \end{bmatrix}r1=[12],r2=[24]),则:

  • 若存在非零常数 kkk,使得 ri=k⋅rj\boldsymbol{r}_i = k \cdot \boldsymbol{r}_jri=krji≠ji \neq ji=j),则称这两个行向量 线性相关
  • 若不存在这样的 kkk,则称行向量 线性无关

结合行图像的几何意义,可得出核心结论:

  1. 若系数矩阵 A\boldsymbol{A}A 的行向量 全部线性无关,则方程组 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 必有解(且解唯一,二维情形下直线不平行、不重合);
  2. 若存在线性相关的行向量,则方程组可能无解(系数成比例但常数项不成比例),也可能有无穷多解(系数与常数项均成比例)——线性相关是“方程组无解或无穷多解”的必要非充分条件。

1.5 高维情形的行图像推广

行图像的逻辑可自然推广至高维方程组:

  • 三元一次方程(3 个未知数)对应的解空间是 3 维空间(R3\mathbb{R}^3R3 中的一个平面;
  • 四元一次方程对应的解空间是 4 维空间(R4\mathbb{R}^4R4 中的一个“超平面”(无法直观作图,但可通过维度逻辑分析)。

高维方程组的解即为所有超平面(或平面)的交集:交集为一点则有唯一解,交集为一条直线/平面则有无穷多解,无交集则无解。

2. 列空间的几何意义与矩阵乘法的本质

列空间的核心是从“列向量线性组合”的视角理解矩阵乘法 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b,即将 Ax\boldsymbol{A}\boldsymbol{x}Ax 视为系数矩阵 A\boldsymbol{A}A 的列向量按 x\boldsymbol{x}x 的分量进行线性组合,最终得到 b\boldsymbol{b}b

2.1 矩阵乘法的两种计算视角

对于矩阵乘法 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b(其中 A∈Rm×n,x∈Rn×1,b∈Rm×1\boldsymbol{A} \in \mathbb{R}^{m \times n}, \boldsymbol{x} \in \mathbb{R}^{n \times 1}, \boldsymbol{b} \in \mathbb{R}^{m \times 1}ARm×n,xRn×1,bRm×1),存在两种等价的计算逻辑:

(1)行视角:行向量与列向量的点积

A\boldsymbol{A}A 的每一行视为行向量,与 x\boldsymbol{x}x(列向量)做点积,结果即为 b\boldsymbol{b}b 的对应分量。其通用公式为:
bi=∑k=1nAik⋅xk(i=1,2,…,m)b_i = \sum_{k=1}^n A_{ik} \cdot x_k \quad (i = 1,2,\dots,m) bi=k=1nAikxk(i=1,2,,m)
例如,对于 A=[1223],x=[xy]\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix}, \boldsymbol{x} = \begin{bmatrix} x \\ y \end{bmatrix}A=[1223],x=[xy],则:
b1=[12]⋅[xy]=x+2y,b2=[23]⋅[xy]=2x+3yb_1 = \begin{bmatrix} 1 & 2 \end{bmatrix} \cdot \begin{bmatrix} x \\ y \end{bmatrix} = x + 2y, \quad b_2 = \begin{bmatrix} 2 & 3 \end{bmatrix} \cdot \begin{bmatrix} x \\ y \end{bmatrix} = 2x + 3y b1=[12][xy]=x+2y,b2=[23][xy]=2x+3y

(2)列视角:列向量的线性组合

A\boldsymbol{A}A 的每一列视为列向量,以 x\boldsymbol{x}x 的分量为系数,对列向量进行线性组合,结果即为 b\boldsymbol{b}b。形式化表示为:
Ax=x1⋅a1+x2⋅a2+⋯+xn⋅an=b\boldsymbol{A}\boldsymbol{x} = x_1 \cdot \boldsymbol{a}_1 + x_2 \cdot \boldsymbol{a}_2 + \dots + x_n \cdot \boldsymbol{a}_n = \boldsymbol{b} Ax=x1a1+x2a2++xnan=b
其中 ak=[A1kA2k⋮Amk]\boldsymbol{a}_k = \begin{bmatrix} A_{1k} \\ A_{2k} \\ \vdots \\ A_{mk} \end{bmatrix}ak=A1kA2kAmkA\boldsymbol{A}A 的第 kkk 列列向量),xkx_kxkx\boldsymbol{x}x 的第 kkk 个分量。

A=[1223],x=[−13]\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix}, \boldsymbol{x} = \begin{bmatrix} -1 \\ 3 \end{bmatrix}A=[1223],x=[13] 为例:
Ax=(−1)⋅[12]+3⋅[23]=[−1+6−2+9]=[57]=b\boldsymbol{A}\boldsymbol{x} = (-1) \cdot \begin{bmatrix} 1 \\ 2 \end{bmatrix} + 3 \cdot \begin{bmatrix} 2 \\ 3 \end{bmatrix} = \begin{bmatrix} -1 + 6 \\ -2 + 9 \end{bmatrix} = \begin{bmatrix} 5 \\ 7 \end{bmatrix} = \boldsymbol{b} Ax=(1)[12]+3[23]=[1+62+9]=[57]=b

2.2 列图像的几何直观:线性组合的可视化

列图像的本质是将“列向量线性组合得到 b\boldsymbol{b}b”的过程可视化。以上述示例为例,其几何意义如下:

  • 列向量 a1=[12]\boldsymbol{a}_1 = \begin{bmatrix} 1 \\ 2 \end{bmatrix}a1=[12](红色虚线向量)经数乘 −1-11 后,方向反向,得到 −1⋅a1=[−1−2]-1 \cdot \boldsymbol{a}_1 = \begin{bmatrix} -1 \\ -2 \end{bmatrix}1a1=[12](红色实线向量);
  • 列向量 a2=[23]\boldsymbol{a}_2 = \begin{bmatrix} 2 \\ 3 \end{bmatrix}a2=[23](蓝色向量)经数乘 333 后,长度伸展为原来的 3 倍,得到 3⋅a2=[69]3 \cdot \boldsymbol{a}_2 = \begin{bmatrix} 6 \\ 9 \end{bmatrix}3a2=[69]
  • 将两个数乘后的向量相加(遵循向量加法的“三角形法则”),最终得到 b=[57]\boldsymbol{b} = \begin{bmatrix} 5 \\ 7 \end{bmatrix}b=[57](绿色向量)。

列向量线性组合的几何图像

2.3 列向量的线性相关性与方程组可解性

列向量的线性相关性决定了“列向量线性组合能否覆盖整个目标空间”,进而决定方程组 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 是否有解。

(1)线性相关与线性无关的定义

对于 Rm\mathbb{R}^mRm 中的 nnn 个列向量 a1,a2,…,an\boldsymbol{a}_1, \boldsymbol{a}_2, \dots, \boldsymbol{a}_na1,a2,,an

  • 若存在不全为零的常数 k1,k2,…,knk_1, k_2, \dots, k_nk1,k2,,kn,使得 k1a1+k2a2+⋯+knan=0k_1\boldsymbol{a}_1 + k_2\boldsymbol{a}_2 + \dots + k_n\boldsymbol{a}_n = \boldsymbol{0}k1a1+k2a2++knan=0,则称这 nnn 个列向量 线性相关
  • 若仅当 k1=k2=⋯=kn=0k_1 = k_2 = \dots = k_n = 0k1=k2==kn=0 时上式成立,则称列向量 线性无关

几何上,二维空间中两个列向量线性相关等价于“两向量共线”(方向相同或相反);三维空间中三个列向量线性相关等价于“三向量共面”。

(2)列向量线性无关的充要条件与方程组可解性

核心结论:若系数矩阵 A\boldsymbol{A}A 的列向量 全部线性无关,则对任意 b∈Rm\boldsymbol{b} \in \mathbb{R}^mbRm,方程组 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 必有解。

原因如下:线性无关的列向量其线性组合可“充满”整个目标空间(如二维空间中,不共线的两个向量可组合出平面内所有向量;三维空间中,不共面的三个向量可组合出空间内所有向量)。因此,任意 b\boldsymbol{b}b 均可由这些列向量的线性组合表示,即存在对应的 x\boldsymbol{x}x 满足 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b

若列向量线性相关(如二维空间中两向量共线),则其线性组合仅能覆盖一条直线(无法充满整个平面):

  • b\boldsymbol{b}b 在这条直线上,则方程组有解(无穷多解);
  • b\boldsymbol{b}b 不在这条直线上,则方程组无解。

2.4 行向量与列向量线性相关性的一致性

对于任意矩阵 A\boldsymbol{A}A,其行向量的线性相关性与列向量的线性相关性具有 一致性

  • A\boldsymbol{A}A 的行向量全部线性无关,则其列向量也全部线性无关;
  • A\boldsymbol{A}A 存在线性相关的行向量,则其列向量也存在线性相关。

例如:

  • 矩阵 A=[1224]\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 4 \end{bmatrix}A=[1224] 的行向量线性相关(第二行是第一行的 2 倍),列向量也线性相关(第二列是第一列的 2 倍);
  • 矩阵 A=[1223]\boldsymbol{A} = \begin{bmatrix} 1 & 2 \\ 2 & 3 \end{bmatrix}A=[1223] 的行向量线性无关,列向量也线性无关。

这一一致性是后续“矩阵秩”概念的核心基础(矩阵的行秩等于列秩)。

3. 解空间的维度与自由度

方程组解空间的维度(如直线、平面)本质是“自由度”的体现——自由度即“确定解所需独立变量的个数”,解空间的维度等于自由度。

3.1 自由度与解空间维度的关系

以方程对应的解空间为例:

  • 二元一次方程 y=ax+by = ax + by=ax+b(或 ax+by+c=0ax + by + c = 0ax+by+c=0):确定解 (x,y)(x,y)(x,y) 时,只需任意指定 xxx 的值,即可唯一确定 yyy 的值,因此 自由度为 1,解空间为 1 维(直线);
  • 三元一次方程 z=ax+by+cz = ax + by + cz=ax+by+c(或 ax+by+cz+d=0ax + by + cz + d = 0ax+by+cz+d=0):确定解 (x,y,z)(x,y,z)(x,y,z) 时,需任意指定 xxxyyy 的值,即可唯一确定 zzz 的值,因此 自由度为 2,解空间为 2 维(平面);
  • nnn 元一次方程:自由度为 n−1n-1n1,解空间为 n−1n-1n1 维(超平面)。

本质上,方程的作用是“约束一个维度”,使原 nnn 维空间的解空间降维为 n−1n-1n1 维。
由上述方程可知,其中一个维度的取值(一个未知变量对应一个维度,如前文的 yyyzzz 可由其余两个维度的取值(对应未知变量)唯一确定。当其余两个维度对应的未知变量取值确定时,该维度的取值也随之确定,即此维度不具备自由度。

具体而言,前文两个方程中:

  • 二元一次方程的自由度为 1;
  • 三元一次方程的自由度为 2。

从空间维度与自由度的对应关系来看:

  • 二维空间的自由度为 2;
  • 三维空间的自由度为 3。

而上述方程对应的自由度(1 和 2)均低于其所在空间的自由度,因此方程的解空间发生维度退化(简称“降维”):

  • 二元一次方程的解空间退化为自由度为 1 的空间,几何形态表现为一条直线;
  • 三元一次方程的解空间退化为自由度为 2 的空间,几何形态表现为一个平面。

3.2 自由度与方程组解的个数

方程组解的个数由“所有方程约束后的总自由度”决定:

  • 若总自由度为 0(如两个不平行的二元一次方程,约束两个维度),则解空间为 0 维(一个点),方程组有唯一解;
  • 若总自由度为 k>0k > 0k>0(如两个重合的二元一次方程,仅约束一个维度),则解空间为 kkk 维(一条直线或平面),方程组有无穷多解;
  • 若方程之间存在矛盾(如两个平行的二元一次方程),则无满足所有约束的解,方程组无解。

4. 最后

本文通过行图像与列图像的双视角,揭示了矩阵的几何意义与方程组可解性的核心逻辑,关键结论可概括为:

  1. 行图像:方程组的解是各方程对应解空间(直线、平面或超平面)的交集,解的存在性由行向量的线性相关性决定;
  2. 列图像:矩阵乘法 Ax=b\boldsymbol{A}\boldsymbol{x} = \boldsymbol{b}Ax=b 是列向量的线性组合,解的存在性由列向量的线性相关性决定;
  3. 一致性:矩阵的行向量与列向量线性相关性一致,这是“矩阵秩”的核心属性。

上述提到的方程组是否一定有解、维度、矩阵的秩(rank,反映线性无关向量的最大个数)以及矩阵是否可逆(方程组有唯一解的特殊情形),都是有相关性的。


via:

  • MIT线性代数笔记一 行图像和列图像_为什么行图和列图维度不一样-CSDN博客
    https://blog.csdn.net/herosunly/article/details/88698381

    • ref
      1. Gilbert Strang. Introduction to Linear Algebra (5th Edition). Wellesley-Cambridge Press.
      2. David C. Lay. Linear Algebra and Its Applications (5th Edition). Pearson.
      3. deep learning - Hung-yi Lee
        https://speech.ee.ntu.edu.tw/~tlkagk/courses_ML19.html
      4. 麻省理工 线性代数 (MIT 18.06, Linear Algebra, Gilbert Strang)【中英】_bilibili
        https://www.bilibili.com/video/av34573725/
      5. 哈尔滨工业大学 矩阵分析 全72讲 主讲-严质彬 视频教程_bilibili
        https://www.bilibili.com/video/av11355346/
  • MIT—线性代数笔记01 行图像和列图像 - 知乎
    https://zhuanlan.zhihu.com/p/45708880

  • 矩阵的几何意义(行图像和列图像) - 知乎
    https://zhuanlan.zhihu.com/p/618370114

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/95974.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/95974.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Batch Normalization:深度学习中的“加速器”与“稳定器”

在深度学习的世界里,神经网络的训练常常充满了挑战。从复杂的梯度问题到漫长的收敛过程,每一个环节都可能成为阻碍我们前进的绊脚石。而今天,我们要深入探讨的 BatchNormalizationBatch NormalizationBatchNormalization(批量归一…

软考备考①

一、数值及其转换和数据的表示1、数值及其转换①任意进制到十进制以二进制为例,以小数点做分割,小数点以左从二的零次方开始,小数点以右从二的负一次方开始。②十进制到任意进制利用短除法③二进制到十六进制分为小数点前和小数点后&#xff…

小程序缓存数据字典

import { getDict } from /api/profile;const CACHE_KEY DICT_CACHE;let dictCache new Map();// 初始化时加载缓存const loadCache () > {const cache uni.getStorageSync(CACHE_KEY);if (cache) {dictCache new Map(JSON.parse(cache));}};// 保存缓存到Storageconst…

Java对象在内存中的布局详解

1、Java 对象内存布局(HotSpot 虚拟机)在 ​HotSpot 虚拟机​ 中,一个 Java 对象在堆内存中的存储布局可以分为以下几个部分:1、对象头(Object Header)​对象头是对象内存布局中最重要的部分之一&#xff0…

钾元素:从基础认知到多元应用与前沿探索

一、钾元素的基础认知1.1 钾元素的发现历程在人类历史的长河中,钾的化合物早早就进入了人们的视野,并在生活和生产中得到了应用。古代时期,人们就知晓草木灰里含有钾草碱,即碳酸钾 。在日常的洗涤活动中,碳酸钾发挥了重…

JAiRouter 配置文件重构纪实 ——基于单一职责原则的模块化拆分与内聚性提升

JAiRouter 配置文件重构纪实 ——基于单一职责原则的模块化拆分与内聚性提升 文章目录JAiRouter 配置文件重构纪实 ——基于单一职责原则的模块化拆分与内聚性提升一、背景:单体 YAML 的“熵增”困境二、重构策略:高内聚、低耦合的模块化方案2.1 拆分原则…

惊!printf 不往屏幕输?都是 fd 在搞鬼!爆肝拆解 Linux 文件描述符 + 重定向底层,学会直接在终端横着走

文 章 目 录一、文 件1、基 础 知 识2、C 文 件 接 口(1)代 码 示 例(2)当 前 路 径(3)文 件 权 限(4)w(5)a(6)三 个 输 入 输 出 流3…

【高分论文密码】大尺度空间模拟与不确定性分析及数字制图技术应用

大尺度模拟技术能够从不同的时空尺度揭示农业生态环境领域的内在机理和时空变化规律,为复杂过程模型的模拟提供技术基础。一:R语言空间数据及数据挖掘关键技术1、R语言空间数据讲解及应用特点 1)R语言基础与数据科学 2)R空间矢量数据 3)R栅格数据2、R语言…

Git 工作流与分支管理实战:rebase vs merge 对比、冲突解决、规范 Commit Message 与主干稳定性最佳实践

1. 版本控制与协作流程(Git 工作流、分支管理、合并冲突) 虽然 Git 用得多,但“rebase vs. merge”、如何解决冲突、如何编写规范的 commit message、如何维护主干的稳定性,都需要一段时间才能形成体系化的理解。 摘要 在日常团队…

调试 cuda kernel

调试 CUDA Kernel 并进入 __device__ 函数是 CUDA 开发中一项非常重要的技能。这主要依赖于 NVIDIA 的官方调试器 NVIDIA Nsight Systems (用于系统级分析) 和 NVIDIA Nsight Compute (用于内核级分析) 以及经典的 cuda-gdb (命令行调试器)。 这里将重点介绍两种最常用和强大的…

GD32自学笔记:4.ADC

while(1)里测试ADC是否正常首先,ADC引脚说明如下:ADC 通道引脚描述ADC_CHANNEL_0PA0端口 A 的引脚 0,可用于模拟信号输入,如传感器或外部电压。ADC_CHANNEL_1PA1端口 A 的引脚 1,常用于模拟输入,适用于一般…

渐变背景色和渐变字体颜色的实现方法

一、渐变背景色&#xff08;Gradient Background&#xff09;1. 线性渐变&#xff08;Linear Gradient&#xff09;通过 linear-gradient 创建从一种颜色到另一种颜色的线性渐变。代码示例<div class"linear-gradient"></div><style> .linear-grad…

Wi-Fi技术——传播与损耗

一、频段和信道 Wi-Fi通过发射无线电进行传输&#xff0c;而无线电的一个重要特性是频率。 频段&#xff1a;一个大的频率范围&#xff0c;如Wi-Fi工作在2.4GHz、5GHz、6GHz&#xff0c;其并不是一个值&#xff0c;而是一个范围信道&#xff1a;在每个频段中划分小的频率范围…

【Mysql-installer-community-8.0.26.0】Mysql 社区版(8.0.26.0) 在Window 系统的默认安装配置

ℹ️大家好&#xff0c;我是练小杰&#xff0c;好久不见了&#xff0c;周末愉快&#xff0c;今天周六了&#xff01;&#xff01;做了CSDN博客才发现&#xff0c;坚持不断发文是那么的困难&#xff0c;大家都是好样的&#xff01;&#xff01;&#x1f606; 本文是针对 Mysql 的…

【RabbitMQ】----初识 RabbitMQ

1. MQ 是什么&#xff1f; 在互联网中&#xff0c;会经常使用 MQ 来作为消息通信服务&#xff0c;我们一起来看一下什么是 MQ 吧&#xff01; 1.1 MQ 本质 【MQ】&#xff08;Message queue&#xff09;&#xff0c;消息队列&#xff0c;字面意思来看&#xff0c;本质是一个…

深度学习:归一化技术

在深度学习中&#xff0c;归一化技术是提高模型训练效率和性能的重要手段。归一化通过调整输入数据的分布&#xff0c;使得模型在训练过程中更易于收敛&#xff0c;减少过拟合的风险。本文将介绍几种常见的归一化技术&#xff0c;包括特征归一化、批归一化、层归一化和实例归一…

【Javaweb学习|实训总结|Week1】html基础,CSS(选择器、常用样式、盒子模型、弹性盒布局、CSS定位、动画),js(基本类型、运算符典例)

开学前三周先进行企业实训&#xff0c;主要学习Javaweb并实现一些小的项目&#xff0c;本篇笔记主要记录第一周实训的知识总结以及个人遇到的问题及解答&#xff0c;用于日后复习回顾和知识巩固&#xff0c;希望可以帮到同样在学Javaweb的大家 文章目录D1html基础D2块元素与行…

SQL 拓展指南:不同数据库差异对比(MySQL/Oracle/SQL Server 基础区别)

在学习 SQL 的过程中&#xff0c;你可能会发现&#xff1a;同样的 “建表语句” 在 MySQL 能运行&#xff0c;在 Oracle 却报错&#xff1b;“分页查询” 的写法在 SQL Server 和 MySQL 完全不同。这是因为 MySQL、Oracle、SQL Server 是三大主流关系型数据库&#xff0c;虽都支…

论文阅读:DMD | Improved Distribution Matching Distillation for Fast Image Synthesis

论文地址&#xff1a;https://arxiv.org/abs/2405.14867 项目官网&#xff1a;https://tianweiy.github.io/dmd2/ 代码地址&#xff1a;https://github.com/tianweiy/DMD2 发表时间&#xff1a;2024年5月24日 分布匹配蒸馏&#xff08;DMD&#xff09;生成的一步生成器能够与教…

嵌入式 Linux 启动流程详解 (以 ARM + U-Boot 为例)

嵌入式 Linux 启动流程详解 (以 ARM U-Boot 为例) 对于嵌入式开发者而言&#xff0c;深入理解系统的启动流程至关重要。这不仅有助于进行底层驱动开发和系统移植&#xff0c;还能在遇到启动失败等问题时&#xff0c;快速定位和解决。本文将详细分解基于 ARM 架构的嵌入式 Linu…