机器学习与深度学习18-线性代数01

目录

    • 前文回顾
    • 1.特征向量和特征值
    • 2.矩阵与模型
    • 3.内积和外积
    • 4.向量的范数
    • 5.正交矩阵

前文回顾

上一篇文章地址:链接

1.特征向量和特征值

在机器学习中,特征向量和特征值是用于描述数据集中的特征或变量之间关系的重要概念。它们在降维技术(如主成分分析)中起到关键作用,特征向量是一个非零向量,其方向在线性变换下保持不变,只发生缩放。它表示了数据变换后的新坐标系下的方向。特征值是与特征向量相关联的数值,表示特征向量在对应的线性变换下的缩放因子。在降维中,我们可以使用特征向量和特征值来找到数据集中最显著的特征,并将数据投影到这些特征上以减少维度。以下是计算特征向量和特征值的常用步骤为
假设我们有一个 m × n m \times n m×n的数据矩阵 X X X,其中每行代表一个样本,每列代表一个特征。

  1. 计算数据矩阵 X X X的协方差矩阵 C C C
    C = 1 m − 1 ( X − X ˉ ) T ( X − X ˉ ) C = \frac{1}{m - 1}(X - \bar{X})^T (X - \bar{X}) C=m11(XXˉ)T(XXˉ)
    其中 X ˉ \bar{X} Xˉ是每个特征的均值
  2. 对协方差矩阵 C C C进行特征值分解:
    C = V Λ V T C = V\Lambda V^T C=VΛVT
    其中 V V V是特征向量组成的矩阵, Λ \Lambda Λ是由特征值组成的对角矩阵
  3. 对特征值进行排序,从最大到最小,同时对应调整特征向量的顺序
  4. 选择前 k k k个最大的特征值及其对应的特征向量,这些特征向量构成了降维后的新坐标系
  5. 将数据 X X X投影到新的坐标系中,得到降维后的数据矩阵 Y = X V reduced Y = XV_{\text{reduced}} Y=XVreduced
    其中 V reduced V_{\text{reduced}} Vreduced是由前 k k k个特征向量组成的子矩阵

通过上述步骤,我们可以获得降维后的数据矩阵 Y Y Y,其列数减少为 k k k。这样可以减少冗余信息并保留数据的最重要方面,同时也能够加速机器学习算法的训练和提高模型的性能

2.矩阵与模型

在 linear regression 中,我们可以使用矩阵表示模型,其中特征矩阵(输入)和目标向量(输出)之间的线性关系可以用以下公式表示:

y = X w \mathbf{y} = \mathbf{Xw} y=Xw

其中, y \mathbf{y} y 是一个大小为 m × 1 m \times 1 m×1 的列向量,表示目标变量; X \mathbf{X} X 是一个大小为 m × ( n + 1 ) m \times (n + 1) m×(n+1) 的特征矩阵,每行代表一个样本,包含 n n n 个特征以及一列全为 1 的常数列,用于表示截距项; w \mathbf{w} w 是一个大小为 ( n + 1 ) × 1 (n + 1) \times 1 (n+1)×1 的列向量,表示模型的参数(权重和截距),在 linear regression 中,我们的目标是找到最优的参数向量 w \mathbf{w} w,使得预测值 y ^ \hat{\mathbf{y}} y^ 与实际值 y \mathbf{y} y 之间的差异最小化。这通常通过最小化损失函数来实现。损失函数通常使用平方误差(Sum of Squared Errors, SSE)来度量预测误差的总和。它可以用以下公式表示:
L ( w ) = 1 2 m ( y − X w ) T ( y − X w ) L(\mathbf{w}) = \frac{1}{2m} (\mathbf{y} - \mathbf{Xw})^T (\mathbf{y} - \mathbf{Xw}) L(w)=2m1(yXw)T(yXw)
其中, L ( w ) L(\mathbf{w}) L(w) 表示损失函数, 1 2 m \frac{1}{2m} 2m1 是一个常数因子,用于简化计算。

通过最小化损失函数,即求解以下优化问题:

min ⁡ w L ( w ) \min_{\mathbf{w}} L(\mathbf{w}) wminL(w)

我们可以使用 linear algebra 中的方法来找到最优的参数解。通过对损失函数关于参数向量 w \mathbf{w} w 的梯度进行求解和令其为零,可以得到闭式解或者使用优化算法(如梯度下降)进行迭代求解,通过 linear algebra 的技术和求解方法,在 linear regression 中,我们可以更有效地拟合模型并找到最优的参数,以最小化预测误差

3.内积和外积

  • 内积(点积):给定两个向量 a \boldsymbol{a} a b \boldsymbol{b} b,它们的内积表示为 a ⋅ b \boldsymbol{a} \cdot \boldsymbol{b} ab。内积的计算方法是将两个向量对应位置上的元素相乘,并将乘积相加得到一个标量。内积满足交换律和分配律,并且可以通过向量的长度和夹角的余弦来计算:
    a ⋅ b = ∣ a ∣ ∣ b ∣ cos ⁡ ( θ ) \boldsymbol{a} \cdot \boldsymbol{b} = \vert\boldsymbol{a}\vert \vert\boldsymbol{b}\vert \cos(\theta) ab=a∣∣bcos(θ)
    其中 ∣ a ∣ \vert\boldsymbol{a}\vert a ∣ b ∣ \vert\boldsymbol{b}\vert b分别代表向量 a \boldsymbol{a} a b \boldsymbol{b} b的长度, θ \theta θ是两个向量之间的夹角

  • 外积(叉积):给定两个三维向量 a \boldsymbol{a} a b \boldsymbol{b} b,它们的外积表示为 a × b \boldsymbol{a} \times \boldsymbol{b} a×b。外积的结果是一个新的向量,其方向垂直于原始向量所在的平面,并且大小等于该平面的面积与两个向量长度的乘积。外积只适用于三维向量

在机器学习中,内积具有多种常见应用:

  • 相似度度量:内积可以用来计算向量之间的相似度或相关性。例如,在推荐系统中,可以使用内积来计算用户之间的相似度,以便为用户提供个性化的推荐
  • 特征之间的交互:在特征工程中,我们可以使用内积来表示两个特征之间的交互作用。例如,在多项式回归中,可以将高阶特征表示为原始特征的内积
  • 核方法:在支持向量机(SVM)等机器学习算法中,内积扮演着关键角色。通过选择合适的核函数,我们可以基于内积来进行非线性分类,将数据映射到更高维的特征空间中

总而言之,内积在机器学习中具有广泛的应用,包括相似度度量、特征交互和核方法等。它是许多机器学习算法中重要的数学概念和操作

4.向量的范数

向量的范数是一种用于衡量向量大小或长度的函数。在机器学习中,我们通常使用L1范数和L2范数进行正则化来控制模型的复杂度。L1范数(也称为曼哈顿范数或稀疏范数)定义为向量中各个元素的绝对值之和。对于一个n维向量 x = ( x 1 , x 2 , … , x n ) \boldsymbol{x} = (x_1, x_2, \ldots, x_n) x=(x1,x2,,xn),它的L1范数表示为:

∥ x ∥ 1 = ∣ x 1 ∣ + ∣ x 2 ∣ + … + ∣ x n ∣ \|\boldsymbol{x}\|_1 = |x_1| + |x_2| + \ldots + |x_n| x1=x1+x2++xn

在正则化中,L1范数可以促使模型参数稀疏化,即将一些参数的值设为零。因此,通过在损失函数中加上L1范数的惩罚项,可以倾向于产生更稀疏的模型,有助于特征选择和降低过拟合的风险。L2范数(也称为欧几里得范数或岭回归的惩罚项)定义为向量各个元素的平方和的平方根。对于一个n维向量 x = ( x 1 , x 2 , … , x n ) \boldsymbol{x} = (x_1, x_2, \ldots, x_n) x=(x1,x2,,xn),它的L2范数表示为:

∥ x ∥ 2 = x 1 2 + x 2 2 + … + x n 2 \|\boldsymbol{x}\|_2 = \sqrt{x_1^2 + x_2^2 + \ldots + x_n^2} x2=x12+x22++xn2

在正则化中,L2范数可以控制模型的权重衰减,使得参数的值趋向于较小的值。通过在损失函数中加上L2范数的惩罚项,可以防止模型过拟合,并促使模型参数分布在更集中的区域,有助于提高模型的泛化能力。总结起来,L1范数在正则化中促使模型参数稀疏化,而L2范数则控制参数的大小并减少参数之间的相关性,从而帮助避免过拟合。根据问题的不同,选择适当的范数进行正则化可以改善模型的性能和泛化能力

5.正交矩阵

正交矩阵是一个方阵,其列向量(或行向量)彼此正交(垂直),并且每个向量的长度为1。换句话说,正交矩阵的转置矩阵等于其逆矩阵。给定一个 n × n n \times n n×n的矩阵 Q \boldsymbol{Q} Q,如果满足以下条件,则称其为正交矩阵(其中 I \boldsymbol{I} I是单位矩阵):
Q T Q = Q Q T = I \boldsymbol{Q}^T \boldsymbol{Q} = \boldsymbol{Q} \boldsymbol{Q}^T = \boldsymbol{I} QTQ=QQT=I
在旋转和变换中,正交矩阵发挥重要作用。由于正交矩阵的特性,它们保持向量的长度不变,并保持向量之间的夹角不变。具体来说,正交矩阵可以在几何上表示旋转、镜像和反射等线性变换。

应用:

  • 旋转变换:正交矩阵可以通过乘以一个向量来实现旋转操作。通过将向量乘以旋转矩阵,我们可以将向量绕原点旋转到新的位置,而不改变向量的长度- 坐标系变换:正交矩阵可以用于坐标系之间的变换。通过乘以一个正交矩阵,我们可以将一个坐标系中的向量映射到另一个坐标系中
  • 正交化:正交矩阵还可以用于将一组线性无关的向量正交化。通过对向量组成的矩阵进行正交分解,我们可以得到一个正交矩阵和一个对角矩阵,从而使得向量之间相互正交
  • 傅里叶变换:在信号处理中,正交矩阵(如傅里叶矩阵)用于将信号从时域转换到频域。傅里叶变换是一种正交变换,它将信号分解为一组正交基函数

总结来说,正交矩阵在旋转和变换中具有重要的应用。它们保持向量的长度和夹角不变,可用于实现旋转、镜像、反射等几何操作,并且在信号处理中起着关键作用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84911.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何让 VS Code 仅通过滚轮放大字体,而不缩放整个界面?

在 VS Code 中,默认情况下使用 Ctrl滚轮(Windows/Linux)或 Cmd滚轮(Mac)会同时缩放整个界面(包括 UI 元素和编辑器字体)。如果你希望仅放大编辑器字体而不影响界面缩放,可以通过以下…

Vue3中v-bind指令用法详解

在 Vue 3 中&#xff0c;v-bind 是一个核心指令&#xff0c;用于动态绑定 HTML 属性或组件的 props 到 Vue 实例的数据。以下是详细讲解&#xff1a; 一、基础用法 1. 绑定单个属性 vue 复制 下载 <template><!-- 绑定 img 的 src 属性 --><img v-bind:src…

算法题(169):最大子段和(分治思想)

审题&#xff1a; 本题需要我们找到区间的最大子段和并输出结果 思路&#xff1a; 方法一&#xff1a;分治思想 我们可以把给定区间平均分成两部分&#xff0c;然后获取左段区间的最大子段和&#xff0c;右段区间的最大子段和&#xff0c;以及跨区间的最大子段和。最后比较出他…

Linux 线程深度解析:从内存管理到线程控制的核心机制

文章目录 引言一、Linux 线程概念1.1 什么是线程1.2 分页式存储管理1.2.1 虚拟地址和页表的由来1.2.2 物理内存管理struct page 的主要用途 1.2.3 页表1.2.4 页目录结构1.2.5 两级页表的地址转换1.2.6 缺页异常 1.3 线程的优点1.4 线程缺点1.5 线程异常1.6 线程用途 二、Linux进…

玩转计算机视觉——按照配置部署paddleOCR(英伟达环境与昇腾300IDUO环境)

英伟达环境安装 创建虚拟环境 conda create -n paddleOCR python3.10 -y conda activate paddleOCRconda install jupyterlab -y conda install ipykernel -y python -m ipykernel install --user --name paddleOCR --display-name "paddle OCR"下载PaddleOCR的GPU…

Java机器学习全攻略:从基础原理到实战案例详解

在当今AI驱动的技术浪潮中,机器学习已成为Java开发者必须掌握的核心技能之一。本文将系统性地介绍Java机器学习的原理基础、常用框架,并通过多个实战案例展示如何在实际项目中应用这些技术。无论你是刚接触机器学习的Java开发者,还是希望巩固基础的中级工程师,这篇文章都将…

eBPF 技术详解及其在网络安全领域的应用与挑战

摘要 eBPF&#xff08;extended Berkeley Packet Filter&#xff09;是 Linux 内核中的一项革命性技术&#xff0c;它允许用户在不修改内核代码或加载内核模块的情况下&#xff0c;安全、高效地运行自定义程序。eBPF 的出现极大地扩展了 Linux 内核的可编程性&#xff0c;使其…

error:MISCONF Redis is configured to save RDB snapshots

一、背景 在使用redis异步驱动方式下&#xff0c;执行hset指令时&#xff0c;报错 redisAsyncCommand((redisAsyncContext *)c, dumpReply, "hset role:10001", "hset role:10001 name %s age %d sex %s", "mark", 31, "male");二、原…

Android-Mod-Menu 使用教程

目录 简介前提条件安装步骤1. 下载和解压项目2. 配置 Android Studio3. 安装到设备 修改游戏 APK1. 确定游戏主活动2. 集成模组菜单方法 1&#xff1a;通过服务启动&#xff08;推荐&#xff09;方法 2&#xff1a;通过活动启动&#xff08;仅在游戏检测模组时使用&#xff09;…

SpringBoot 自动化部署实战:从环境搭建到 CI/CD 全流程

SpringBoot 自动化部署全流程实战 一、环境准备&#xff08;开发侧&#xff09; 基础工具链安装&#xff1a; # JDK 17 brew install openjdk17 # Maven 构建工具 brew install maven # Docker 环境 brew install --cask docker项目配置验证&#xff1a; <!-- pom.xml 关…

Flutter动画与交互:打造流畅用户体验的完整指南

在移动应用开发中&#xff0c;流畅的动画和自然的交互是提升用户体验的关键因素。Flutter作为Google推出的跨平台UI工具包&#xff0c;提供了一套强大而灵活的动画系统&#xff0c;使开发者能够轻松创建专业级的动画效果。本文将深入探讨Flutter中的动画与交互技术&#xff0c;…

山东大学软件学院项目实训:基于大模型的模拟面试系统项目总结(九)

在山东大学软件学院的项目实训中&#xff0c;团队成员们围绕基于大模型的模拟面试系统展开了一系列开发与优化工作。以下是本周项目的核心进展与成果总结。 前端界面优化与 Bug 修复&#xff08;吴尤&#xff09; Logo 显示问题修复 在项目开发过程中&#xff0c;团队发现项…

14.vue.js的watch()的注意事项(1)

一、 Q &#xff1a;因为 state 有内部的属性 也就是id。 因为要追逐id。所以要写函数&#xff1f;而不能直接监听state。 只监听state &#xff0c;监听不到id的变化吗&#xff1f; A&#xff1a; 为什么监听 state 不等于监听 state.id&#xff1f; 在 Vue 3 中&#xff0…

强化学习入门:价值、回报、策略概念详解

前言 最近想开一个关于强化学习专栏&#xff0c;因为DeepSeek-R1很火&#xff0c;但本人对于LLM连门都没入。因此&#xff0c;只是记录一些类似的读书笔记&#xff0c;内容不深&#xff0c;大多数只是一些概念的东西&#xff0c;数学公式也不会太多&#xff0c;还望读者多多指教…

基于“数智立体化三维架构”框架的医疗数智化机制研究

1 研究背景与框架基础 当前,全球医疗服务体系正经历深刻的数智化转型浪潮,人工智能、大数据、云计算等新一代信息技术与医疗健康领域的融合不断深入,催生了医疗服务模式的革命性变化。在我国,数智化技术已成为提升基层卫生服务质量、促进医疗服务公平可及、增进百姓健康福…

OpenCV CUDA模块图像变形------对图像进行旋转操作函数rotate()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 该函数用于对图像进行 GPU 加速的旋转操作&#xff0c;支持指定旋转角度、缩放中心偏移和插值方法。是 OpenCV CUDA 模块中用于图像旋转的核心函…

【面板数据】中国与世界各国新能源汽车进出口数据-分类别与不分类别(2017-2024年)

新能源汽车作为中国制造高质量发展的重要代表&#xff0c;其进出口数据不仅反映了我国技术实力与产业格局的变化&#xff0c;也是理解全球绿色交通趋势、制定国家战略决策的重要依据。目前国内主流定义判断标准主要参考中国工信部于2009年发布的《新能源汽车生产企业及产品准入…

亚马逊云服务器(AWS)会限制用户使用吗?深度解读AWS资源政策

一、AWS的资源逻辑&#xff1a;为什么说"不限速"&#xff1f; AWS采用"按需分配"的资源配置模式&#xff0c;其核心限制并非来自人为设定&#xff0c;而是取决于&#xff1a; 实例类型配置&#xff08;如t2.micro默认CPU积分制&#xff09; 账户服务配额…

顶级视频生成大模型分析:Seedance 1.0 Pro (字节跳动) - 新晋榜首

&#x1f4d6; 目录 一、概述与市场格局 1.1 AI视频生成技术现状1.2 主要竞争者概览1.3 评测标准与方法 二、顶级模型详细分析 2.1 Seedance 1.0 Pro (字节跳动) - 新晋榜首2.2 OpenAI Sora - 行业先驱者2.3 Google Veo 3 - 音视频一体化领航者2.4 快手可灵 2.0 - 国产之光…

【Spring源码核心篇-08】spring中配置类底层原理和源码实现

Spring源码核心篇整体栏目 内容链接地址【一】Spring的bean的生命周期https://zhenghuisheng.blog.csdn.net/article/details/143441012【二】深入理解spring的依赖注入和属性填充https://zhenghuisheng.blog.csdn.net/article/details/143854482【三】精通spring的aop的底层原…