机器学习2-梯度下降与反向传播

损失函数 与 平均方差函数 傻傻分不清

损失函数是概念;平均方差函数是具体的实现

损失函数(如均方误差 MSE)用于衡量模型预测值与真实值之间的差距。损失越小,说明模型对当前数据的拟合越好。

但模型并非拟合度越高越好,假设模型输入它没见过的数据,模型预测的结果跟实际出入很大,不符合要求,这种现象叫过拟合;如果模型对新数据也有很好的预测效果,就是泛化能力强

后续。。。

 对于直线模型很简单,但是世界事物的规律是很复杂的不能通过直线模型来表达,更多是弯弯曲曲的曲线,要描述这样曲线 是通过  非线性函数 (激活函数) 嵌套线性函数,一层嵌套还是不能描述出这样复杂曲线,就需要n多层的这样嵌套函数,理论上能造出非常复杂的曲线(很抽象很难理解)

激活函数 :

梯度下降:

w = w - 学习率 × ∂L/∂w

卧槽! 这个公式是什么意思?其实  ∂L/∂w 是梯度,还是不懂,什么是梯度?回到二维平面,这个梯度等同与初中数学的斜率。这里抛物线描述的是直线模型的损失函数在变量w 方向上变化 。机器通过不断调整w值让损失函数最小,什么时候最小? 答:顶点最小,顶点怎么求?有顶点公式,也可以使用   导数 = 0 求出。

但是复杂模型的损失函数不是一条简单的抛物线,于是就有梯度下降算法,本质上是不断猜和试,但是不能盲猜,面多加水,水多加面,水和面不能一下加太多,就使用小勺子(学习率)慢慢调

如下图

 当切点在右边是正数,就减去一点点; 当切点在左边是负数数,负负得正加一点点。就这样一点点不断地试,总有w是某个值,让损失函数最小。

而 ∂L/∂w是高纬度的曲面的表面曲线求导,这里方便人的理解,高维我这里通常指3维,4维我们想象不出来!

下图是一座大山,是3维立体的,红线就是曲面上的某条曲线 ,像不像一个个阶梯,∂L/∂w 就好比下山某条曲线的陡峭程度,如果∂L/∂w的绝对值(包含正负数)越大 说明越陡峭!∂L/∂w如果是正数右倾斜,如果是负数表示左倾斜

∂L/∂w 那是多少怎么算?  这里是使用 链式法则(不展开讲,高数不过关,但这不影响我们理解,机器会就行)

总结一下:

W新 = W当前 - 学习率 × ∂L/∂w

这个是公式指导机器如何自己调整W值,当W猜测是3时,预测值与真实值误差大了,∂L/∂w就变大,那我猜测新的W 值,就需要减少一点∂L/∂w。∂L/∂w有时很大,就需要使用学习率进行缩放。回到下山例子就是,人下山既要快,就需要选择最陡峭的路线,但是不安全,就需要使用学习率控制,要快也要安全。

反向传播:在神经网络从后往前,使用损失函数指导修改预测函数参数的过程,就是反向传播

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86794.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86794.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安全生产风险管控平台:企业安全管理的智能化解决方案

在工业生产、建筑施工、能源化工等领域,安全生产是企业可持续发展的基石。然而,传统安全管理模式依赖人工巡检、纸质记录和事后处理,难以满足现代化企业的高效风险管控需求。安全生产风险管控平台应运而生,它利用物联网、大数据、…

如何保证数据库与 Redis 缓存的一致性?

在现代互联网应用中,Redis 缓存几乎是性能优化的标配。但在使用过程中,一个绕不过去的问题就是: 如何保证 Redis 缓存与数据库之间的数据一致性? 特别是在高并发场景下,读写操作错位可能导致缓存中出现脏数据&#xff…

现代 JavaScript (ES6+) 入门到实战(三):字符串与对象的魔法升级—模板字符串/结构赋值/展开运算符

在前两篇,我们升级了变量和函数。今天,我们要给 JavaScript 中最常用的两种数据类型——字符串(String)和对象(Object)——装备上 ES6 带来的强大魔法。 准备好告别丑陋的 号拼接和重复的对象属性赋值了吗…

GitLab 备份恢复与配置迁移详尽教程(实战版)

🛠 GitLab 备份恢复与配置迁移详尽教程(实战版) 🧱 一、环境准备 1.1 检查版本一致性 恢复目标机 GitLab 版本必须与备份文件所用版本一致或兼容(推荐相同版本) 查看当前 GitLab 版本: sudo g…

英飞凌高性能BMS解决方案助力汽车电动化

随着电动汽车越来越被大众接受,车辆电气化、智能化程度越来越高,如何提高电动汽车的续航里程,同时保障车辆安全可靠持久运行是当前最主要的技术难题之一。而先进的电池管理系统 (BMS)有助于克服电动汽车广泛普及的关键障碍:续航里…

react + ant-design实现数字对比动画效果:当新获取的数字比之前展示的数字多或少2时,显示“+2”或“-2”的动画效果

react ant-design实现数字对比动画效果:当新获取的数字比之前展示的数字多或少2时,显示“2”或“-2”的动画效果 1. 创建独立的 AnimatedValue 组件 // components/AnimatedValue/index.jsx import React, { useState, useEffect, useRef } from reac…

自动化测试--Appium和ADB及常用指令

1.Appium Appium工具库: appium server:服务器(类似于浏览器的驱动),核心进行客户端命令的接受,完成设备的自动化指令 appium client:客户端,让代码进行调用,发送自动化的…

2025.6.29总结

有一点我很好奇,工作后,我该拿什么去衡量自己的进步呢? 在我的大学四年,确实有个量化的标准,读了多少本书,写了多少篇总结,多少篇技术博客,多少行代码,运动了多少公里&a…

Docker 部署 Kong云原生API网关

Docker 部署 Kong云原生API网关 本指南提供了在 Docker Compose 上配置 Kong Gateway 的步骤,基于有数据库模式的配置。本指南中使用的数据库是 PostgreSQL。 前置条件 准备一台Ubuntu服务器: 节点IP: 192.168.73.11操作系统: Ubuntu 24…

深度剖析 Apache Pulsar:架构、优势与选型指南

Apache Pulsar 是一款云原生分布式消息流平台,融合了消息队列、流处理和存储能力,采用独特的“存储计算分离”架构(Broker 无状态 BookKeeper 持久化存储)。以下从核心特性、对比优势及适用场景展开分析: 一、Pulsar…

java 导出word 实现循环表格

如果是固定的值 用 {{}} 即可 但是如果是循环表格,那么就需要制定模板为如图 然后在处理表格数据时候: /*** 传入 节点对象 返回生成的word文档* param flangeJoint* return* throws IOException*/private XWPFTemplate getXwpfTemplate(CmComplaintEn…

XIP (eXecute In Place)

NOR Flash 能直接执行代码(XIP)而 NAND Flash 不能,根本原因在于它们的物理结构和访问接口存在本质区别。下面用技术原理 + 现实比喻帮你彻底理解: 1. XIP 是什么? XIP (eXecute In Place) 指代码不需要从存储介质复制到 RAM,而是 CPU 直接从存储介质(如 Flash)中读取…

【android bluetooth 协议分析 10】【AVRCP详解1】【PlaybackStateCompat类如何查看】

1. 问题 android/app/src/com/android/bluetooth/avrcpcontroller/AvrcpControllerService.java import android.support.v4.media.MediaBrowserCompat.MediaItem; import android.support.v4.media.session.PlaybackStateCompat;private int toPlaybackStateFromJni(int fro…

【AI学习从零至壹】LLM模型prompt开发及⼤模型应⽤

LLM模型prompt开发及⼤模型应⽤ ⼤语⾔模型 LLM如何构建⼀个AI对话系统关于模型的训练 ollama调⽤LLM模型设置API KEY测试一个对话 prompt提示词提示词结构特征提示词的五大核心价值1. 信息传递的精准性2. 输出质量的可控性3. 用户意图的对⻬性4. 复杂任务的拆解性5. 伦理⻛险的…

ubuntu20.04如何给appImage创建快捷方式

ubuntu20.04如何给appImage创建快捷方式 1. 确保AppImage是可执行的 chmod x /path/to/your/appimage2. 创建.desktop文件 在~/.local/share/applications/目录下创建一个新的 .desktop 文件: vi ~/.local/share/applications/your-appname.desktop添加以下内容…

RT-Thread 详解:国产开源实时操作系统

一、RT-Thread 概述 定义:RT-Thread 是中国自主研发的开源实时操作系统(RTOS),兼具实时性与物联网(IoT)特性,支持从资源受限的 MCU(如 STM32、ESP32)到高性能处理器&…

Wan2 1-VACE

简介 VACE是阿里新开源的视频编辑/生成框架,号称能够执行任意的视频编辑/生成。总体而言,该模型在整体结构上并没有太大改变,仅仅是在原Wan2.1模型的基础上,加了一个接受mask和视频输入的controlnet而已。但是这篇文章认为&#…

基于 opencv+yolov8+easyocr的车牌追踪识别

(本项目所有代码打包至我的资源中,大家可在我的文章底部选择下载) 目录 需求 实现效果 学习视频 大致思路 代码实现 资源下载 需求 通过车辆识别技术,识别视频中每个车辆及其车牌号,车辆应进行追踪,避免重复…

sqlserver函数与过程(二)

过程 SQLserver 过程是具有特定功能,可多次对数据表操作的独立模块。返回值通常用return 返回整数 0,1…。(可选)也可通过output 参数或select 语句返回结果集。 1.过程的定义 本过程定义了一个过程,输入一个动态SQL语句&#…

OpenCV学习3

1、创建图像窗口滑动条 OpenCV 4中通过createTrackbar()函数在显示图像的窗口上创建滑动条。 int cv::createTrackbar(const String &trackbarname,const String &winname, int *value, int count, TrackbarCallback onChange 0, void *us…