极简的神经网络反向传播例子

我之前一直没搞清楚,神经网络为什么要求导?反向传播又是什么?于是到现在深究回来……

本质就是拟合一个未知函数。 

高中的数理统计就学过最小二乘法这种回归方法(ŷ 代表自己的预测y,这个表达要记住),这个有点类似。

假设你有一个线性函数y=ax(下面a用w代替,weigh权重的意思),而目标函数是y=2x,求导(是对loss 损失函数求导!)的目的就是利用导函数中的斜率(预测值比真值大了斜率是正,就要减去变小,反之小了斜率负的,也减去则变大),来调整a的权重。


我们来举一个特别简单的例子:只有1个输入、1个权重、1个输出的神经网络,帮你彻底理解:

🧠 神经网络结构(超简版)

我们要学的是:

用一个参数 w 去逼近函数 y = 2x

我们拿一组训练数据:

输入 x = 1,希望输出 y = 2

我们的模型就是:(损失函数自己定,有能力衡量预测值和真值之间差距的函数就行,这里用的是二阶中心矩——方差)

预测值:ŷ = w * x 
损失函数:L = (ŷ - y)^2 

第一步:前向传播(计算预测和损失)

  • 假设初始权重 w = 0.5

  • 输入 x = 1

  • 那么预测值:ŷ = 0.5 × 1 = 0.5

  • 实际标签:y = 2

  • 损失:L = (0.5 - 2)^2 = 2.25


第二步:反向传播(计算梯度)

我们要对 损失函数L参数w 求导,看看w该怎么改。

损失函数展开:

L = (w*x - y)^2 

对w求导:

dL/dw = 2 * (w*x - y) * x 

代入数字得到具体x的导数(梯度)

dL/dw = 2 * (0.5*1 - 2) * 1 = 2 * (-1.5) = -3 

第三步:更新权重(学习)

用最简单的梯度下降更新公式:(这部分得到的是调整斜率变化的偏移量,是减)

w = w - 学习率 * 梯度 

假设学习率 lr = 0.1

w = 0.5 - 0.1 * (-3) = 0.5 + 0.3= 0.8 

🧪 下一次训练:

新的权重 w = 0.8

  • 预测值变成 ŷ = 0.8 × 1 = 0.8

  • 距离真实值 2更近了

  • 损失变小了!

这就是“通过反向传播 + 求导”,让网络“学到信息”的过程。


✅ 总结:

步骤做了什么
前向传播用当前参数做出预测
计算损失看预测错了多少
反向传播求导,看参数该怎么改
更新参数用梯度下降法调整参数

这里是最简单的一个例子,靠着AI辅助生成创作的,权作抛砖引玉。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913314.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913314.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

01-什么是强化学习

什么是强化学习 1. 定义 强化学习(Reinforcement Learning, RL)是一种使智能体(Agent)通过与环境(Environment)不断交互,学习如何在不同情境下采取行动以获得最大化累积奖励的机器学习方法。 强…

淘宝直播数字人:音视频算法工程技术

本专题是我们打造智能数字人的部分实践总结。我们将探讨六大核心环节:LLM文案生产赋予数字人思考和内容生成能力,如同其“大脑”;LLM互动能力则聚焦对话逻辑与拟人化交流,是实现自然交互的关键;TTS(语音合成…

MySQL回表查询深度解析:原理、影响与优化实战

引言 作为后端开发或DBA,你是否遇到过这样的场景: 明明给字段加了索引,查询还是慢?EXPLAIN一看,执行计划里type是ref,但数据量不大却耗时很久? 这时候,你很可能遇到了MySQL中常见的…

任务管理器看不到的内存占用:RAMMap 深度分析指南

前言:任务管理器看不到的内存真相 在日常使用 Windows 系统时,我们有时会遇到一种令人费解的情况: 刚刚开机,什么软件都没运行,系统内存却已经占用了 7~8 GB。 打开任务管理器一看,前几个进程加…

从传统仓库到智能物流枢纽:艾立泰的自动化蜕变之旅

在物流行业智能化浪潮中,艾立泰从依赖人工的传统仓库转型为智能物流枢纽,其自动化升级路径为行业提供了典型范本。​曾几何时,艾立泰仓库内人工搬运、纸质单据流转、手工盘点是常态,效率低下、差错率高、人力成本攀升等问题制约发…

408第三季part2 - 计算机网络 - 滑动窗口

理解 帧本质就是一堆二进制,后面会将帧的格式 流量控制就是 B:急急急急急急 A:别急 A控制B,B控制C,C控制D,但D无法控制A,这就是相邻节点 abc在发送的过程中发送完了 怎么才能继续发送呢 没…

RedHat高可用集群深度解析与优化

一、RHCS核心组件深度解析1. Corosync(消息层)通信机制改进说明: Totem协议采用环形令牌传递机制,在10节点以下集群中使用UDP/IP组播(224.0.0.12),超过10节点建议改用UDP/UDP单播。典型配置示例…

为什么使用 XML Schema?

为什么使用 XML Schema? XML(可扩展标记语言)是一种广泛使用的标记语言,它被设计用来存储和传输数据。XML Schema 是一种用于定义 XML 文档结构的语言,它为 XML 文档提供了严格的验证机制。以下是使用 XML Schema 的几个主要原因: 1. 结构化数据定义 XML Schema 允许开…

ESP32蓝牙学习笔记

蓝牙 官网:https://www.bluetooth.com/zh-cn/learn-about-bluetooth/tech-overview/ 概述 分类:Bluetooth经典、Bluetooth低能耗(LE) GAP 通用访问配置文件(Generic Access Profile, GAP)简称GAP,该Profile保证不同的Bluetooth产品可以互…

C#扩展方法全解析:给现有类型插上翅膀的魔法

C#扩展方法全解析:给现有类型插上翅膀的魔法 在 C# 的类型系统中,当我们需要为现有类型添加新功能时,传统方式往往意味着继承、重写或修改源代码 —— 但如果是string、int这样的系统类型,或是第三方库中的密封类,这些…

YOLOv11在边缘计算设备上的部署与优化:从理论到实践

边缘计算与YOLOv11的融合背景 边缘计算的崛起与核心价值 边缘计算作为一种分布式计算范式,正深刻改变着人工智能应用的部署方式。其核心在于将数据处理从云端下沉到网络边缘,在靠近数据源的位置完成计算任务。根据国际数据公司(IDC&#xf…

Solidity——pure 不消耗gas的情况、call和sendTransaction区别

/ pure: 纯纯牛马 function addPure(uint256 _number) external pure returns(uint256 new_number){ new_number _number 1; }不会消耗gas对吧。传的不是状态变量 你的理解基本对了,但我们来更严谨、深入地回答这个问题。 ✅ 你这段 pure 函数代码: …

柔性电路芯片赋能脑机接口:技术融合、应用突破与前景展望

柔性电路芯片赋能脑机接口:技术融合、应用突破与前景展望 一、引言 1.1 研究背景与意义 在科技飞速发展的时代,柔性电路芯片与脑机接口的融合展现出巨大的潜力,为医疗、科研等多个领域带来了新的机遇与变革。 从医疗领域来看,随着人口老龄化的加剧以及神经系统疾病患者…

全面解析存储芯片:从Flash到DDR、铁电、内存条与SD卡

一、存储芯片分类概述 存储芯片是电子设备中用于数据存储的核心组件,根据数据保存方式可分为 易失性存储器(Volatile Memory) 和 非易失性存储器(Non-Volatile Memory)。 类型代表芯片特点典型应用易失性存储器DRAM、…

编译ADI NO-OS工程

1,先在WINdows下安装git bush 可以参考下面博客 https://blog.csdn.net/Natsuago/article/details/145647536 2.安装make 工具 可参考一下链接 https://blog.csdn.net/weixin_40727233/article/details/110353240 3,参考ADI官方链接 https://wiki.analo…

自存bro code java course 笔记(2025 及 2020)

Java Full Course for free ☕ System 是 Java 中的一个 final 类,定义在 java.lang 包中。它的 构造方法是 private 的,意味着你无法通过 new System() 来创建对象。它的所有常用成员(如 System.out, System.in, System.err, currentTimeMil…

opencv基础的图像操作

目录 1.安装opencv-python 2.基础的图像操作 3.绘制几何图形 3.1.绘制直线 3.2.绘制矩形 3.3.绘制圆形 3.4.向图像中添加文字 总结 1.安装opencv-python pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python 2.基础的图像操作 # 导入库 import c…

Kali制作Linux木马

环境描述:攻击机:kali-Linux2025靶机:Linux-Centos8本文章主要介绍怎么通过kali制作Linux木马控制linux,不要用于非法用途,法律是底线不要触碰,提升自己的网络安全技能,如有用于非法用途自行承担…

常见user agent

常见user agent pc端ua chrome “Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36”“Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11”“Mo…

Windows 11 Enterprise LTSC 转 IoT

Windows 11 Enterprise LTSC 转 Windows 11 IoT Enterprise LTSC 微软官方并未给出Windows 11 IoT Enterprise LTSC中文版的镜像文件,但可以通过Windows 11 Enterprise LTSC版本的进行转换。 二者主要区别概览 特性Windows 11 Enterprise LTSCWindows 11 IoT Ent…