【深度学习】通俗易懂的基础知识:指数加权平均

一、什么是指数加权平均?

        指数在数学中表示一个数的幂次运算(如aⁿ中的n),而在统计学中特指随时间变化的几何衰减系数,加权指对不同数据赋予不同权重,使重要数据对结果产生更大影响。指数加权平均指是一种时间序列数据的加权计算方法,其特点是随着时间推移,数据权重呈指数级衰减——近期数据具有更高权重,而早期数据影响逐渐减弱。该方法的核心在于"动态平衡历史与当前数据,同时突出近期信息的可靠性"。

二、什么叫数据权重呈指数级衰减?

        我在之前写过的一篇文章【人工智能】神经网络的优化器optimizer(一):Momentum动量优化器中有所提及,现在先把神经网络中指数加权平均的公式贴出来:

        展开推导如下:

         基于以上公式,我们可以假设下:

          可以看到,越远的梯度权重呈现指数级衰减

三、数学推导‌

        抛开神经网络单纯讲指数加权平均的核心公式为:

        v_{t}=β⋅v_{t-1}+(1−β)⋅x_{t}

其中:

  • v_{t}:当前时刻的加权平均值
  • v_{t-1}:上一时刻的加权平均值(初始值 v_{0}=0
  • x_{t}:想要观察的时刻 t 的值
  • \beta:衰减因子(0<β<1),控制历史数据的权重分布‌

        ‌推导过程

        递推展开‌(假设 v_{0}=0):

v_{1}=(1−β)⋅x_{1}

v_{2}=β⋅v_{1}+(1−β)⋅x_{2}=β(1−β)x_{1}+(1−β)x_{2}

v_{3}=β⋅v_{2}+(1−β)⋅x_{3}=β^{2}(1−β)x_{1}+β(1−β)x_{2}+(1−β)x_{3}

 ⋮

 ⋮

v_{t}=(1-\beta)[x_{t}+\beta x_{t-1} + \beta^{2} x_{t-2} + ...... +\beta^{t-1} x_{1}]

        ‌权重系数规律‌:
        从展开式可见,历史数据 x_{k}的权重为 (1−β)β^{t-k}。权重随 k(时间距离)增大而‌指数衰减‌:

  • 当前时刻 x_{t}:权重 =(1−β)
  • 前一时刻 x_{t-1}:权重 =(1−β)β
  • 前 n 时刻x_{t-n}:权重 =(1−β)β^{n}
  • 权重总和收敛于1‌:\sum_{k=0}^{t-1}(1-\beta)\beta^{k}=(1-\beta)^\frac{1-\beta^{t}}{1-\beta}=1-\beta^{t}\rightarrow 1  (当 t→∞)‌

四、权重的取值

        那么我们的权重究竟取多少是合适的呢?其实并没有一个具体的值可以确定,需要根据不同的情况确定不同的值,大概的范围如下:

β 值平滑性响应速度典型曲线特征
0.98(最大)极高极慢平坦,滞后实际变化
0.9(适中)中等中等平衡平滑与响应,历史数据权重衰减慢,平均结果更平滑,但响应延迟明显。
0.5(较小)极低极快抖动明显,紧跟最新数据,近期数据主导,对波动更敏感,但噪声抑制弱。

        以下通过一个例子:正弦波加噪声数据,来对比β=0.1/0.5/0.9/0.98 时的平滑效果:

        可以观察到以下几个规律:

β=0.1(蓝线):几乎跟随噪声波动,响应快但平滑效果差

β=0.5(橙线):平衡噪声抑制与趋势跟踪

β=0.9(绿线):极度平滑但明显滞后原始信号峰值

β=0.98(红线):滞后严重

        β越小曲线越贴近原始数据,β越大平滑效果越强但滞后越明显。

        代码如下:

import numpy as np
import matplotlib.pyplot as plt# 生成模拟数据(正弦波+噪声)
np.random.seed(42)
t = np.linspace(0, 10, 100)
data = np.sin(t) + np.random.normal(0, 0.2, 100)def ewma(data, beta):v = [0]  # 初始化v0for x in data:v.append(beta * v[-1] + (1 - beta) * x)return v[1:]  # 去掉初始v0# 计算不同β值的EWMA
beta_list = [0.1, 0.5, 0.9,0.98]
results = {f'β={beta}': ewma(data, beta) for beta in beta_list}# 可视化
plt.figure(figsize=(10, 6))
plt.plot(t, data, 'k.', label='data')
for label, result in results.items():plt.plot(t, result, label=label, linewidth=2)
plt.legend()
plt.grid(True)
plt.show()

五、指数加权平均和普通平均的区别

        我们通过一个简单的例子说明:

(一)假设你连续10天记录的气温数据为:[22, 23, 24, 25, 26, 27, 28, 29, 30, 31]℃:

普通平均:将所有温度相加后除以天数
(22+23+24+25+26+27+28+29+30+31)/10 = 26.5℃
这种方法赋予每天相同权重,但会稀释近期温度变化的影响。

指数加权平均(衰减因子β=0.5):
第10天权重:50%(31×0.5=15.5)
第9天权重:25%(30×0.25=7.5)
第8天权重:12.5%(29×0.125≈3.6)
...
最终加权值≈15.5+7.5+3.6+1.8+0.9+0.4+0.2+0.1+0.05+0.02≈30.1℃

        对比可见:这种计算明显更贴近近期升温趋势(第10天31℃),而普通平均则被早期低温数据拉低。由此可知指数加权平均对短期变化更敏感,适合捕捉天气趋势;普通平均则更适合分析长期稳定状态

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/94084.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/94084.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++-list

C-list std::list是C标准模板库(STL)提供的双向链表容器&#xff0c;它提供了高效的插入和删除操作&#xff0c;特别适合频繁修改的序列。定义在 <list> 头文件中&#xff0c;属于 std 命名空间。该类的接口与常规容器接口基本一致。 模板原型&#xff1a; template <…

【笔试真题】2024秋招京东后端开发岗位-第一批笔试

31.牛牛与切割机 有一个序列 a1,a2,...,ana_1,a_2,...,a_na1​,a2​,...,an​ &#xff0c; 牛牛将对这个序列切割一刀&#xff08;划分分成两个不相交的非空序列&#xff0c;一个序列为 a1,...,apa_1,...,a_pa1​,...,ap​&#xff0c;另一个序列为 ap1,...,ana_{p1},...,a_na…

【整数转罗马数字】

思路计算数字的位数&#xff1a; 通过 while(x) 循环计算输入数字 num 的位数 n。提取各位数字&#xff1a; 将数字 num 的每一位分解并存储到 nums 数组中&#xff0c;顺序为从高位到低位。罗马数字映射&#xff1a; 使用固定数组 Roman 存储罗马数字符号&#xff1a;Roman {…

spring Scheduled注解详解

spirng Scheduled注解详解 用于标记需要安排执行的方法的注解。必须指定 cron、fixedDelay 或 fixedRate 中的恰好一个属性。 被标注的方法必须不接受任何参数。它通常会具有 void 类型的返回值&#xff1b;如果不是这样&#xff0c;那么在通过调度器调用该方法时&#xff0c;返…

新升级超值型系列32位单片机MM32G0005

灵动微推出的新型MM32G0005系列基于ArmCortex - M0内核&#xff0c;具备高可靠性、低功耗、高性价比等特性。Flash升级至64KB&#xff0c;SRAM为4KB&#xff0c;还有1KB Data Flash。Flash全温擦写次数超过10万次。采用24Pin封装&#xff0c;最多有22个IO。QFN20和TSSOP20封装与…

Spark SQL 的详细介绍

Spark SQL 是 Apache Spark 生态系统中用于处理结构化数据的模块&#xff0c;它将 SQL 查询与 Spark 的分布式计算能力相结合&#xff0c;提供了一种高效、灵活的方式来处理结构化和半结构化数据。以下是对 Spark SQL 的详细介绍&#xff1a;1. 核心定位与优势结构化数据处理&a…

【FreeRTOS】空闲任务与钩子函数原理、实现与功能详解

一、FreeRTOS空闲任务概述FreeRTOS中的空闲任务(Idle Task)是系统自动创建的一个特殊任务&#xff0c;具有最低优先级(优先级0)。当没有其他更高优先级的任务运行时&#xff0c;调度器就会运行空闲任务。空闲任务的主要功能系统资源回收&#xff1a;自动清理被删除任务的内存和…

imx6ull-驱动开发篇6——Linux 设备树语法

目录 前言 设备树 设备树概念 DTS、 DTB 和 DTC DTS 语法 .dtsi 头文件 设备节点 /根节点​​ 节点命名与标签 节点层次结构​ 属性数据类型​ 标准属性 compatible 属性 model 属性 status 属性 #address-cells 和#size-cells 属性 reg 属性 ranges 属性 n…

ansible简单playbook剧本例子2

1. 准备主机组[rootansible-master ansible_quickstart]# vim inventory/hosts[web:vars] ansible_port22 ansible_passwordAdmin123456[web] 192.168.100.1822.准备剧本 vim hello.yml--- - hosts: webremote_user: roottasks:- name: Ping the target hostsping:- name: 获取…

EmpService 和 EmpMapper接口的作用

在这个项目中&#xff0c;EmpService 和 EmpMapper 都定义接口&#xff0c;是基于面向接口编程&#xff08;Interface Oriented Programming&#xff0c;IOP&#xff09;的设计思想&#xff0c;这两种接口在项目中承担着不同的职责&#xff0c;具体说明如下&#xff1a; EmpSer…

【语音技术】什么是动态实体

目录 动态实体的定义和维度 1.1 动态实体的资源 1.2 生效维度 1.2.1 应用级 1.2.2 用户级 1.2.3 自定义级 2. 动态实体的上传及使用 2.1 WebAPI 2.1.1 授权认证 2.1.2 上传资源接口 2.1.2.1 参数说明 2.1.2.2 返回说明 2.1.3 查询打包状态 2.1.3.1 参数说明 2.1.…

STM32学习记录--Day3

今天了解了下I2C&#xff1a;1.I2C电路结构I2C通信示意图&#xff1a;数据传输阶段​​​​主→从模式​​&#xff08;写操作&#xff09;&#xff1a;主机控制SCL时钟&#xff08;把SCL拉低&#xff09;主机向SDA线发送数据&#xff08;每次8位1位ACK&#xff09;​​主←从模…

裂变数据看板:5个核心指标决定活动生死​

数据是裂变活动的“指南针”。本文详解曝光量、转化率、裂变系数等5大核心指标&#xff0c;结合工具与案例&#xff0c;教你用数据驱动活动优化&#xff0c;避免“自嗨式裂变”。​为什么数据是裂变的“生死线”&#xff1f;&#xff08;认知重构&#xff09; 很多企业裂变活动…

iOS 类存储 与 C# 类存储 的差异

C# 中类的代码&#xff08;包括方法、属性等成员&#xff09;的存储机制与 Objective-C 有显著差异&#xff0c;其核心依赖于 ​CLR&#xff08;公共语言运行时&#xff09;的方法表&#xff08;Method Table&#xff09;和虚拟方法表&#xff08;vtable&#xff09;机制&#…

Selenium自动化:轻松实现网页操控

selenium自动化 1 什么是 Selenium 自动化 Selenium 是一个用于 Web 应用程序测试的工具&#xff0c;支持多种浏览器&#xff08;如 Chrome、Firefox、Edge 等&#xff09;。WebDriver 是 Selenium 的核心组件&#xff0c;用于控制浏览器行为并执行自动化操作。元素定位是通过…

又开发了一个优雅的小工具!

在开源项目中&#xff0c;Issues是一个强大的功能&#xff0c;用于跟踪bug、功能请求和任务。然而&#xff0c;随着项目的发展&#xff0c;Issues可能会变得难以管理&#xff0c;特别是当你需要离线访问或进行深入分析时。 当然GitHub Issues除了上述功能以外&#xff0c;做在线…

【安装教程】Docker Desktop 安装与使用教程

文章目录一、环境要求二、安装步骤2.1 安装 WSL 2&#xff08;适用于非专业版 Windows 10 及 Windows 11&#xff09;2.2 安装 Docker Desktop2.3 汉化 DDocker Desktop2.4 卸载 Docker Desktop三、使用 Docker3.1验证安装3.2. 拉取镜像3.3. 运行容器3.4. 查看容器3.5.更改容器…

Hutool 的 WordTree(敏感词检测)

package cn.hutool.dfa;WordTree 继承自 HashMap<Character, WordTree>&#xff0c;表示一个字符到子树的映射&#xff0c;构成一颗“词树”&#xff08;类似 Trie 树&#xff09;&#xff0c;用于快速匹配字符串中的词语&#xff08;敏感词检测、关键词匹配等&#xff0…

Makefile 从入门到精通:自动化构建的艺术

引入 在软件开发的世界里&#xff0c;“编译” 是绕不开的环节&#xff0c;但手动编译大型项目时&#xff0c;重复输入编译命令的痛苦&#xff0c;相信每个开发者都深有体会。Makefile 作为自动化构建的基石&#xff0c;能让编译过程“一键完成”&#xff0c;甚至智能判断文件变…

利用DeepSeek将Rust程序的缓冲输出改写为C语言实现提高输出效率

在前面多语言测试中&#xff0c;遇到一个难以置信的问题&#xff0c;rust的输出到文件比c语言还快&#xff0c;这是不合情理的&#xff0c;通过对两者输出语句的比较&#xff0c;发现了不同。 rust程序在输出到stdout前有这么一句 let mut writer BufWriter::with_capacity(6…