【Day44】

DAY 44 预训练模型

知识点回顾:

  1. 预训练的概念
  2. 常见的分类预训练模型
  3. 图像预训练模型的发展史
  4. 预训练的策略
  5. 预训练代码实战:resnet18

作业:

  1. 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同
  2. 尝试通过ctrl进入resnet的内部,观察残差究竟是什么

在统计学和机器学习领域,**残差(Residual)是一个核心概念**,用于衡量模型预测值与实际观测值之间的差异。理解残差有助于评估模型性能、诊断模型问题,并优化模型效果。以下是关于残差的详细解析:### **一、残差的定义**
- **数学表达式**:  对于给定的观测值 \( y_i \) 和模型预测值 \( \hat{y}_i \),残差 \( e_i \) 定义为:  \[e_i = y_i - \hat{y}_i\]  例如:若实际房价为100万元,模型预测为95万元,则残差为 \( 100 - 95 = 5 \) 万元。### **二、残差与误差的区别**
残差常与“误差(Error)”混淆,但两者含义不同:  
| **对比维度**       | **残差(Residual)**                | **误差(Error)**                  |
|--------------------|-------------------------------------|------------------------------------|
| **本质**           | 模型预测值与实际观测值的差异        | 真实值与理论值(不可观测)的差异   |
| **可观测性**       | 可通过数据直接计算得出              | 理论上存在,无法直接观测           |
| **用途**           | 用于模型评估、诊断和优化            | 用于描述模型的理论偏差             |### **三、残差的作用**
#### 1. **评估模型拟合效果**  - **直观判断**:残差绝对值越小,模型预测越准确;反之,模型拟合效果差。  - **统计指标**:通过残差的统计量(如均值、方差、均方误差(MSE)、平均绝对误差(MAE))量化模型性能。  - 例如:若残差均值接近0,说明模型无系统性偏差;若残差方差大,说明预测值波动大。#### 2. **诊断模型问题**  - **残差分析图**:通过绘制残差图(如残差-预测值图、残差-自变量图),识别模型缺陷:  - **非线性关系**:若残差呈现曲线趋势(如U型、倒U型),说明模型可能忽略了非线性关系(需引入多项式特征或换用非线性模型)。  - **异方差性**:若残差随预测值增大而扩散(如扇形分布),说明数据存在异方差性(需数据变换或使用加权回归)。  - **异常值**:若个别残差绝对值显著偏大,可能对应数据中的异常值,需检查数据或调整模型。#### 3. **优化模型**  - 通过分析残差模式,指导模型改进:  - 增加特征(如交互项、多项式项)以捕捉非线性关系;  - 更换模型(如从线性回归换为随机森林、神经网络);  - 处理异常值或对数据进行标准化/归一化。### **四、残差的类型(以回归模型为例)**
1. **普通残差(Ordinary Residual)**  即最基础的残差 \( e_i = y_i - \hat{y}_i \),适用于初步模型评估。  2. **标准化残差(Standardized Residual)**  - 对残差进行标准化处理,消除量纲影响:  \[\text{标准化残差} = \frac{e_i}{\hat{\sigma}}\]  其中 \( \hat{\sigma} \) 为残差的估计标准差,用于比较不同样本的残差大小。  3. **学生化残差(Studentized Residual)**  - 进一步考虑单个样本对模型的影响,剔除当前样本后计算残差,用于检测异常值。### **五、残差的假设(以线性回归为例)**
在经典线性回归模型中,残差需满足以下假设(**高斯-马尔可夫假设**):  
1. **零均值**:\( E(e_i) = 0 \)(模型无系统性偏差);  
2. **同方差性**:\( \text{Var}(e_i) = \sigma^2 \)(残差方差恒定);  
3. **无自相关性**:\( \text{Cov}(e_i, e_j) = 0 \)(残差之间相互独立);  
4. **正态性**:\( e_i \sim N(0, \sigma^2) \)(残差服从正态分布)。  
若残差不满足这些假设,模型的参数估计和统计检验将失效,需通过数据变换或模型调整解决。### **六、残差在机器学习中的应用**
在机器学习中,残差的概念同样重要:  
- **集成学习**:如梯度提升树(GBDT)通过拟合残差逐步优化模型,每棵树学习前序模型的残差,最终累加预测值。  
- **模型诊断**:通过交叉验证计算残差,检测模型是否过拟合(如训练集残差低但测试集残差高,可能过拟合)。  ### **总结**
残差是连接模型预测与实际数据的桥梁,其核心价值在于:  
- **量化差异**:衡量模型预测的准确性;  
- **揭示规律**:通过残差模式发现数据中的隐藏信息(如非线性、异常值);  
- **指导优化**:为模型改进提供方向。  
熟练运用残差分析,是提升数据分析和建模能力的关键环节。

浙大疏锦行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/908156.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python打卡训练营打卡记录day44

知识点回顾: 预训练的概念常见的分类预训练模型图像预训练模型的发展史预训练的策略预训练代码实战:resnet18 作业: 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同尝试通过ctrl进入resnet的…

Vue跨层级通信

下面,我们来系统的梳理关于 Vue跨层级通信 的基本知识点: 一、跨层级通信核心概念 1.1 什么是跨层级通信 跨层级通信是指在组件树中,祖先组件与后代组件(非直接父子关系)之间的数据传递和交互方式。这种通信模式避免了通过中间组件层层传递 props 的繁琐过程。 1.2 适用…

webPack基本使用步骤

webPack基本使用步骤 关于webPackwebPack配置的几个概念entry(入口)output(输出)loader(输出)plugin(插件)mode(模式) 基本使用过程示例1.创建测试目录和代码…

龙虎榜——20250604

上证指数缩量收阳线,量能依然在5天线上,股价也在5天线上。 深证指数放量收阳线,量能站上5天均线,但仍受中期60天均线压制。 2025年6月4日龙虎榜行业方向分析 1. 黄金 代表标的:曼卡龙、菜百股份。 驱动逻辑&#…

Viggle:开启视频人物替换新纪元

Viggle 的出现,为视频人物替换带来了前所未有的变革,为创作者和爱好者们打开了一扇通往无限可能的大门。 一、Viggle 技术原理剖析 Viggle 是一款基于先进人工智能技术的创新平台,其核心在于能够精准实现静态图片与动态视频的融合转化。它…

【BUG解决】关于BigDecimal与0的比较问题

这是一个很细小的知识点,但是很容易被忽略掉,导致系统问题,因此记录下来 问题背景 明明逻辑上看a和b都不为0才会调用除法,但是系统会报错:java.lang.ArithmeticException异常: if (!a.equals(BigDecimal…

千年之后再出发,铜官窑驶入微短剧的数字航道

过去一年里,微短剧已经成为走向全民关注、平台扶持、政策引导的“内容新主流”。从市值百亿的爆款平台到走出国门的“短剧出海”,微短剧正在重塑中国数字文化的表达方式与产业结构,也成为各地竞相争夺的“新蓝海”。 就在这样的背景下&#…

数据库管理-第333期 Oracle 23ai:RAC打补丁完全不用停机(20250604)

数据库管理333期 2025-06-04 数据库管理-第333期 Oracle 23ai:RAC打补丁完全不用停机(20250604)1 概念2 要求3 操作流程4 转移失败处理总结 数据库管理-第333期 Oracle 23ai:RAC打补丁完全不用停机(20250604&#xff0…

Trae CN IDE自动生成注释功能测试与效率提升全解析

Trae CN IDE 的自动注释功能可以通过 AI 驱动的代码分析生成自然语言注释,以下是具体测试方法和优势总结: 一、Python 代码注释生成测试 1. 测试环境 IDE:Trae CN IDE(需确认支持 Python)代码示例: def …

软考 系统架构设计师系列知识点之杂项集萃(79)

接前一篇文章:软考 系统架构设计师系列知识点之杂项集萃(78) 第141题 软件测试一般分为两个大类:动态测试和静态测试。前者通过运行程序发现错误,包括()等方法;后者采用人工和计算机…

有公网ip但外网访问不到怎么办?内网IP端口映射公网连接常见问题和原因

有公网IP但外网访问不到的核心原因通常包括:端口未正确映射、防火墙限制、DNS解析问题、运营商端口屏蔽或路由配置错误‌。需依次排查这些关键环节,其中端口映射和防火墙设置是最常见的原因。‌‌ ‌内网IP端口映射公网连接常见问题和原因及解决方案 1…

HttpServletResponse 对象用来做什么?

HttpServletResponse 对象是由 Servlet 容器创建并传递给 Servlet 的 service() 方法(以及间接传递给 doGet(), doPost() 等方法)的。它的核心作用是让 Servlet 能够向客户端(通常是浏览器)发送 HTTP 响应。 通过 HttpServletRes…

FTPS、HTTPS、SMTPS以及WebSockets over TLS的概念及其应用场景

一、什么是FTPS? FTPS,英文全称File Transfer Protocol with support for Transport Layer Security (SSL/TLS),安全文件传输协议,是一种对常用的文件传输协议(FTP)添加传输层安全(TLS)和安全套接层(SSL)加密协议支持的扩展协议。…

前端​​HTML contenteditable 属性使用指南

​​什么是 contenteditable? HTML5 提供的全局属性,使元素内容可编辑类似于简易富文本编辑器兼容性​​ 支持所有现代浏览器(Chrome、Firefox、Safari、Edge) 移动端(iOS/Android)部分键盘行为需测试 &l…

持续领跑中国异地组网路由器市场,贝锐蒲公英再次登顶销量榜首

作为国产远程连接SaaS服务的创领者,贝锐持续引领行业发展,旗下贝锐蒲公英异地组网路由器,凭借出色的技术实力和市场表现,斩获2024年线上电商平台市场销量份额中国第一的佳绩,充分彰显了其在网络解决方案与异地组网领域…

五大主流大模型推理引擎深度解析:llama.cpp、vLLM、SGLang、DeepSpeed和Unsloth的终极选择指南

在人工智能的竞技场上,大模型推理框架就像是为超级跑车精心调校的引擎系统——选对了能让你的AI应用一骑绝尘,选错了可能连"停车场"都开不出去。这些框架的核心价值在于将训练好的"大脑"转化为实际可用的"肌肉记忆",而选择标准则需要像职业赛…

前端面试二之运算符与表达式

目录 1.JavaScript 中的 和 运算符 2.|| (逻辑或) 运算符 与 ES6 默认参数的区别 与 ?? (空值合并运算符) 的区别 3.?.(可选链)运算符 (1). 安全访问深层嵌套属性 (2). 安全调用可能不存在的函数 (3). 安全访问数组元素 4.展开运算符 (..…

GB/T 24507-2020 浸渍纸层压实木复合地板检测

浸渍纸层压实木地板是指以一层或多层专用纸浸渍热固性氨基树脂,经干燥后铺装在胶合板基材正面,专用纸表面加耐磨层,基材背面可加平衡层,经热压、成型的地板。 GB/T 24507-2020 浸渍纸层压实木复合地板测试项目: 测试项…

AWS DocumentDB vs MongoDB:数据库的技术抉择

随着非关系型数据库在现代应用中的广泛应用,文档型数据库因其灵活的结构与出色的扩展性,逐渐成为企业开发与架构设计中的核心选择。在众多文档数据库中,MongoDB 凭借其成熟生态与社区支持占据主导地位;与此同时,AWS 提…

微信小程序实现运动能耗计算

微信小程序实现运动能耗计算 近我做了一个挺有意思的微信小程序,能够实现运动能耗的计算。只需要输入性别、年龄、体重、运动时长和运动类型这些信息,就能算出对应的消耗热量。 具体来说,在小程序里,性别不同,身体基…