第3周 机器学习课堂记录

1.学习问题的分类

  • 有监督的学习
    • 分类
    • 回归
  • 无监督学习
    • 聚类
    • 密度估计:确定输入空间中的数据的分布
    • 可视化:把高位空间中的数据投影到二维或三维空间
  • 强化学习
    • 不给定最优输出的示例,而是通过试错发现最优输出

2.泛化versus过度拟合

背景引入:多项式曲线拟合

目标函数:y(X,W) = W^TX

损失函数:最小平方和\tilde{E}(\mathbf{w}) = \frac{1}{2} \sum_{i=1}^{N} \left\{ y(x_i, \mathbf{w}) - t_i \right\}^2

  • 泛化:正确预测不同于用于训练的数据的新观察的能力
  • 过拟合:目标函数的模型y过度拟合训练数据,如果存在一个可选的模型y‘满足error_D(y) < error_D(y')
    但是
    error(y) > error(y')
    其中,error_D(y)是训练数据上的误差,而error是整个数据分布上的误差
  • 欠拟合

3.用于模型比较的测试集

  • 测试集:一个独立的数据集,可以获得泛化性能对M的依赖的一些定量的领悟。
  • root-mean-square(RMS) error 均方根误差
    • E_{RMS} = \sqrt{2E(w)/N}
    • 除以N使得我们能够在平等的基础上比较不同大小的数据集
    • 开放确保E_{RMS}与目标变量t具有同样的尺度和量纲

4.Regularization正则化

  • 一种常用于控制过拟合现象的技术
  • 给误差函数添加一个惩罚项,以阻止系数达到大的值
    • \tilde{E}(\mathbf{w}) = \frac{1}{2} \sum_{i=1}^{N} \left\{ y(x_i, \mathbf{w}) - t_i \right\}^2 + \frac{\lambda}{2} \left\| \mathbf{w} \right\|^2
    • 其中\left\| \mathbf{w} \right\|^2 \equiv \mathbf{w}^\mathrm{T} \mathbf{w} = w_0^2 + w_1^2 + \dots + w_M^2
    • 并且系数λ控制正则化项与平方和误差项相比的相对重要性。

5.验证集

达成模型复杂度的适合的值的一种简单方法,通过把可用的数据划分成:

  • 一个训练集,用于确定系数w
  • 一个验证集,也叫做hold-out set,用于优化模型复杂度(要么M,要么λ)

训练集:确定模型参数w

测试集:评价模型泛化性质

验证集:调节模型超参M

y(X,W) = w_0 + w_1x + ... + w_Mx^M


6.Gaussian Distribution 高斯分布

单个实值变量x的情形,高斯分布定义为

\mathcal{N}(x|\mu,\sigma^2) = \frac{1}{(2\pi\sigma^2)^{1/2}} \exp\left\{ -\frac{1}{2\sigma^2}(x - \mu)^2 \right\}

式中 \mu 是均值(mean),\sigma^2 是方差(variance),方差的平方根 \sigma叫做标准误(standard deviation),方差的倒数 \beta(\beta=1/\sigma^2) 叫做精度(precision)。


7.Gaussian Parameter Estimation

  • 数据集 \mathcal{X} = (x_1, \dots, x_N)^{\mathrm{T}},表示标量x的N个观察。
  • 数据独立地从同一个高斯分布采样得到,均值和方差未知。
  • 利用数据集确定高斯分布的参数。
  • 由于数据集\mathcal{X}独立同分布,因此,给定μ和方差σ2,数据集的概率(似然)
    • p(\mathcal{X}|\mu, \sigma^2) = \prod_{i=1}^{N} \mathcal{N}(x_i|\mu, \sigma^2)

8.Maximum(Log) Likelihood 最大似然估计

  • 对数似然函数
    • \ln p(\mathcal{X}|\mu, \sigma^2) = -\frac{1}{2\sigma^2} \sum_{i=1}^{N} (x_i - \mu)^2 - \frac{N}{2} \ln \sigma^2 - \frac{N}{2} \ln 2\pi
  • 最大似然解
    • 样本均值  \mu_{\text{ML}} = \frac{1}{N} \sum_{i=1}^{N} x_i
    • 样本方差 \sigma_{\text{ML}}^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_{\text{ML}})^2

9.Limitations of the Maximum Likelihood Approach

  • 系统地低估分布的方差
    • E[\mu_{\text{ML}}] = \mu
    • E[\sigma_{\text{ML}}^2] = \frac{N - 1}{N} \sigma^2  (有估计偏差)
  • 和过拟合有密切关系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/96269.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/96269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

消息队列(MQ)高级特性深度剖析:详解RabbitMQ与Kafka

一、引言&#xff1a;为什么需要关注高级特性&#xff1f; 在现代分布式系统架构中&#xff0c;消息队列&#xff08;Message Queue&#xff09;已成为不可或缺的核心组件。初级使用消息队列可能只需几行代码就能实现基本功能&#xff0c;但要真正发挥其在大规模生产环境中的威…

【GPT入门】第65课 vllm指定其他卡运行的方法,解决单卡CUDA不足的问题

【GPT入门】第65课 vllm指定其他卡运行的方法&#xff0c;解决单卡CUDA不足的问题&#xff11;.原理说明&#xff1a;&#xff12;.实践&#xff11;.原理 要将 vllm 部署在第二张 GPU 卡上&#xff08;设备编号为 1&#xff09;&#xff0c;只需在命令前添加 CUDA_VISIBLE_DE…

Spring Boot Actuator自定义指标与监控实践指南

Spring Boot Actuator自定义指标与监控实践指南 本篇文章以生产环境实战经验为主线&#xff0c;结合某电商系统的业务场景&#xff0c;讲解如何在Spring Boot Actuator中添加并暴露自定义指标&#xff0c;并使用Prometheus和Grafana进行完整的监控与告警配置。 一、业务场景描述…

Vue报错<template v-for=“option in cardOptions“ :key=“option.value“>

在Vue项目中遇到报错&#xff0c;原因是模板中使用了<template>标签内的v-for指令&#xff0c;而当前Vue版本不支持此用法。解决方案是移除<template>标签&#xff0c;直接在<el-option>上使用v-for。同时优化计算属性cardOptions&#xff0c;使其能够兼容历…

人工智能学习:Transformer结构中的规范化层(层归一化)

Transformer结构中的规范化层(层归一化) 一、规范化层(层归一化)介绍 概念 层归一化(Layer Normalization) 是一种用于提高深度神经网络训练稳定性和加速收敛的技术,广泛应用于现代深度学习模型中,尤其是在Transformer等序列建模网络中。它通过对每一层的输出进行归一化…

盼之代售 最新版 decode__1174

声明 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 逆向分析 部分python代码 cp1 execj…

Transformer系列 | Pytorch复现Transformer

&#x1f368; 本文为&#x1f517;365天深度学习训练营中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 一、Transformer和Seq2Seq 在之前的博客中我们学习了Seq2Seq(深度学习系列 | Seq2Seq端到端翻译模型)&#xff0c;知晓了Attention为RNN带来的优点。那么有没有…

【MySQL】常用SQL语句

介绍常用的DDL语句、DML语句基本语法分号结尾使用空格和缩进不区分大小写--或#注释单行内容 /*注释多行内容*/DDL数据定义语句&#xff1a;定义数据库、表、字段一、操作库-- 创建库create database db1;-- 创建库是否存在&#xff0c;不存在则创建create database if not exi…

云手机就是虚拟机吗?

云手机并非等同于虚拟机&#xff0c;尽管二者存在一定相似性&#xff0c;但有着诸多区别&#xff0c;以下从多个方面来分析&#xff1a;云手机是一种基于云计算技术&#xff0c;将云端服务器虚拟化为手机设备&#xff0c;用户能通过网络远程操控的虚拟手机服务&#xff0c;它从…

准确--Nginx 1.28.0 安装与配置流程

Nginx 1.28.0 安装与配置流程 1. 下载与解压 cd ~ wget http://nginx.org/download/nginx-1.28.0.tar.gz tar -zxvf nginx-1.28.0.tar.gz cd nginx-1.28.02. 配置编译参数 ./configure \--prefix/home/ynnewweb/nginx \--with-http_ssl_module \--with-http_gzip_static_module…

无标记点动捕新范式:Xsens系统助力人形机器人实现毫米级动作复刻

Xsen搭载Manus数据手套在机器人操作与机器学习中的应用当前&#xff0c;人形机器人正加速向工业装配、家庭陪护、仓储物流等场景渗透&#xff0c;而 “如何让机器人的动作既符合人类运动规律&#xff0c;又能实现高精度执行” 成为制约其落地的核心瓶颈。Xsens 高精度全身动捕系…

mysql57超管root忘记密码怎么办

目录 背景 1.首先停止数据库 2.使用免密模式启动 3.修改密码 3.1刷新权限配置 3.2修改密码 4.杀掉mysql 5.重新正常启动mysql 6.查看mysql状态 7.验证 7.1首先服务器本地验证 7.2远程验证 背景 数据库密码忘记了,急的抓耳挠腮,怎么也想不起来,于是就开始重置吧 1.…

RESTful API:@RequestParam与@PathVariable实战对比

RequestParam vs PathVariable 在删除和查找操作中的使用差异 在项目实战中&#xff0c;选择使用 RequestParam 还是 PathVariable 来接收ID参数&#xff0c;通常基于以下几个考虑因素&#xff1a; 1. RESTful API 设计原则 查找操作使用 PathVariable GetMapping("/depts…

剧本杀小程序系统开发:开启沉浸式社交娱乐新纪元

在当今数字化浪潮席卷的时代&#xff0c;社交娱乐方式正经历着前所未有的变革。剧本杀&#xff0c;这一融合了角色扮演、推理悬疑与社交互动的线下娱乐项目&#xff0c;近年来迅速风靡全国&#xff0c;成为年轻人热衷的社交新宠。而随着移动互联网的蓬勃发展&#xff0c;剧本杀…

中线安防保护器,也叫终端电气综合治理保护设备为现代生活筑起安全防线

中线安防保护器&#xff08;Neutral Line Protection Device&#xff0c;简称NLPD&#xff09;是一种专门用于监测和保护电力系统中性线的安全装置。中线安防保护器的基本原理为:通过电流检测环节采集系统中性线上过电流信息&#xff0c; 经控制器快速计算并提取各次谐波电流的…

Spring Cloud Alibaba快速入门02-Nacos配置中心(下)

文章目录前言配置中心 - 数据隔离示例1.先创建命名空间2.创建配置3.克隆配置4.动态切换环境5.yml多文档模式spring.profiles.activedevspring.profiles.activetest总结前言 上一章简单了解了Nacos配置中心的基本用法&#xff0c;这一章将开始Nacos配置中心的实战案例。 配置中…

基于结构光相移法的三维重建

基于结构光相移法的三维重建程序 1. 介绍 结构光相移法是一种常用的三维重建技术&#xff0c;通过投射条纹图案并捕捉其变形来计算物体的三维形状。相移法通过多次投射不同相位的条纹图案&#xff0c;利用相位信息来提取物体表面的深度信息。 2. MATLAB实现 2.1 生成条纹图案 首…

机器学习10——降维与度量学习(K近邻、多维缩放、主成分分析)

上一章&#xff1a;机器学习09——聚类 下一章&#xff1a;机器学习11——特征选择与稀疏学习 机器学习实战项目&#xff1a;【从 0 到 1 落地】机器学习实操项目目录&#xff1a;覆盖入门到进阶&#xff0c;大学生就业 / 竞赛必备 文章目录一、k近邻学习&#xff08;kNN&#…

Js 图片加载完成 与 图片缓存加载的区别

这两个有什么区别// 图片加载完成后淡入$img.on(load, function () {$img.css(opacity, 1);});// 处理图片缓存情况if ($img[0].complete) {$img.css(opacity, 1);}要理解这两段代码的区别&#xff0c;需要先明确它们的核心作用场景和执行时机差异—— 本质是解决 “图片加载完…

国产化PDF处理控件Spire.PDF教程:如何在 Java 中通过模板生成 PDF

在企业级应用开发中&#xff0c;生成 PDF 文档是一项非常常见的需求。无论是发票、报告、合同&#xff0c;还是其他业务文档&#xff0c;开发人员通常都需要一种高效、稳定的方式来创建 PDF。与其逐行绘制 PDF 内容&#xff0c;不如直接利用 模板 ——常见的模板形式包括 HTML …