机器学习—线性回归

一·线性回归

线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

相关关系:包含因果关系和平行关系

因果关系:回归分析【原因引起结果,需要明确自变量和因变量】

平行关系:相关分析【无因果关系,不区分自变量和因变量】

二·一元线性回归模型理论

一元线性回归模型表达式为:y=β0​+β1​x+ε

其中:

\beta0.\beta 1为模型参数,用于刻画自变量 x 与因变量 y 线性关系的截距和斜率 。\beta 1可以看成y=kx+b中的k而\beta 0则可以看看成b

\varepsilon为误差项,代表除线性因素外,由随机因素导致的误差 。

例子:

自变量:工资
因变量:贷款额度
工资到底能产生多大的影响呢?如何比较公平的评定工资的影响呢?

工资(x)贷款额度(y)
400010000
800012000
50008000
300010000
600015000
7000

三·多元线性回归模型


多元线性回归模型:

 y=β0​+β1​x1​+β2​x2​+ε

其中:

β0·β1·β2是模型参数。
\varepsilon是误差项。
误差项:除线性因素外的随机因素所产生的误差。

四·误差项分析


1. 误差项可以省略吗?
答:误差项不可省略,误差是必然产生的。并且由于产生了误差项,我们便可以基于误差的特点来进行对线性回归的参数估计的。
2. 误差项有什么特点?
答:独立同分布。
独立:每个样本点都是独立的;例:贷款,每个人与每个人之间是没有联系的,贷多少钱完全基于你的工资。
同分布:同分布就是我的这套估计体系是我人民银行的估计体系,每个人都是服从我的分布体系,不会使用别人的估计体系,也就是说每个样本点都处于同一个分布函数下。

3. 误差项满足高斯分布。
高斯分布:

又称为正态分布,概率密度函数为:

对参数问题的估计就转化成了对误差项的分析。
1. 期望为 0;
2. 方差相同,为\sigma ^{2}

\sigma控制正态分布图像的高矮

4·误差项分析

误差项分析
线性回归的转化:

y=\beta 0+\beta 1x1+\beta 2x2+\varepsilon

矩阵计算:

y=\beta 0x0+\beta 1x1+\beta 2x2+\varepsilon

其中x0是1,目的是写成矩阵

由于x为样本项,为列向量,所以此处对\beta参数进行转置,转为行向量,从而得到以下结果。

y^{(i)}=\beta _{T}X^{(i)}+\varepsilon ^{(i)} 其中T是右上标

矩阵计算——并行化计算 

误差项分析
预测值与误差的最终的真实结果:

误差项满足高斯分布:

将误差带入高斯分布:

五·极大似然估计

极大似然估计是根据样本推测参数的方法。核心是找使样本出现概率最大的参数值,即“最可能”生成该样本的参数。通过构建似然函数,求其最大值点得到估计,广泛用于统计推断。

极大似然估计

假设一个袋子里面有10个球,你抽了一次,发现是黑球;接着又抽了一次,发现又是黑球;在10 次之后,你发现有9次是黑球,1次是白球,那么请问袋子里面黑球有几个?白球有几个?

黑球:9/10*10=9个

白球:1/10*10=1个

前提:规律你不知道。 通过事实的数据结果 得到规律

事实发生的事情,一定是最大概率的结果。

六·似然函数求解

似然函数:
一条数据存在一个概率,每条数据都存在这样一个概率,那么总的概率最大该怎么办呢?

每个样本都是独立的,独立的概率最大,自然是连乘了

似然函数求解
可是连乘不好计算啊,怎么办呢?
对数似然函数:

化简得:

误差项分析
观察一下最终计算结果:

 

 目标函数:

 求\beta ^{/}=0式子=0的极小值

最小二乘法求解
目标函数:

求导结果:

偏导等于 0:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/917091.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/917091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot Admin 监控模块笔记-实现全链路追踪

一、概述Spring Boot Admin(SBA)是一个用于监控和管理 Spring Boot 应用程序的工具。它提供了一个 Web 界面,可以集中管理多个 Spring Boot 应用程序的健康状态、指标、日志、配置等信息。通过 SBA,你可以轻松地监控和管理你的微服…

容器化与Docker核心原理

目录 专栏介绍 作者与平台 您将学到什么? 学习特色 容器化与Docker核心原理 引言:为什么容器化成为云计算时代的基石? 容器化技术全景与Docker核心原理:从概念到实践 文章摘要 1. 引言:为什么容器化成为云计算…

掌握Python三大语句:顺序、条件与循环

PS不好意思各位,由于最近笔者在参加全国大学生电子设计大赛,所以最近会出现停更的情况,望大家谅解,比赛结束后我会加大力度,火速讲Python的知识给大家写完🎖️🎖️🎖️🎖…

JAVA结合AI

Java 与人工智能(AI)的结合正经历从技术探索到深度融合的关键阶段。以下从技术生态、应用场景、工具创新、行业实践及未来趋势五个维度展开分析,结合最新技术动态与企业级案例,揭示 Java 在 AI 时代的独特价值与发展路径。一、技术…

本土DevOps平台Gitee如何重塑中国研发团队的工作流

本土DevOps平台Gitee如何重塑中国研发团队的工作流 在数字化转型浪潮席卷各行各业的当下,软件开发效率已成为企业竞争力的核心指标。Gitee DevOps作为专为中国开发团队打造的本土化研发管理平台,正在改变国内技术团队的工作方式。该平台通过从代码管理到…

5G MBS(组播广播服务)深度解析:从标准架构到商用实践

一、MBS技术背景与核心价值 1.1 业务需求驱动 随着超高清视频(4K/8K)、多视角直播、XR元宇宙应用爆发式增长,传统单播传输面临带宽浪费(相同内容重复发送)与拥塞风险(万人并发场景)的双重挑战。5G MBS通过点对多点(PTM)传输实现内容一次发送、多终端接收,频谱效率提…

如何将照片从 realme 手机传输到电脑?

对于 realme 用户来说,将照片传输到电脑可以有多种用途,从释放设备空间到在单独的存储设备上创建备份。这个过程不仅有助于高效管理设备内存,还可以让您利用电脑上强大的照片编辑软件进行高级增强和创意项目。了解如何将照片从 realme 手机传…

Centos 7部署.NET 8网站项目

简介 本文详细介绍了在CentOS 7系统上部署.NET 8网站项目的完整流程,主要内容包括:系统版本更新与检查、PostgreSQL数据库的安装配置(含防火墙设置、数据库初始化及远程访问配置)、Nginx Web服务的安装与防火墙配置。文章通过分步…

Windows 11下IDEA中使用git突然变得卡慢及解决办法

1. 表象 使用idea的git进行update、commit、push等操作时,极度卡慢。需等待几十秒到几分钟。修改文件后,git刷新也不及时。update命令有时候无法点击。 2.解决方法 停止PC Manager ServiceCtrl shift esc : 打开任务管理器找到服务: 服务中…

MyBatis 的两级缓存机制

现实分布式项目中会不会开启mybatis的二级缓存? 在分布式项目中,是否开启MyBatis的二级缓存需结合具体场景和技术方案综合评估。 以下是关键考量因素: 一、默认二级缓存的局限性 隔离性问题:MyBatis默认的二级缓存基于HashMap实…

分布式原子序列(Distributed Atomic Sequence)

这段内容是关于 Apache Ignite 中的 分布式原子序列(Distributed Atomic Sequence),也就是一个分布式 ID 生成器。我们来一步步深入理解它的原理、用途和使用方式。🔹 一、核心概念:什么是分布式 ID 生成器&#xff1f…

VSCode——插件分享:Markdown PDF

该插件可以将markdown编写内容转成PDF。 ✅ 支持渲染图表、代码高亮、表格等 Markdown 内容 安装 Visual Studio Code安装插件:Markdown PDF 打开扩展商店,搜索 Markdown PDF 并安装 打开你的 .md 文件右键 → 点击 Markdown PDF: Export (pdf)自动生成 …

rust-模块树中引用项的路径

模块树中引用项的路径 为了告诉 Rust 在模块树中如何找到某个项,我们使用路径,就像在文件系统中导航时使用路径一样。要调用一个函数,我们需要知道它的路径。 路径有两种形式: 绝对路径是从 crate 根开始的完整路径&#xff1b…

mac n切换node版本报错Bad CPU type in executable

该node版本仅支持intel芯片,不支持Apple 芯片(M1/M2/M3/M4),所以需要下载Rosetta 2 ,让node可以在搭载 Apple 芯片的 Mac 上运行。 env: node: Bad CPU type in executable /opt/homebrew/bin/n: line 753: /usr/local…

经典算法之美:冒泡排序的优雅实现

经典算法之美:冒泡排序的优雅实现基本概念工作原理介绍具体实现代码实现总结基本概念 冒泡排序是一种简单的排序算法,通过重复比较相邻的元素并交换它们的位置来实现排序。它的名称来源于较小的元素像气泡一样逐渐“浮”到数组的顶端。 工作原理 介绍…

click和touch事件触发顺序 糊里糊涂解决的奇怪bug

问题详情 在嵌入式硬件设备里,测试 “点击input密码框,弹出第三方自带键盘,点击密码框旁的小眼睛,切换输入内容加密状态,键盘收起/弹出状态不变” 的功能逻辑;实际情况却是 “点击键盘或input框之外的任何地…

【0基础PS】Photoshop (PS) 理论知识

目录前言一、Photoshop 核心概念与定位​二、图像基础理论​三、图层理论:PS 的核心工作机制​四、选区与蒙版​五、调色核心理论​六、常用文件格式​学习建议​总结前言 在数字图像编辑领域,Photoshop(简称 PS)无疑是行业标杆级…

数据库 设计 pdm comment列表显示和生成建表sql

按如下步骤 生成见建表语句 comment非空使用comment 生成字段注释, 空的时候使用name 生成字段注释 sql脚本模板编辑 参考 PowerDesigner生成mysql字段comment 注释-腾讯云开发者社区-腾讯云 版本不同这边的设置不同 这个勾打上

嵌入式基础知识复习(C语言)

知识扩展7.28 嵌入式产品特点、开发环境、计算机组成、Linux终端初识1、嵌入式产品。特点:低功耗、根据用户需求定制。硬件:arm处理器。软件:Linux操作系统arm架构:精简指令集、低功耗(移动/嵌入式)。 …

LeetCode Hot 100 寻找两个正序数组的中位数

给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。算法的时间复杂度应该为 O(log (mn)) 。示例 1:输入:nums1 [1,3], nums2 [2] 输出:2.00000 解释&#x…