03 基于sklearn的机械学习-线性回归、损失函数及其推导

线性回归

分类的目标变量是标称型数据,回归是对连续型的数据做出预测。

一、标称型数据(Nominal Data)

标称型数据属于分类数据(Categorical Data) 的一种,用于描述事物的类别或属性,没有顺序或数值意义,仅用于区分不同的组别。

  1. 核心特征
  • 离散性:数据值是有限的、离散的类别,无法进行数学运算(如加减乘除)。
  • 无顺序性:类别之间没有高低、大小或先后顺序,彼此平等。
  • 标签化:通常用字符串或整数标签表示(如 “红色”“蓝色”,或用 0、1、2 代表不同类别),但标签的数值不具备实际意义。
  1. 常见例子
  • 性别:男 / 女
  • 颜色:红 / 黄 / 蓝
  • 职业:教师 / 医生 / 工程师
  • 学历:高中 / 本科 / 硕士(注意:学历若仅作为类别则是标称型,若强调顺序则是有序型数据,属于分类数据的另一种)

二、连续型数据(Continuous Data)

连续型数据是可以取无限多个数值的定量数据,通常用于衡量事物的数量或程度,具有数值意义和顺序性

连续型数据可直接参与数值计算,但为了提升模型效果,通常需要预处理:标准化/归一化/离散化

  1. 核心特征
  • 连续性:在一定范围内可以取任意值(理论上可无限细分),如身高 175cm、体重 62.5kg 等。
  • 可运算性:支持加减乘除等数学运算,且结果有实际意义(如身高差、体重和)。
  • 有序性:数值之间有明确的大小关系(如 180cm > 170cm)。
  1. 常见例子
  • 物理量:身高、体重、温度、时间
  • 统计量:收入、成绩、点击率、年龄(严格来说年龄可视为离散型,但通常按连续型处理)

线性回归

线性回归(Linear Regression)是监督学习中最基础的算法之一,用于建模自变量(特征或者X)与因变量(目标,y)之间的线性关系

需要预测的值:即目标变量,target,y

影响目标变量的因素:X1,X2...XnX_1,X_2...X_nX1,X2...Xn,可以是连续值也可以是离散值

因变量和自变量之间的关系:即模型,model

对于数学中的线性回归通常为数学公式,例如y=w**x+b,是完全对的,但是在现实生活中,预测的结果与实际结果不完全一致,因此机器学习中的线性回归的目的是通过拟合一条直线,使预测值尽可能地接近真实值。

在这里插入图片描述

损失函数

损失函数(Loss Function)是衡量模型预测错误程度的函数,定义为预测值与真实值之间的差异

假设: y=wx+by=wx+by=wx+b

x1,x2,x3...x_1,x_2,x_3...x1,x2,x3...带入进去 然后得出:

y1,=wx1+by_1^,=wx_1+by1,=wx1+b

y2,=wx2+by_2^,=wx_2+by2,=wx2+b

y3,=wx3+by_3^,=wx_3+by3,=wx3+b

在这里插入图片描述

将每个点的真实值与计算值的差值全部算出来

总误差(损失):

loss=(y1−y1,)2+(y2−y2,)2+....(yn−yn,)2{(y_1-y_1^,)^2}+{(y_2-y_2^,)^2}+....{(y_n-y_n^,)^2}(y1y1,)2+(y2y2,)2+....(ynyn,)2

总误差会受到样本点的个数的影响,样本点越多,该值就越大,所以我们可以对其平均化,求得平均值

这样就得到了损失函数:

eˉ=1n∑i=1n(yi−wxi−b)2\bar e = \frac{1}{n} \textstyle\sum_{i=1}^{n}(y_{i}-w x_{i} - b)^{2}eˉ=n1i=1n(yiwxib)2

线性回归的目标是找到最优参数 w,使总损失最小化

方法 1:解析解(最小二乘法)

通过对损失函数求导并令导数为 0,直接参数的解析解。

步骤 1:将预测值表示为矩阵形式

设特征矩阵为 X(含截距项时,首列全为 1),维度为 m X (n+1);

参数向量为 (w = (w_0, w_1, …, w_n)^T);

真实标签向量为 y=(y1,…,y**m)T。则预测值向量为: y’ = Xw

步骤 2:将总损失函数表示为矩阵形式

loss=12∣∣(XW−y)∣∣2求导:loss=\frac{1}{2}||(XW-y)||^2 求导:loss=21∣∣(XWy)2求导:

loss=12(XW−y)T(XW−y)loss=\frac{1}{2}(XW-y)^T(XW-y)loss=21(XWy)T(XWy)

loss=12(WTXT−yT)(XW−y)loss=\frac{1}{2}(W^TX^T-y^T)(XW-y)loss=21(WTXTyT)(XWy)

loss=12(WTXTXW−WTXTy−yTXW+yTy)loss=\frac{1}{2}(W^TX^TXW-W^TX^Ty-y^TXW+y^Ty)loss=21(WTXTXWWTXTyyTXW+yTy)

步骤 3:对 w 求导并令导数为 0

loss′=12(WTXTXW−WTXTy−yTXW+yTy)′loss'=\frac{1}{2}(W^TX^TXW-W^TX^Ty-y^TXW+y^Ty)'loss=21(WTXTXWWTXTyyTXW+yTy)

loss′=12(XTXW+(WTXTX)T−XTy−(yTX)T)loss'=\frac{1}{2}(X^TXW+(W^TX^TX)^T-X^Ty-(y^TX)^T)loss=21(XTXW+(WTXTX)TXTy(yTX)T)

loss′=12(XTXW+XTXW−XTy−XTy)loss'=\frac{1}{2}(X^TXW+X^TXW-X^Ty-X^Ty)loss=21(XTXW+XTXWXTyXTy)

loss′=12(2XTXW−2XTy)loss'=\frac{1}{2}(2X^TXW-2X^Ty)loss=21(2XTXW2XTy)

loss′=XTXW−XTyloss'=X^TXW-X^Tyloss=XTXWXTy

令导数loss′=0loss'=0loss=0

0=XTXW−XTy0=X^TXW-X^Ty0=XTXWXTy

XTXW=XTyX^TXW=X^TyXTXW=XTy

矩阵没有除法,使用逆矩阵转化

(XTX)−1(XTX)W=(XTX)−1XTy(X^TX)^{-1}(X^TX)W=(X^TX)^{-1}X^Ty(XTX)1(XTX)W=(XTX)1XTy

W=(XTX)−1XTyW=(X^TX)^{-1}X^TyW=(XTX)1XTy

方法 2:链式求导(梯度下降法)

XTXX^TXXTX不可逆(如特征存在多重共线性)或样本量极大时,解析解计算复杂,需用梯度下降法迭代求解:

内部函数是 f(W) = XW - y ,外部函数是 g(u) = 1/2 *u^2 ,其中 u = f(W) 。

外部函数的导数:
∂g∂u=u=XW−y \frac{\partial g}{\partial u} = u = XW - y ug=u=XWy
内部函数的导数:
∂f∂W=XT \frac{\partial f}{\partial W} = X^T Wf=XT
应用链式法则,我们得到最终的梯度:
∂L∂W=(∂g∂u)(∂f∂W)=(XW−y)XT \frac{\partial L}{\partial W} = \left( \frac{\partial g}{\partial u} \right) \left( \frac{\partial f}{\partial W} \right) = (XW - y) X^T WL=(ug)(Wf)=(XWy)XT

sklearn.linear_model.LinearRegression()

  • fit_intercept:是否计算此模型的截距(偏置)b, default=True

  • 属性

    • coef_ 回归后的权重系数w

    • intercept_ 偏置

from sklearn.linear_model import LinearRegression
import numpy as np
data=np.array([[0,14,8,0,5,-2,9,-3,399],[-4,10,6,4,-14,-2,-14,8,-144],[-1,-6,5,-12,3,-3,2,-2,30],[5,-2,3,10,5,11,4,-8,126],[-15,-15,-8,-15,7,-4,-12,2,-395],[11,-10,-2,4,3,-9,-6,7,-87],[-14,0,4,-3,5,10,13,7,422],[-3,-7,-2,-8,0,-6,-5,-9,-309]])
x = data[:,:-1]
y = data[:,-1]
# fit_intercept=True : 有w0
model = LinearRegression(fit_intercept=True)
# 训练
model.fit(x,y)# 查看参数
print(model.coef_)
# 查看w0
print(model.intercept_)
[ 3.41704677  9.64733333  9.96900258  0.49065266 10.67072206  4.5085292217.60894156 12.27111727]
18.18163864119797

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/91334.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/91334.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TTS语音合成|f5-tts语音合成服务器部署,实现http访问

p; 上篇文章分享了如何使用GPT-SoVITS实现一个HTTP服务器,并通过该服务器提供文本到语音(TTS)服务。今天,我们将进一步探讨如何部署另一个强大的TTS模型——f5-tts。这个模型在自然语音生成方面表现出色,具有高度的可…

【Golang】Go语言指针

Go语言指针 文章目录Go语言指针一、指针1.1、Go语言中的指针1.1.1、指针地址和指针类型1.1.2、指针取值1.1.3、空指针1.1.4、new和make1.1.5、new1.1.6、make1.1.7、new与make的区别一、指针 区别于C/C中的指针,Go语言中的指针不能进行偏移和运算,是安全…

EMC的一些简单常识

ESD测试比对 & 需要做到动作 试验: -780系统,板子直流地 和 PE连接(主板PE & DC-分开,但是前端板PE & DC-连接),只能承受1K接触放电。 -780系统,板子直流地 和 PE分开(主…

Day4||vue-计算属性

一.定义概念:基于现有的数据,计算出来的新属性。依赖的数据变化,自动重新计算。语法:声明需要放在computed的配置项中,一个计算属性对于一个函数。使用起来和普通属性一样使用{{计算属性名}}计算属性->可以将一段求…

编程算法在金融、医疗、教育、制造业等领域的落地案例

随着人工智能与大数据技术的迅猛发展,编程算法已从理论研究走向实际应用,在金融、医疗、教育、制造业等多个关键领域实现了深度落地。这些算法不仅提升了业务效率,还推动了行业智能化转型。本文将系统性地分析编程算法在四大核心领域的典型应…

vue npm install卡住没反应

install某个插件的时候,发现卡住不动,可以尝试以下解决方法 1.使用–verbose查看安装详情 npm install consola --verbose2.更换淘宝镜像(一般都是淘宝镜像正式过期问题) 查看当前镜像 npm config get registry更换淘宝镜像 第一种…

【Unity3D实例-功能-移动】角色移动-通过WSAD(CharacterController方式)

今天,我们就来聊聊如何在Unity中使用CharacterController组件,让角色能够灵活移动,在游戏世界里像风一样自由奔跑吧。废话不多说,走,让我们马上来一探究竟!目录:1.准备模型2.动画的处理3.为角色…

AI Agent开发学习系列 - langchain之LCEL(4):Memory

Memory的添加方式 from operator import itemgetterfrom langchain.memory import ConversationBufferMemory from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder from langchain_core.runnables import RunnableLambda, RunnablePassthrough from l…

向Coze学习,我们把这些工作流也开源了

要说现在最火的工作流是什么,那非视频工作流莫属了。我每天也都能接到不少咨询短视频工作流的需求。 这大半年来我们团队也制作和整理了超过 100 工作流,其中很大一部分都是现在最火的视频工作流。 为了向Coze开源致敬,这次我们斑码团队也决…

Git 从零开始:完整项目上传指南

一、准备工作 1. 安装 Git Windows:下载安装包macOS:在终端运行 brew install gitLinux: # Ubuntu/Debian sudo apt update && sudo apt install git# CentOS/Fedora sudo yum install git2. 配置用户信息(首次使用&am…

【AI】入门级提示词模板:适用于ChatGPT、文心一言等主流模型

入门级提示词模板:适用于 ChatGPT、文心一言等主流模型**在当下这个人工智能飞速发展的时代,ChatGPT、文心一言等主流大模型已经广泛地融入到我们的工作与生活当中。不管是创作文章、生成代码,还是进行数据分析、获取创意灵感,这些…

如何解决 undetected_chromedriver 启动慢问题

要解决 undetected_chromedriver 启动慢的问题,可以从以下几个方面优化配置和代码: 1. 指定本地 Chrome 二进制路径 避免自动搜索 Chrome 路径,直接指定位置: driver uc.Chrome(browser_executable_pathrC:\Program Files\Google…

Python 程序设计讲义(42):组合数据类型——元组类型:创建元组

Python 程序设计讲义(42):组合数据类型——元组类型:创建元组 目录Python 程序设计讲义(42):组合数据类型——元组类型:创建元组一、元组的特征二、创建元组1、使用圆括号&#xff0…

windows 设置 vscode 免密远程

我们可以使用 vscode ssh 进行远程编辑文件项目。也可以使用 ssh 密匙 来实现免密登录。 本人在本地windows系统有多个密匙,使用 D:\SPB_Data\.ssh\id_rsa_local 进行本地设备进行登录。 在 vscode ssh 配置文件中添加 IdentityFile 配置 Host 本地设备ipHostName …

ubuntu自动搭建Android平台NDK编译环境

sh setup_ndk_env.sh自动下载NDK并解压 提取Android平台工具链 验证Android工具链 设置工具链变量 export CROSS_TRIPLE=aarch64_linux_android export CROSS_ROOT=/home/ubuntu/${CROSS_TRIPLE} export ANDROID_NDK=${CROSS_ROOT} export AS=${CROSS_ROOT}/bin/llvm-as exp…

添加捕捉吸附标识(使用QT+OpenGL开发三维CAD)

捕捉吸附标识怎么画出来?在点吸附的时候能够展示吸附标识可以让用户更直观的看到当前捕捉点,从而更准确的进行设计和绘制。 效果视频见原文:添加捕捉吸附标识(使用QTOpenGL开发三维CAD) 16.Add snap label 鼠标捕捉吸…

元宇宙中的“虫洞“:技术实现、应用场景与未来挑战

一、技术定义与核心架构1.1 虫洞的元宇宙隐喻概念来源:虫洞在物理学中是连接不同时空的通道,而在元宇宙中,这一概念被引申为连接不同虚拟世界的跨平台协议。英伟达Omniverse平台通过USD(通用场景描述)实现了这一隐喻&a…

使用GIS中基于森林的分类与回归模型来估算房屋价值

“基于森林的分类与回归”,它可以帮助分析师有效地设计、测试和部署预测模型。 基于森林的分类与回归应用了 Leo Breiman 的随机森林算法,这是一种用于分类和预测的流行监督机器学习方法。该工具允许分析师轻松整合表格属性、基于距离的要素和解释栅格来…

《 java 随想录》| LeetCode链表高频考题

前言:这是专门针对java语言讲解的算法解析(题目顺序大致参考《代码随想录》)思维导图操作链表删除节点删除链表中 D 节点时,只需将其前驱节点 C 的 next 指针指向 D 的下一个节点 E。添加节点​先让 新节点 F 的 next 指针 指向 C…

学习嵌入式的第三十一天-数据结构-(2025.7.23)网络协议封装

今天的内容主要是网络协议以及常用工具的介绍。协议头与数据封包/拆包数据封包示例:MAC|IP|TCP|hello| ———————————— IP数据报IP头信息默认20字节常用网络测试工具telnetnetstatpingarpwiresharktcpdumpssh2secure crt工具安装命令sudo ufw disable sud…