Logistic Loss Function|逻辑回归代价函数

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

一、逻辑回归代价函数的定义

逻辑回归的代价函数(又称交叉熵损失)用于评估模型预测结果与真实标签之间的差异。不同于线性回归的均方误差,它专门针对分类问题设计,能够有效惩罚“高置信度的错误预测”,同时鼓励模型输出更接近真实标签的概率值。

通俗理解

想象老师在批改判断题:

  • 如果学生非常自信地答错(比如写“绝对选A”,但正确答案是B),老师会狠狠扣分。

  • 如果学生答对但不太确定(比如写“可能是A”),老师会适当给分。

  • 如果学生答对且很确定(比如写“肯定选A”),老师会给满分。
    代价函数的作用类似——让模型为自己的“盲目自信”付出代价,同时奖励正确且确定的预测


二、平方误差 vs 逻辑回归:代价函数的设计差异与凸性对比

D9B60E6B-55D5-4B89-9F81-494CE6188D22.png

这张图片展示了平方误差代价函数(Squared error cost)及其相关概念,主要分为以下几个部分:

  1. 平方误差代价函数公式

    4A1A1FAD-3159-48F4-BC9F-8AAC89BCD657.png

    用于衡量线性回归模型的预测值与真实值之间的误差。

  2. 损失函数(loss)

    21573285-44D4-48BC-BABF-EE48D78BC093.png

    表示单个样本的误差。

  3. 线性回归模型

    C8C4B714-C5DC-44D2-802F-9FCBE07ACEF5.png

    这是一个线性预测函数。

  4. 凸性与非凸性

    • 线性回归的代价函数 f(w,b) 是凸函数(convex),保证梯度下降能找到全局最优解。

    • 如果直接对逻辑回归使用平方误差,代价函数可能非凸(non-convex),导致优化困难。

  5. 逻辑回归的预测函数

    612B2053-923B-4A8C-A7F7-352D6A203753.png

    这是一个Sigmoid函数,将线性输出映射到概率(0, 1)。

图片的核心对比了线性回归(平方误差)逻辑回归(需用交叉熵损失)在代价函数设计上的差异。


三、逻辑回归代价函数公式

49D8EDA0-2B7C-43FC-B934-19D23F566A76.png

E0826B26-E1B3-4B88-A544-744548A1C88D.png

CF3FC85B-876D-4ED3-92DF-72D712EF171D.png

  1. 分段定义
    损失函数 L 根据真实标签 y(i) 的取值(0 或 1)分段计算:

    • 若 y(i)=1,损失为 −log⁡(fW,b(x⃗(i)))。

    • 若 y(i)=0,损失为 −log⁡(1−fW,b(x⃗(i)))。

  2. 损失变化趋势

    • 当预测值 fW,b(x⃗(i)) 接近真实标签时(如 y(i)=1 且 f→1),损失趋近于 0。

    • 当预测值与真实标签相反时(如 y(i)=1 但 f→0),损失趋近于无穷大。

  3. 核心作用
    损失函数通过对数惩罚机制,迫使模型对错误预测(尤其是高置信度错误)付出更高代价,从而推动参数优化。

  4. 优化目标
    通过调整参数 w⃗,b 最小化代价函数 J,使模型预测 fw⃗,b(x⃗) 尽可能接近真实标签 y。


四、逻辑回归损失函数的两种表达形式及其统一化

9E1D859F-394E-41A4-BAF2-44EB4705F760.png

629884A2-BA9C-4BA9-8600-01719C3D3537.png

  1. 第一幅图

    • 展示了逻辑回归损失函数从分段形式统一形式的简化过程。

    • 分段形式(直观但冗长):

      • 当 y=1,损失为 −log⁡(f(x))

      • 当 y=0,损失为 −log⁡(1−f(x))

    • 统一形式(紧凑且通用):

      CA82C261-E6ED-46DC-A3C1-46C9DB343766.png

    • 通过数学技巧将两种情况合并为一个公式,便于计算和优化。

  2. 第二幅图

    • 将单样本的损失函数推广到整体代价函数(所有样本的平均损失)。

    • 公式:

      C790BD27-85EC-4B46-9E62-706B4E09F154.png

    • 强调该函数是凸函数(convex),保证梯度下降能找到全局最优解。

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/93185.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/93185.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络技术-知识篇(Day.1)

一、网络概述 1、网络的概念 两个不在同一地理位置的主机,通过传输介质和通信协议,实现通信和资源共享。 2、网络发展史 第一阶段(20世纪60年代) 标志性事件:ARPANET的诞生关键技术:分组交换技术 第二…

工业元宇宙:迈向星辰大海的“玄奘之路”

一、从认知革命到工业革命:文明跃迁的底层逻辑1.1 认知革命:人类协作的基石时间线:约7万年前,智人通过语言和想象力构建共同虚拟现实,形成部落协作模式。核心突破:虚构能力:创造神、国家、法律等…

9. React组件生命周期

2. React组件生命周期 2.1. 认识生命周期 2.1.1. 很多事物都有从创建到销毁的整个过程,这个过程称之为生命周期;2.1.2. React组件也有自己的生命周期,了解生命周期可以让我们在最合适的地方完成想要的功能2.1.3. 生命周期和生命周期函数的关系…

【单板硬件开发】关于复位电路的理解

阅读紫光同创供应商提供的FPGA单板硬件开发手册,发现复位电路他们家解释的很通俗易懂,所以分享一下。如下图,RST_N 是低有效的异步全芯片复位信号,一般外部连接电路有 3 种形式如图 3–2,可根据实际需要选择合适的电路…

《Unity Shader入门精要》学习笔记一

1、本书的源代码 https://github.com/candycat1992/Unity_Shaders_Book 2、第1章 Shader是面向GPU的工作方式 3、第2章 渲染流水线 Shader:着色器 渲染流水线:目标是渲染一张二维纹理,输入是一个虚拟摄像机、一些光源、一些Shader以及纹…

从零到一:TCP 回声服务器与客户端的完整实现与原理详解

目录 一、TCP 通信的核心逻辑 二、TCP 服务器编程步骤 步骤 1:创建监听 Socket 步骤 2:绑定地址与端口(bind) 步骤 3:设置监听状态(listen) 步骤 4:接收客户端连接&#xff08…

MyBatis-Plus核心内容

MyBatis-Plus MyBatis-Plus 是一个基于 MyBatis的增强工具,旨在简化开发过程,减少重复代码。它在MyBatis的基础上增加了CRUD操作封装,条件构造器、代码生成器等功能。 一、核心特性与优势 1. 核心特性 无侵入:只做增强不做改变&am…

计算机网络摘星题库800题笔记 第4章 网络层

第4章 网络层4.1 网络层概述题组闯关1.在 Windows 的网络配置中,“默认网关” 一般被设置为 ( ) 的地址。 A. DNS 服务器 B. Web 服务器 C. 路由器 D. 交换机1.【参考答案】C 【解析】只有在计算机上正确安装网卡驱动程序和网络协议,并正确设置 IP 地址信…

非root用户在linux中配置zsh(已解决ncurses-devel报错)

Zsh(Z Shell)是一款功能强大的交互式 Unix shell,以其高度可定制性和丰富的功能著称,被视为 Bash 的增强替代品。它支持智能补全、主题美化、插件扩展(如 Oh My Zsh 框架)、自动纠错、全局别名等特性&#…

《Foundations and Recent Trends in Multimodal Mobile Agents: A Survey》论文精读笔记

论文链接:https://arxiv.org/pdf/2411.02006 摘要 文章首先介绍了核心组件,并探讨了移动基准和交互环境中的关键代表性作品,旨在全面理解研究重点及其局限性。 接着,将这些进展分为两种主要方法: 基于提示的方法&a…

npm安装时一直卡住的解决方法

npm install 卡住通常是由于网络问题或缓存问题导致的。以下是几种解决方法: 方法1:清理npm缓存 npm cache clean --force npm install方法2:删除node_modules和package-lock.json重新安装 rm -rf node_modules package-lock.json npm instal…

[密码学实战]使用Java生成国密SM2加密证书等(四十三)

[密码学实战]使用Java生成国密SM2加密证书等(四十三) 本文将详细介绍如何通过Java代码生成符合国密标准的SM2加密证书,包括密钥对生成、证书扩展属性配置、PEM格式保存等关键步骤。 一. 运行结果示例 二. 国密算法与加密证书 国密算法(SM系列)是中国自主研发的密码算法体…

从零开始之stm32之CAN通信

从小白的视角了解并实现简单的STM32F103的CAN通信,直接上手。一、CAN协议简介CAN总线上传输的信息称为报文,当总线空闲时任何连接的单元都可以开始发送新的报文,有5种类型的帧:数据帧、遥控帧、错误帧、过载帧、帧间隔。数据帧有两…

Java 课程,每天解读一个简单Java之利用条件运算符的嵌套来完成此题:学习成绩>=90分的同学用A表示,60-89分之间的用B表示, * 60分以下

package ytr250812;/*题目:利用条件运算符的嵌套来完成此题:学习成绩>90分的同学用A表示,60-89分之间的用B表示,* 60分以下*/import java.util.Scanner;public class GradeEvaluator {public static void main(String[] args) …

Word XML 批注范围克隆处理器

该类用于处理 Word 文档(XML 结构)中被批注标记的文本范围, 实现指定内容的深度克隆,并将其插入到目标节点之后。 适用于在生成或修改 .docx 文件时复制批注内容块。/*** Word XML 批注范围克隆处理器* * 该类用于处理 Word 文档&…

MQTT:Java集成MQTT

目录Git项目路径一、原生java架构1.1 导入POM文件1.2 编写测试用例二、SpringBoot集成MQTT2.1 导入POM文件2.2 在YML文件中增加配置2.3 新建Properties配置文件映射配置2.4 创建连接工厂2.5 增加入站规则配置2.6 增加出站规则配置2.7 创建消息发送网关2.8 测试消息发送2.9 项目…

day 16 stm32 IIC

1.IIC概述1基于对话的形式完成,不需要同时进行发送和接收所以删掉了一根数据线,变成半双工2为了安全起见添加了应答机制3可以接多个模块,且互不干扰4异步时序,要求严格,发送过程中不能暂停,所以需要同步时序…

AMD KFD的BO设计分析系列 0:开篇

开启我始终不敢碰的GPU存储系列,先上个图把核心关系表达下,以此纪念。注:图中kfdm_mm误写,应该为kfd_mm,不修改了,请大家不要介意。

EUDR的核心内容,EUDR认证的好处,EUDR意义

近年来,全球森林退化问题日益严峻,毁林行为不仅加剧气候变化,还威胁生物多样性和原住民权益。为应对这一挑战,欧盟于2023年6月正式实施《欧盟零毁林法案》(EU Deforestation-free Regulation, EUDR)&#x…

数据分析专栏记录之 -基础数学与统计知识

数据分析专栏记录之 -基础数学与统计知识: 1、描述性统计 均值 data_set [10, 20, 30, 40, 50] mean sum(data_set)/len(data_set)np 里面的函数,对二维进行操作时, 默认每一列 mean1 np.mean(data_set) print(mean, mean1)s 0 for i…