深度学习之损失函数

深度学习之损失函数

bicheng/2025/9/13 12:40:05/文章来源:https://blog.csdn.net/qq_23158477/article/details/151613883

深度神经网络由多层网络连接而成，网络连接处防止线性直接相关，采用非线性函数进行逐层隔离，真正实现每层参数的独立性，也就是只对本层提取到的特征紧密相关。因为如果是线性函数直接相连就成了一层中间网络了，只不过参数之间做变换，失去了深度学习的意义。
1.非线性函数的意义

每一层可以联想为一组正交基，可以理解成一个平面，平面通过非线性变换达到扭曲逼近拟合真实要求的曲面。这是基于目前通常的思路，一个平面上y=Wx +B变换后，再通过非线性进行扭曲成y=x*sin(x)(效果举例，不是真正就是这个函数).实现了逐层扭曲直至达到最终要求。

可不可以抛开第一步的正交基，直接用非平面内的非线性曲面来拟合本层任务的扭曲要求，有待进一步探索。

2.损失函数

输入数据->深度网络模型->输出数据，在这个数据流向里，数据最终经过n层网络的处理后，也就是多个函数变换后（有线性、也有非线性）得到一个输出值（不是数量1个），怎么判断输出值是不是我们想要的？那就是离真实值越接近越好。最直观的就是loss = |f(x)-y|,loss值太大后，我们要求反向逐层调整W,B的值，直至loss值比较小为止。

下面单独讲损失函数。

L1 LOSS

图中很明显在（0，0）点无导数，在其他位置导数是常数。优点是：导数常量不会梯度爆炸，就是不出现极大值。

L2 loss

也就是f=x*x的函数图形。

优点：函数曲线连续，处处可导，随着误差值的减小，梯度也减小，有利于收敛到最小值。缺点：当函数的输入值距离中心值较远的时候，使用梯度下降法求解的时候梯度很大，可能造成梯度爆炸。

3.Smooth L1 loss

公式如下：

Smooth L1 loss 结合了L1和L2的优点，高偏差时采用固定梯度防梯度爆炸，靠近精度需求时，采用可导方式，有效调参。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/bicheng/96715.shtml
繁体地址，请注明出处：http://hk.pswp.cn/bicheng/96715.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Oracle OCP认证考试题目详解082系列第32题

Oracle OCP认证考试题目详解082系列第32题

考察知识点：Oracle profiles（配置文件）英语题目 32.Which are two of the account management capabilities that can be configured using Oracle profiles? A.the number of days for which an account may be logged in to one or more sessions before it is locked…

阅读更多...

Docker 部署 MongoDB：单节点与副本集的最佳实践

Docker 部署 MongoDB：单节点与副本集的最佳实践

Docker 部署 MongoDB：单节点与复制集的企业级最佳实践引言：容器化有状态服务的范式转变第一部分：基础概念与生产环境考量1.1 核心 Docker 概念深度解析1.2 Volume vs. Bind Mount：生产环境抉择1.3 获取与验证官方镜像官方镜像默认…

阅读更多...

公司本地服务器上搭建部署的办公系统web项目网站，怎么让外网访问？有无公网IP下的2种通用方法教程

公司本地服务器上搭建部署的办公系统web项目网站，怎么让外网访问？有无公网IP下的2种通用方法教程

本地物理服务器计算机搭建部署应用包括网站等，然后在局域网内的访问外，还需要提供外地的连接访问，这是比较常见的跨网通信需求。如在家或在外访问公司内部办公系统网站，这就涉及内网IP和公网IP的转换，或域名的解析使用…

阅读更多...

整体设计之绪思维导图引擎之引认知系统之引认知系统之序认知元架构之6 拼句之1 （豆包助手之8）

整体设计之绪思维导图引擎之引认知系统之引认知系统之序认知元架构之6 拼句之1 （豆包助手之8）

摘要(AI生成)认知演进中交流句子所包含的信息描述框架 < i , j > ( m , n )本体论基础（数学约束）： n n元（维度）n次（层次）n个（方程）n场（场景&am…

阅读更多...

微软的两个调试器debugpy和python

微软的两个调试器debugpy和python

在生成launch.json文件时，新版本的python扩展解释器类型是debugpy，而不是就版本的type:python，那么两者的区别在哪？1. 历史演变背景（1）旧版（Python扩展 < 2021.09）使用 "typ…

阅读更多...

【连载2】C# MVC 自定义错误页设计：404/500 处理与 SEO 优化

【连载2】C# MVC 自定义错误页设计：404/500 处理与 SEO 优化

在开发ASP.NET MVC 应用时，自定义错误页是提升用户体验和 SEO 表现的重要环节。默认的错误页不仅不美观，还可能泄露技术细节，影响用户体验和搜索引擎排名。实现自定义错误页的完整代码配置 Web.config 自定义错误页在 ASP.NET 中&#…

阅读更多...

mcp解读——概述及整体架构

mcp解读——概述及整体架构

概念介绍什么是模型上下文协议 （MCP） MCP（模型上下文协议）是一种用于将 AI 应用程序连接到外部系统的开源标准。使用 MCP，Claude 或 ChatGPT 等人工智能应用程序可以连接到数据源（例如本地文件、数据库&a…

阅读更多...

AI 赋能云端运维：基于 MCP 协议深度集成 Codebuddy CLI 与腾讯云 Lighthouse 的实战全解

AI 赋能云端运维：基于 MCP 协议深度集成 Codebuddy CLI 与腾讯云 Lighthouse 的实战全解

摘要在云计算技术飞速演进的今天，服务器的管理与运维正经历着从传统手动操作、脚本自动化到智能化、对话式交互的深刻变革。本文将系统性地、全流程地展示如何将腾讯云 Lighthouse 轻量应用服务器与尖端的 AI 编程助手 Codebuddy CLI 进行深度集成。我们将从服务器…

阅读更多...

【Proteus仿真】【51单片机】教室灯光控制器设计

【Proteus仿真】【51单片机】教室灯光控制器设计

文章目录一、功能简介二、软件设计三、实验现象联系作者一、功能简介本项目使用Proteus8仿真51单片机控制器，使用LCD1602液晶、DS1302时钟模块、人体红外感应模块、开关LED指示灯、继电器、PCF8591 ADC模块、光敏传感器、按键模块等。主要功能： 系统运…

阅读更多...

成为一个年薪30W+的FPGA工程师是一种什么体验？

成为一个年薪30W+的FPGA工程师是一种什么体验？

FPGA（Field-Programmable Gate Array）是现场可编程门阵列，通过硬件描述语言设计电路，可实现并行计算，广泛应用于通信、人工智能、工业控制等领域。FPGA工程师的工作包括RTL设计、仿真验证、时序分析等。尽管并非所有公…

阅读更多...

ZooKeeper Java客户端与分布式应用实战

ZooKeeper Java客户端与分布式应用实战

1. ZooKeeper Java客户端实战 ZooKeeper应用开发主要通过Java客户端API连接和操作ZooKeeper集群，有官方和第三方两种客户端选择。 1.1 ZooKeeper原生Java客户端依赖引入 <dependency><groupId>org.apache.zookeeper</groupId><artifactId>…

阅读更多...

0303 【软考高项】项目管理概述 - 组织系统（项目型组织、职能型组织、矩阵型组织）

0303 【软考高项】项目管理概述 - 组织系统（项目型组织、职能型组织、矩阵型组织）

0303 【软考高项】项目管理概述 - 组织系统（项目型组织、职能型组织、矩阵型组织） 目录0303 【软考高项】项目管理概述 - 组织系统（项目型组织、职能型组织、矩阵型组织）一、基本概念二、职能型组织二、项目型组织三、矩阵型组织3…

阅读更多...

计算机视觉与模式识别前沿一览：2025年8月arXiv 热点研究趋势解析

计算机视觉与模式识别前沿一览：2025年8月arXiv 热点研究趋势解析

本推文分析了arXiv中Computer Vision and Patteren Recognition(计算机视觉与模式识别)领域2025年8月发布的近50篇论文的研究热点，旨在帮助读者快速了解近期领域内的前沿技术与研究方向。arXiv是全球最具影响力的开放电子预印本平台之一，由美国国家科学基…

阅读更多...

vim复制本地到linux服务器上，换行缩进过大，不对的问题

vim复制本地到linux服务器上，换行缩进过大，不对的问题

所搜的试了:setlocal shiftwidth? :setlocal tabstop? :setlocal expandtab? :setlocal softtabstop?" 设置为 4 个空格缩进 :setlocal shiftwidth4" 通常你会希望 tabstop 和 softtabstop 也保持一致 :setlocal tabstop4 :setlocal softtabstop4尝试完不起作用&…

阅读更多...

【小程序】微信小程序九宫格抽奖动画（完整版）

【小程序】微信小程序九宫格抽奖动画（完整版）

这是一个微信小程序九宫格抽奖页面的完整代码，包括 WXML、WXSS、JS 和 JSON。效果九宫格抽奖功能说明： 静态页面布局： 3x3 九宫格，中间是“立即抽奖”按钮，周围是奖品金额。抽奖动画： 点击“立即抽奖”…

阅读更多...

java类冲突

java类冲突

一、为什么会发生类冲突？ 在 Java 的类加载机制中，类的唯一性是由“类加载器类的全限定名”共同决定的。当你的项目依赖了多个 jar 包，这些 jar 包里有同名的类（包名和类名完全一样），但实现却不同。类加载器…

阅读更多...

GIT客户端配置支持中文

GIT客户端配置支持中文

环境：windows10、Git-2.42.0.2-64-bit.exe1. 问题描述客户端安装后，默认是不支持中文显示的，中文名的文件显示乱码，提交时打的标签内容也不支持中文显示。2. 解决新建Git全局配置文件，文件名为.gitconfig，内…

阅读更多...

Teable vs NocoDB 开源、在线协同多维表格大PK

Teable vs NocoDB 开源、在线协同多维表格大PK

文章目录 Teable 简介特性 docker-compose部署功能截图 NocoDB 简介 docker-compose部署功能截图总结 Teable 简介 Teable 是一款企业级高性能多维表格解决方案，通过无代码方式快速构建业务管理系统，支持私有部署和精细权限管理。官方文档特性 🚀 卓越性能轻松处…

阅读更多...

SQL专家云能做哪些事儿？

SQL专家云能做哪些事儿？

背景数据库是信息化的基石，支撑着整个业务系统，发挥着非常重要的作用，被喻为“IT的心脏”。因此，让数据库安全、稳定、高效地运行已经成为IT管理者必须要面对的问题。但是很多组织没有专业的DBA，数据库运维面临着极大的…

阅读更多...

Python 高效实现 Word 转 PDF：告别 Office 依赖

Python 高效实现 Word 转 PDF：告别 Office 依赖

在工作中，经常会遇到需要把 Word 文档转换成 PDF 的情况。比如生成报表、分发文档、或者做归档保存，PDF 格式在排版和跨平台显示上更稳定。传统的做法往往依赖 Microsoft Office 或 LibreOffice 等软件来完成转换，但在自动化环境（…

阅读更多...

最新文章