人工智能系列(6)如何开发有监督神经网络系统?

一. 开发有监督神经网络系统的步骤

1. 数据收集

训练数据通常由输入–输出成对组成,根据任务需求可能涵盖不同情境(如白天或夜晚的车辆识别),其类型可以是数值、图像、音频等多种形式;数据规模越大、越多样,模型就越有机会学习到有效规律并具备更好的泛化能力。

2. 选择合适的ANN模型

  1. 线性问题:使用线性模型,如感知机(Perceptron)、ADALINE。
  2. 非线性问题:使用多层感知机(MLP)等非线性网络。

3. 决定输入与输出神经元的数量

输入层:与输入特征数一致。

输出层

i.优化任务:与目标参数数目一致。

ii.分类任务:与类别数相关(如2类用1或2个输出节点;3类可用2或3个节点)。

iii.逼近问题:与拟合参数数量一致。

4. 确定最佳输入维度

确定输入维度时,如果输入特征过少,模型获取的信息不足,容易导致学习能力受限、无法有效解决问题;而特征过多则可能引入较强的共线性,使模型在训练集上表现很好但在新数据上泛化能力差。为了在保留关键信息的同时降低冗余与相关性,可采用主成分分析(PCA)、判别分析(DA)等降维与去相关方法,从而提升模型的稳健性和泛化性能。

5. 选择合适的训练算法

算法

特点

GD(梯度下降)

学习慢,收敛稳

GD + 动量

学习快,但可能不收敛

Levenberg-Marquardt (LM)

分类效果好,收敛稳

Bayesian Regularization (BR)

非常慢,但性能优于 LM

Scaled Conjugate Gradient (SCG)

快,但稳定性差

Resilient BP

效果依问题而定

6. 选择激活函数

在人工神经网络中,不同层通常选用不同的激活函数以适应各自的功能需求:输入层一般使用线性激活函数,以便直接传递原始特征信息;隐藏层常采用连续且可微的非线性函数(如 sigmoid 函数),以增强模型对复杂模式的表达能力;输出层的激活函数则取决于任务类型:1)在分类任务中常用 sigmoid、阶跃(step)或符号(sign)函数来实现类别判定,2)在回归或函数逼近任务中则多使用线性函数,以便直接输出连续数值结果。

二、ANN的训练过程(TRAINING PROCESS)

i.核心目标:

  1. 优化权重:通过训练不断调整权重,直到输出误差达到满意程度。
  2. 确定网络结构:合理配置输入/隐藏/输出层的神经元数量。

ii.如何确定最佳隐藏神经元数量?

隐藏层神经元数量的选择直接影响神经网络的学习能力与泛化性能:如果隐藏层神经元过少,模型表达能力不足,难以有效学习复杂模式;而隐藏层神经元过多则容易导致过拟合,使模型在新数据上的泛化能力下降。为了找到最佳配置,可采用网络生长法(growing),从较少的神经元开始逐步增加,直到性能不再提升;或使用网络修剪法(pruning),先设定较多神经元再逐步减少,保留最优结构。在多层感知机(MLP)中,还可以通过引入多个隐藏层来分层提取特征,从而更高效地处理复杂任务。

iii.局部最小陷阱 vs 全局最小的概念

在神经网络训练中,我们的目标是通过调整权重找到全局最小点,即误差曲面上最低的位置,从而使模型在训练和新数据上都能有最佳表现;然而,复杂的误差曲面往往存在多个局部最小点,训练过程可能会被困在这些位置,导致性能不佳。可以将其比作一次从起点 A 出发前往终点 B 的旅程,全局最小点是目的地,而局部最小点则像途中因车辆故障、疾病等被迫停留的地方,看似到达了低谷,但并非最终的最佳位置。

三、停止训练的条件(WHEN TO STOP TRAINING)

i. Epoch 数:当训练迭代次数达到预先设定的最大值时停止。

ii. 误差目标:当训练误差达到或低于设定的阈值时停止。

iii. 梯度值:当梯度下降到小于设定值时停止,表示权重更新已趋于平稳。

iv. 验证误差:当验证集误差连续多次迭代不再改善时停止,以防止过拟合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/92687.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/92687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS 选择器进阶:用更聪明的方式定位元素

在前端开发中,CSS 选择器是我们与 DOM 对话的语言。虽然 class 和 id 是我们最熟悉的工具,但真正高效、优雅的样式代码,往往来自于对现代 CSS 选择器的深入理解与巧妙运用。本文将带你跳出基础语法,探索那些能显著提升开发效率和代…

常用排序方法

一、排序的概念及引用1、排序的概念排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录&…

接口返回504 Gateway Time-out 错误,这意味着请求在网关或代理服务器等待上游服务器响应时超时。以下是可能的原因和排查建议:

问题分析1.后端处理耗时过长是某个方法执行时间过长,超过了网关的超时设置(通常是几十秒)可能涉及大量数据查询或复杂计算2.数据库查询性能问题查询的数据量过大缺少必要的数据库索引SQL语句执行效率低下排查建议1.检查服务端日志查看应用日志…

DBAPI 实现不同角色控制查看表的不同列

DBAPI 实现不同角色控制查看表的不同列 场景说明 在数据库管理系统中,对表进行列级别的权限控制是一项关键的安全措施,特别是在处理敏感数据或需要遵守特定数据访问控制策略的情况下。合理的列权限控制不仅能保护敏感信息,还能帮助组织满足合…

二维图像处理(完整版)

目录 1.变换矩阵 2.在矩阵的基础上添加各种变换形式 3.开始变换 4.计算变换矩阵参数 新算子 二、阈值分割 新算子 三、blob分析案例 1.焊点 2.石头 3.木材 4.车牌 5.骰子 新算子 四、傅里叶变换频域分析 问题一 五、滤波处理 1.均值滤波 2.中值滤波 3.高斯…

计算机网络:求地址块128.14.35.7/20中的相关信息

128.14.35.7/20是某一地址块,求该地址块中的网络地址,IP地址最大值,最小值,地址数 这里的最大值:广播地址,最小值:网络地址,地址数:可分配主机数 最关键的一步就点分十进…

3深度学习Pytorch-神经网络--全连接神经网络、数据准备(构建数据类Dataset、TensorDataset 和数据加载器DataLoader)

文章目录一、深度学习概述二、神经网络基础人工神经网络(ANN)基本结构神经网络的构建全连接神经网络(FCN)计算步骤基本组件1. 线性层组件2. 激活函数(Activation Function)3. 损失函数(Loss Fun…

MyEclipse启动OutOfMemoryError内存溢出

java.lang.OutOfMemoryError:Java heap space打开setting,搜索heap,compiler heap sizejava.lang.OutOfMemoryError:insufficient memory①点击file,选择Invalidate Caches ②点击file->Build,Excetion,Deployment-…

java毕业设计实例-基于springboot的校园资讯分享平台的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

手写 Spring

01 - 原始版本的 IOC 容器 IOC 容器的作用是自动创建对象&#xff0c;降低系统间的耦合度 core public interface Resource extends Iterator<Object>{ }外部的配置信息都当成 Resource (资源)来进行抽象 public class ClassPathXmlResource implements Resource {Docume…

【物联网】基于树莓派的物联网开发【24】——树莓派安装influxDB时序数据库

使用背景 聚焦大数据底层技术软件研发&#xff0c;实现时序数据采集、写入、存储、查询、分析 场景介绍 用于存储和分析时间序列数据的开源数据库 安装 InfluxDB 添加 InfluxDB 的仓库&#xff1a; wget -qO- https://repos.influxdata.com/influxdb.key | sudo apt-key add - …

Python 程序设计讲义(68):Python 的文件操作——使用os模块操作文件

Python 程序设计讲义&#xff08;68&#xff09;&#xff1a;Python 的文件操作——使用os模块操作文件 目录Python 程序设计讲义&#xff08;68&#xff09;&#xff1a;Python 的文件操作——使用os模块操作文件一、删除文件&#xff1a;使用os.remove()函数二、重命名文件与…

uni-app 网络请求终极选型:uni.request、axios、uni-network、alova 谁才是你的真命请求库?

还在 uni-app 里手写 uni.request 然后自己封装到怀疑人生&#xff1f; 想用 axios 却担心小程序 2 MB 主包瞬间爆炸&#xff1f; 面对 alova、uni-network、axios 一脸懵&#xff0c;不知道选哪个才不踩坑&#xff1f; 这篇一次讲透 4 大主流方案优缺点、适用场景和避坑指南&a…

2G内存的服务器用宝塔安装php的fileinfo拓展时总是卡死无法安装成功的解决办法

临时加大 Swap&#xff08;4G&#xff09; fallocate -l 4G /swapfile2 chmod 600 /swapfile2 mkswap /swapfile2 swapon /swapfile2 free -h确认现在有了足够的 swap&#xff08;总内存 swap 应该达到 6G&#xff09;&#xff1a; free -h编译 fileinfo 扩展&#xff08;只用…

DAY 41 简单CNN

知识回顾 数据增强卷积神经网络定义的写法batch归一化&#xff1a;调整一个批次的分布&#xff0c;常用与图像数据特征图&#xff1a;只有卷积操作输出的才叫特征图调度器&#xff1a;直接修改基础学习率 卷积操作常见流程如下&#xff1a; 1. 输入 → 卷积层 → Batch归一化层…

Flink 2.1 SQL:解锁实时数据与AI集成,实现可扩展流处理

摘要&#xff1a;本文整理自阿里云的高级技术专家、Apache Flink PMC 成员李麟老师在 Flink Forward Asia 2025 新加坡[1]站 —— 实时 AI 专场中的分享。将带来关于 Flink 2.1 版本中 SQL 在实时数据处理和 AI 方面进展的话题。Tips&#xff1a;点击「阅读原文」跳转阿里云实时…

运维巡检单(文档)

1 运维巡检表格 1.1 每日巡检记录单 1.2 周巡检报告 1.3 季度巡检报告 1.4 远程服务记录单 1.5 现场维护记录单 1.6 现场运维巡检服务单 1.7 服务器巡检记录 1.8 网络设备巡检记录 1.9 视频会议系统检测表 1.10 机房巡检报告 1.11 运维服务统计表 1.12 运维服务交接…

BLDC直流无刷电机工作原理

1.介绍什么是BLDC&#xff1f;BLDC&#xff08;Brushless Direct Current Motor&#xff0c;无刷直流电机&#xff09;是一种采用电子换向替代传统机械电刷和换向器的直流电机&#xff0c;兼具直流电机的调速性能和交流电机的结构优势在这之前我们先了解一般电机的分类以及直流…

Rust 实战四 | Traui2+Vue3+Rspack 开发桌面应用:通配符掩码计算器

往期回顾 Rust 实战三 | HTTP 服务开发及 Web 框架推荐Rust 实战二 | 开发简易版命令行工具 grepRust 实战一 | 用 RustRover 开发猜数字游戏Rust 安装与版本更新 代码开源地址&#xff1a;https://github.com/0604hx/rust-journey、通配符掩码计算器 学习一门编程语言&#…

大型语言与进化算法潜在研究方向与挑战

[1] WANG C, ZHAO J, JIAO L, 等. When Large Language Models Meet Evolutionary Algorithms: Potential Enhancements and Challenges[A/OL]. arXiv, 2025[2025-08-07]. http://arxiv.org/abs/2401.10510. DOI:10.48550/arXiv.2401.10510. 这篇文章《当大型语言模型遇到进化算…