【漫话机器学习系列】233.激活阈(Threshold Activation)

深度学习入门:了解“阈值激活函数”(Threshold Activation Function)

激活函数是神经网络中至关重要的一环。今天,我们通过一幅简单直观的手绘图,一起理解最早期也最基础的激活函数之一 —— 阈值激活函数(Threshold Activation Function)


1. 前言

在深度学习(Deep Learning)中,激活函数(Activation Function) 决定了神经网络每个神经元的输出形式。
没有激活函数,神经网络就只是一堆线性叠加,无法拟合复杂的非线性关系。

而在众多激活函数中,阈值激活函数(Threshold Activation Function) 是最早被提出的一种,它简单粗暴,却也奠定了后续复杂模型的基础。

今天,让我们从这幅生动的手绘图出发,深度理解阈值激活的本质。


2. 图像解读

这张图直观展示了阈值激活函数的特性:

  • 水平方向是输入(Input),表示神经元接收到的信号。

  • 垂直方向是输出(Output),表示神经元的激活结果。

可以看到:

  • 当输入 > 0 时,输出固定为 +1。

  • 当输入 < 0 时,输出固定为 -1。

  • 当输入 = 0 时,通常根据具体定义,输出可以是 1、-1 或 0,本图示意以 1 为例。

这种“跳变式”的输出特性,就是典型的硬阈值(Hard Threshold)行为


3. 数学表达式

阈值激活函数可以用简单的公式表示为:

或者在某些变种中:

其中,θ 是一个自定义的阈值(通常为 0)。


4. 背景与起源

  • 感知机(Perceptron) —— 1958年,Frank Rosenblatt 提出了世界上第一个神经网络模型:感知机。

  • 在感知机中,激活函数就是一个简单的阈值函数:加权求和后,大于某个阈值就激活为1,否则激活为-1。

  • 这种方式使得神经网络能够完成最简单的分类任务(如二分类问题)。

可以说,阈值激活函数是神经网络史上的第一代激活函数


5. 特点与优缺点

优点

  • 实现简单:仅需判断大小关系。

  • 计算快速:适合硬件直接实现。

  • 清晰明了:特别适合线性可分问题(如简单分类)。

缺点

  • 不可导:函数在 x=0 处不可导,无法直接用于反向传播(Backpropagation)训练。

  • 不连续:输出突然跳变,不利于梯度更新。

  • 信息量少:只有两个输出(+1 或 -1),表达能力有限。

这些缺点直接促成了后续更复杂激活函数(如 Sigmoid、ReLU、Tanh 等)的发展。


6. 应用场景

虽然在现代深度学习中,硬阈值激活已经很少直接使用,但它仍然在一些场景下非常有用:

  • 早期神经网络(如感知机)教学与演示

  • 硬件实现(如 FPGA、低功耗芯片),需要简单快速的决策逻辑。

  • 二分类任务中,粗略建模或快速实验

  • 神经形态计算(Neuromorphic Computing),模拟生物神经元开关行为。

此外,它作为一种概念模型,帮助人们直观理解激活函数的意义 —— 将连续的输入信号转化为离散的决策输出


7. 与现代激活函数的对比

特性阈值激活(Threshold)SigmoidReLU
是否可导部分可导
是否连续
输出范围{−1,1} 或 {0,1}(0,1)[0,+∞)
是否易于训练
典型应用感知机、简单分类早期神经网络现代深度学习

可以看到,随着神经网络规模扩大和应用复杂化,更平滑、可导的激活函数成为主流。


8. 总结

虽然阈值激活函数简单、粗糙,但它是神经网络发展的起点。
它让我们明白了一个基本概念:

神经网络不仅要加权输入,更需要通过非线性函数进行处理,才能模拟复杂的决策与认知过程。

了解它,就像了解一棵参天大树的根 —— 简单,却无比重要。


9. 参考资料

  • Rosenblatt, F. (1958). The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.

  • Ian Goodfellow, Yoshua Bengio, Aaron Courville. (2016). Deep Learning.

  • Chris Albon - Machine Learning Flashcards


尾声

如果你喜欢今天这篇文章,欢迎点赞、收藏、评论支持!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/79088.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/79088.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(4)python中jupyter lab使用python虚拟环境

1. 先了解IPython和IPyKernel简介 IPython 是一个功能强大的交互式 Python 解释器和开发环境。它提供了一种增强的 Python Shell,使得用户能够以交互的方式探索、分析和可视化数据。IPython 的名称来源于 "Interactive Python",体现了其交互式的特性。 IPyKernel 是…

nginx 配置要领

你提出的问题非常好&#xff01;确实在配置 WebSocket 代理时&#xff0c;proxy_pass 的 URL 处理需要特别注意。以下是关键解释和修正建议&#xff1a; 1. 原配置的问题分析 location /ws/ {proxy_pass http://fastapi-container:8000; # 会保留 /ws/ 前缀传递给后端 }这种配…

【AI】DeepSeek 流程图 / 时序图制作,Word 排版错乱问题,文字转直观图形

一&#xff1a;动态流程图 / 时序图制作&#xff08;DeepSeek Draw.IO&#xff09; 工具准备 DeepSeek&#xff08;AI 生成代码&#xff09;&#xff1a;官网&#xff08;免费&#xff09;Draw.IO&#xff08;可视化渲染&#xff09;&#xff1a;官网&#xff08;免费&#…

4. python3基本数据类型

Python3 中有六个标准的数据类型&#xff1a; Number&#xff08;数字&#xff09; String&#xff08;字符串&#xff09; List&#xff08;列表&#xff09; Tuple&#xff08;元组&#xff09; Set&#xff08;集合&#xff09; Dictionary&#xff08;字典&#xff09; Pyt…

WPF之TextBox控件详解

文章目录 1. TextBox概述2. 基本属性与功能3. 输入控制详解3.1 MaxLength3.2 AcceptsReturn3.3 AcceptsTab3.4 CharacterCasing3.5 IsUndoEnabled3.6 自定义输入限制 4. 文本选择与操作4.1 选择属性4.2 选择方法4.3 文本操作4.4 选择事件4.5 实现自定义文本处理功能 5. 滚动支持…

1.4 点云数据获取方式——结构光相机

图1-4-1结构光相机 结构光相机作为获取三维点云数据的关键设备,其工作原理基于主动式测量技术。通过投射已知图案,如条纹、点阵、格雷码等,至物体表面,这些图案会因物体表面的高度变化而发生变形。与此同时,利用相机从特定

【MATLAB第118期】基于MATLAB的双通道CNN多输入单输出分类预测方法

【MATLAB第118期】基于MATLAB的双通道CNN多输入单输出分类预测方法 一、双通道CNN简介 在深度学习领域&#xff0c;卷积神经网络&#xff08;CNN&#xff09;凭借其强大的特征提取能力&#xff0c;已成为图像识别、自然语言处理等任务的核心技术。传统单通道CNN在处理单一模态…

2025上海车展 | 移远通信推出自研NG-eCall QuecOpen方案,助力汽车安全新标准加速落地

4月29日&#xff0c;在2025上海国际汽车工业展览会期间&#xff0c;全球领先的物联网和车联网整体解决方案供应商移远通信宣布&#xff0c;正式发布自主研发的NG-eCall&#xff08;下一代紧急呼叫系统&#xff09;QuecOpen解决方案。 该方案凭借高度集成的软硬件协同设计&…

leetcode76

目录 803ms超时。。。。越改越超时。。。 一些纠缠 代码分析&#xff1a; 代码问题&#xff1a; 改进建议&#xff1a; 示例代码&#xff1a; The error message you’re seeing indicates that there is a reference binding to a null pointer in your code. This typ…

大数据应用开发和项目实战-Seaborn

一、Seaborn概述 Seaborn是基于Python数据可视化库Matplotlib开发的扩展库&#xff0c;专注于统计图形的绘制&#xff0c;旨在通过简洁的代码实现复杂数据的可视化&#xff0c;帮助用户更轻松地呈现和理解数据。其核心设计目标是简化统计可视化流程&#xff0c;提供高级接口和美…

数据科学与计算

Seaborn的介绍 Seaborn 是一个建立在 Matplotlib 基础之上的 Python 数据可视化库&#xff0c;专注于绘制各种统计图形&#xff0c;以便更轻松地呈现和理解数据。 Seaborn 的设计目标是简化统计数据可视化的过程&#xff0c;提供高级接口和美观的默认主题&#xff0c;使得用户…

深入浅出循环神经网络(RNN):原理、应用与实战

1、引言 在深度学习领域&#xff0c;循环神经网络&#xff08;Recurrent Neural Network, RNN&#xff09;是一种专门用于处理**序列数据**的神经网络架构。与传统的前馈神经网络不同&#xff0c;RNN 具有**记忆能力**&#xff0c;能够捕捉数据中的时间依赖性&#xff0c;广泛应…

广州创科——湖北房县汪家河水库除险加固信息化工程

汪家河水库 汪家河水库位于湖北省房县&#xff0c;建于1971年&#xff0c;其地利可谓是天公之作&#xff0c;东西二山蜿蜒起伏&#xff0c;山峰相连&#xff0c;峰峰比高&#xff0c;无有尽头&#xff0c;东边陡峭&#xff0c;西边相对平坦&#xff0c;半山腰有一条乡村道路&am…

C++日更八股--day2

### C sort 的底层原理 这里其实原来问的是你如何优化快速排序&#xff0c;但是我最初只以为是随机选择基准&#xff0c;但是很显然面试官对此并不满意 闲暇之际&#xff0c;看到一篇介绍sort的原理的文章&#xff0c;才知道原来如是也 1.快速排序&#xff1a;作为主要算法&…

UniApp 的现状与 WASM 支持的迫切性

UniApp 的现状与 WASM 支持的迫切性 点击进入免费1 UniApp 的现状与 WASM 支持的迫切性 点击进入免费版2 一、UniApp 的跨平台优势与性能瓶颈 UniApp 凭借“一次开发,多端发布”的核心理念,已成为跨平台开发的主流框架之一。然而,随着移动应用场景的复杂化(如 3D 渲染、音…

如何正确使用日程表

日程安排&#xff0c;是时间管理中非常重要的一项&#xff0c;也是不容易管好的一项。 日程安排&#xff0c;通常指放到日程表里的事情&#xff0c;一般来说&#xff0c;放到日程表的事情要符合以下几个特点&#xff1a; 01.明确具体时间段&#xff0c;比如是下午2点到下午三…

【Token系列】14|Prompt不是文本,是token结构工程

文章目录 14&#xff5c;Prompt不是文本&#xff0c;是token结构工程一、很多人写的是“自然语言”&#xff0c;模型读的是“token序列”二、Prompt写法会直接影响token结构密度三、token分布影响Attention矩阵的聚焦方式四、token数 ≠ 有效信息量五、Prompt结构设计建议&…

研发效率破局之道阅读总结(4)个人效率

研发效率破局之道阅读总结(4)个人效率 Author: Once Day Date: 2025年4月30日 一位热衷于Linux学习和开发的菜鸟&#xff0c;试图谱写一场冒险之旅&#xff0c;也许终点只是一场白日梦… 漫漫长路&#xff0c;有人对你微笑过嘛… 全系列文章可参考专栏: 程序的艺术_Once-Day…

CNN代码详细注释

import torch from torch import nn#定义张量x&#xff0c;它的尺寸是5x1x28x28 #表示了5个单通道28x28大小的数据 xtorch.zeros([5,1,28,28])#定义一个输入通道是1&#xff0c;输出通道是6&#xff0c;卷积核大小是5x5的卷积层 convnn.Conv2d(in_channels1,out_channels6,ker…

机器指标监控技术方案

文章目录 机器指标监控技术方案架构图组件简介Prometheus 简介核心特性适用场景 Grafana 简介核心特性适用场景 Alertmanager 简介核心特性适用场景 数据采集机器Node ExporterMySQL ExporterRedis ExporterES ExporterRocketMQ ExporterSpringcloud ExporterNacos 数据存储短期…