深度学习和神经网络的介绍

一.前言

本期不涉及任何代码,本专栏刚开始和大家介绍了一下机器学习,而本期就是大家介绍一下深度学习还有神经网络,作为一个了解就好。

二.深度学习

2.1 什么是深度学习?

在介绍深度学习之前,我们先看下⼈⼯智能,机器学习和深度学习之间的关系:

机器学习是实现⼈⼯智能的⼀种途径,深度学习是机器学习的⼀个⼦集,也就是说深度学习是实现机器学习 的⼀种⽅法。与机器学习算法的主要区别如下图所示:

 

传统机器学习算术依赖⼈⼯设计特征,并进⾏特征提取,⽽深度学习⽅法不需要⼈⼯,⽽是依赖算法⾃动提 取特征。深度学习模仿⼈类⼤脑的运⾏⽅式,从经验中学习获取知识。这也是深度学习被看做⿊盒⼦,可解释性差的原因。 

随着计算机软硬件的⻜速发展,现阶段通过深度学习来模拟⼈脑来解释数据,包括图像,⽂本,⾳频等内 容。⽬前深度学习的主要应⽤领域有:

1. 语⾳识别

2. 机器翻译

3. ⾃动驾驶 

当然在其他领域也能⻅到深度学习的身影,⽐如⻛控,安防,智能零售,医疗领域,推荐系统等。

2.2 发展历史 

深度学习其实并不是新的事物,深度学习所需要的神经⽹络技术起源于20世纪50年代,叫做感知机。当时 也通常使⽤单层感知机,尽管结构简单,但是能够解决复杂的问题。后来感知机被证明存在严重的问题,因 为只能学习线性可分函数,连简单的异或(XOR)等线性不可分问题都⽆能为⼒,1969年Marvin Minsky写了 ⼀本叫做《Perceptrons》的书,他提出了著名的两个观点:1.单层感知机没⽤,我们需要多层感知机来解 决复杂问题 2.没有有效的训练算法。

20世纪80年代末期,⽤于⼈⼯神经⽹络的反向传播算法(也叫Back Propagation算法或者BP算法)的发 明,给机器学习带来了希望,掀起了基于统计模型的机器学习热潮。这个热潮⼀直持续到今天。⼈们发现, 利⽤BP算法可以让⼀个⼈⼯神经⽹络模型从⼤量训练样本中学习统计规律,从⽽对未知事件做预测。这种 基于统计的机器学习⽅法⽐起过去基于⼈⼯规则的系统,在很多⽅⾯显出优越性。这个时候的⼈⼯神经⽹络,虽也被称作多层感知机(Multi-layer Perceptron),但实际是种只含有⼀层隐层节点的浅层模型。 

2006年,杰弗⾥·⾟顿以及他的学⽣鲁斯兰·萨拉赫丁诺夫正式提出了深度学习的概念。

2012年,在著名的ImageNet图像识别⼤赛中,杰弗⾥·⾟顿领导的⼩组采⽤深度学习模型AlexNet⼀举夺冠。AlexNet采⽤ReLU激活函数,从根本上解决了梯度消失问题,并采⽤GPU极⼤的提⾼了模型的运算速度。 

同年,由斯坦福⼤学著名的吴恩达教授和世界顶尖计算机专家Je! Dean共同主导的深度神经⽹络——DNN 技术在图像识别领域取得了惊⼈的成绩,在ImageNet评测中成功的把错误率从26%降低到了15%。深度学 习算法在世界⼤赛的脱颖⽽出,也再⼀次吸引了学术界和⼯业界对于深度学习领域的关注。 

2016年,随着⾕歌公司基于深度学习开发的AlphaGo以4:1的⽐分战胜了国际顶尖围棋⾼⼿李世⽯,深度学 习的热度⼀时⽆两。后来,AlphaGo⼜接连和众多世界级围棋⾼⼿过招,均取得了完胜。这也证明了在围棋界,基于深度学习技术的机器⼈已经超越了⼈类 

 

2017年,基于强化学习算法的AlphaGo升级版AlphaGo Zero横空出世。其采⽤“从零开始”、“⽆师⾃通”的 学习模式,以100:0的⽐分轻⽽易举打败了之前的AlphaGo。除了围棋,它还精通国际象棋等其它棋类游戏,可以说是真正的棋类“天才”。此外在这⼀年,深度学习的相关算法在医疗、⾦融、艺术、⽆⼈驾驶等多 个领域均取得了显著的成果。所以,也有专家把2017年看作是深度学习甚⾄是⼈⼯智能发展最为突⻜猛进 的⼀年。 

2019年,基于Transformer 的⾃然语⾔模型的持续增⻓和扩散,这是⼀种语⾔建模神经⽹络模型,可以在 ⼏乎所有任务上提⾼NLP的质量。Google甚⾄将其⽤作相关性的主要信号之⼀,这是多年来最重要的更新。 

2020年,深度学习扩展到更多的应⽤场景,⽐如积⽔识别,路⾯塌陷等,⽽且疫情期间,在智能外呼系 统,⼈群测温系统,⼝罩⼈脸识别等都有深度学习的应⽤。 

三.神经网络

3.1 什么是神经网络? 

⼈⼯神经⽹络( Arti!cial Neural Network, 简写为ANN)也简称为神经⽹络(NN),是⼀种模仿⽣物神经⽹络结构和功能的 计算模型。⼈脑可以看做是⼀个⽣物神经⽹络,由众多的神经元连接⽽成。各个神经 元传递复杂的电信号,树突接收到输⼊信号,然后对信号进⾏处理,通过轴突输出信号。下图是⽣物神经元示意图: 

 

当电信号通过树突进⼊到细胞核时,会逐渐聚集电荷。达到⼀定的电位后,细胞就会被激活,通过轴突发出电信号。 

3.2 人工神经网络 

那怎么构建⼈⼯神经⽹络中的神经元呢? 

 

这个流程就像,来源不同树突(树突都会有不同的权重)的信息, 进⾏的加权计算, 输⼊到细胞中做加和,再通过激活函数输出细胞值。 

接下来,我们使⽤多个神经元来构建神经⽹络,相邻层之间的神经元相互连接,并给每⼀个连接分配⼀个强度,如下图所示: 

 

神经⽹络中信息只向⼀个⽅向移动,即从输⼊节点向前移动,通过隐藏节点,再向输出节点移动。其中的基本部分是: 

1. 输⼊层: 即输⼊ x 的那⼀层 

2. 输出层: 即输出 y 的那⼀层

3. 隐藏层: 输⼊层和输出层之间都是隐藏层 

特点是:

同⼀层的神经元之间没有连接。 第 N 层的每个神经元和第 N-1层 的所有神经元相连(这就是full connected的含义), 第N-1层神经元的输出就是第N层神经元的输⼊。每个连接都有⼀个权值。 

四.总结 

本章节主要是介绍了一下深度学习和神经网络的发展史和概念,大家做个了解,理解一下就来开始接下来的学习。 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/89354.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/89354.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI驱动的软件工程(下):AI辅助的质检与交付

📚 系列文章导航 AI驱动的软件工程(上):人机协同的设计与建模 AI驱动的软件工程(中):文档驱动的编码与执行 AI驱动的软件工程(下):AI辅助的质检与交付 大家好…

【WRFDA实操第一期】服务器中安装 WRFPLUS 和 WRFDA

目录在服务器上下载并解压 WRF v4.6.1编译 WRFDA 及相关库安装和配置所需库安装 WRFPLUS 和 WRFDA 以运行 4DVAR 数据同化一、安装 WRFPLUS(适用于 WRF v4.0 及以上版本)二、安装 WRFDA(用于 4DVAR)WRFDA 和 WRFPLUS 的安装说明另…

【机器学习【6】】数据理解:数据导入、数据审查与数据可视化方法论

文章目录一、机器学习数据导入1、 Pandas:机器学习数据导入的最佳选择2、与其他方法的差异二、机器学习数据理解的系统化方法论1、数据审查方法论:六维数据画像技术维度1:数据结构审查维度2:数据质量检查维度3:目标变量…

AI炼丹日志-30-新发布【1T 万亿】参数量大模型!Kimi‑K2开源大模型解读与实践

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) AI炼丹日志-29 - 字节跳动 DeerFlow 深度研究框斜体样式架 私…

如何关闭Elasticsearch的安全认证的解决方法

在Elasticsearch 中,启动之后,需要输入用户名和密码,才可以访问,在测试环境中,很不方便,本章教程,主要介绍如何关闭Elasticsearch 的安全认证。在 Elasticsearch 8.x / 9.x 中,默认是…

day051-ansible循环、判断与jinja2模板

文章目录0. 老男孩思想-男女性需求差异1. 手动指定客户机密码2. 批量更新主机名2.1 hostname模块2.2 添加主机清单变量2.3 编写批量修改主机名剧本2.4 修改hosts文件2.5 分发hosts文件剧本3. ansible的并行进程数4. 分组设置主机密码-主机清单分组变量5. 案例:ansib…

大模型安全建设:破误区、识风险、筑防线20250714

🔐 大模型安全建设:破误区、识风险、筑防线作者:Narutolxy|编辑时间:2025年7月在负责公司 AI 产品落地的过程中,一度以为只要选用主流开源大模型,前面加一层“敏感词提示词过滤”,就…

fastadmin中ajax弹窗修改文字为英文

需要把上图的中文改为 切换语言自动切换成英文找到这个文件public/assets/js/backend.js找到如下图部分 // //点击包含.btn-ajax的元素时发送Ajax请求 原页面// $(document).on(click, .btn-ajax,.ajaxit, function (e) {// var that this;// var options $.exte…

大型语言模型(LLM)的技术面试题

大型语言模型(LLM)的技术面试题 目录 大型语言模型(LLM)的技术面试题 一、提示校准:减轻提示学习中的偏见 二、矢量存储的适用场景 三、模型与人类价值观对齐的技术 四、RLHF中的Reward Hacking 五、微调效果的关键影响因素:预训练模型架构与大小 六、Transformer自注意力…

数字IC后端培训教程之数字IC后端项目典型问题解析

今天给大家分享下最近几个典型的数字后端项目案例,希望对大家的学习和工作有所帮助。 数字IC后端培训教程之数字后端项目典型项目案例解析 Q1:星主,有啥办法可以看到refinePlace或者ecoPlace都动到了那些inst吗,log里只会有mean和max move&…

网络(数据库1)

常用数据库: 1.关系型数据库: 将复杂的数据结构简化为二维表格形式 大型:0racle、DB2 中型:MySq1、sQLServer 小型:Sqlite 2.非关系型数据库以键值对存储,且结构不固定。//JSON Redis MongoDB数据存储:变量、数组、链表 内存 &…

6.删除-demo

在连接数据库的基础上deleteResult, err : db.Exec("DELETE FROM user0 WHERE id ?", 1)package main//删除-demoimport ("database/sql""fmt"_ "github.com/go-sql-driver/mysql""log" )func main() {db, err : sql.Open…

人机协作系列(四)AI编程的下一个范式革命——看Factory AI如何重构软件工程?

最近这段时间,我发现一个很有意思的现象:那些曾经对 AI 编程工具持怀疑态度的技术领袖们,态度正在集体转变。就像 Flask 的作者 Armin Ronacher,他之前还说 “不敢授权 AI”,现在却坦言 “愿意将工程主导权交给编程代理…

在javaScript里删除节点以及添加节点

1.在javaScript里删除节点在学习中我们只学到了一种删除DOM节点的方法那就是通过元素的父元素来删除该元素,但后面我查阅资料发现删除节点还有其他方法。1.使用 removeChild() 方法(最常用)我们需要获得元素的父元素,如果不知道可…

贪心算法题解——跳跃游戏【LeetCode】

55. 跳跃游戏 一、算法逻辑(逐步思路) 问题描述: 给定一个非负整数数组 nums,其中 nums[i] 表示从位置 i 最多可以跳跃的步数。 从起点 0 出发,判断是否能够到达最后一个位置。 解题思路: 设一个变量 mx…

复现永恒之蓝

一.打开msf找到永恒之蓝的漏洞直接运行这个漏洞二.查询这个漏洞模块需要配置的参数配置攻击主机的ip三.没有做免杀的话,记得关闭防火墙四.直接运行这里已经显示拿下目标主机五.测试给目标主机添加一个文档六.查看目标主机有没有刚才编写的文档

游戏行业中的恶梦:不断升级的DDoS攻击

近年来,游戏行业快速发展,成为全球娱乐市场的重要组成部分。然而,伴随着这一行业的繁荣,网络安全问题也随之而来。游戏公司面临着一种特殊的威胁:分布式拒绝服务(DDoS)攻击。这种攻击不仅对公司…

2025年自动化工程、物联网与计算机应用国际会议(AEITCA 2025)

2025年自动化工程、物联网与计算机应用国际会议(AEITCA 2025) 2025 International Conference on Automation Engineering, Internet of Things, and Computer Applications一、大会信息会议简称:AEITCA 2025 大会地点:中国西安 审…

Gartner《JavaScript: Top Use Cases, Frameworks and Architecture Constraints》学习心得

《JavaScript: Top Use Cases, Frameworks and Architecture Constraints》是一份面向企业技术决策者、软件架构师与高级工程师的系统性研究笔记。全文以“何时用 JavaScript、如何用好 JavaScript”为主线,从语言特性、运行时差异、适用场景、主流框架、架构约束、生态现状、…

比较vue和react框架

目录 一、基础语法 1.1、模板 vs JSX 1.2、指令 1.2.1、v-for vs Array.map 1.2.2、v-if vs 三元运算符或者&& 1.2.3、v-bind vs 直接在JSX里写{变量} 1.2.4、v-show vs style和className 1.2.5、v-html vs dangerouslySetInnerHTML 1.3、数据绑定 1.4、数据…