小白的进阶之路系列之十五----人工智能从初步到精通pytorch综合运用的讲解第八部分

torch.nn 究竟是什么?

PyTorch 提供了设计精良的模块和类,如 torch.nn、torch.optim、Dataset 和 DataLoader,帮助你创建和训练神经网络。为了充分利用它们的能力并根据你的问题进行定制,你需要真正理解它们到底在做什么。为了帮助你理解这一点,我们将首先在不使用这些模块的任何功能的情况下,在 MNIST 数据集上训练一个基本的神经网络;我们最初只使用最基本的 PyTorch 张量功能。然后,我们将每次增量添加 torch.nntorch.optimDatasetDataLoader 中的一个功能,准确展示每个部分的作用,以及它是如何使代码更简洁或更灵活的。

本教程假设你已安装 PyTorch,并熟悉张量操作的基础知识。(如果你熟悉 Numpy 数组操作,你会发现此处使用的 PyTorch 张量操作几乎相同)。

MNIST 数据设置

我们将使用经典的 MNIST 数据集,该数据集包含手写数字(0 到 9)的黑白图像。

我们将使用 pathlib 来处理路径(它是 Python 3 标准库的一部分),并将使用 requests 下载数据集。我们只在使用时导入模块,这样你就可以清楚地看到每一步使用了什么。

from pathlib import Path
import requestsDATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"PATH.mkdir(parents=True, exist_ok=True)URL = "https://github.com/pytorch/tutorials/raw/main/_static/"
FILENAME = "mnist.pkl.gz"if not (PATH / FILENAME).exists():content = requests.get(URL + FILENAME).content(PATH / FILENAME).open("wb").write(content)

该数据集采用 numpy 数组格式,并使用 pickle(一种 Python 特有的数据序列化格式)存储。

import pickle
import gzipwith gzip.open((PATH / FILENAME).as_posix(), "rb") as f:((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")

每张图像是 28 x 28 像素,并以长度为 784 (=28x28) 的扁平行存储。让我们看一张;我们需要先将其重塑为 2D 形式。

from matplotlib import pyplot
import numpy as nppyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
# ``pyplot.show()`` only if not on Colab
try:import google.colab
except ImportError:pyplot.show()
print(x_train.shape)
# plt.show()

输出为:

(50000, 784)

得到的图像:

在这里插入图片描述

PyTorch 使用 torch.tensor 而非 numpy 数组,因此我们需要转换数据。

import torchx_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape
print(x_train, y_train)
print(x_train.shape)
print(y_train.min(), y_train.max())

输出为:

tensor([[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.],...,[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.],[0., 0., 0.,  ..., 0., 0., 0.]]) tensor([5, 0, 4,  ..., 8, 4, 8])
torch.Size([50000, 784])
tensor(0) tensor(9)

从头开始构建神经网络(不使用 torch.nn

我们首先只使用 PyTorch 张量操作创建一个模型。我们假设你已经熟悉神经网络的基础知识。(如果你不熟悉,可以在

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85487.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85487.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript 数据结构详解

最近在复习JavaScript的基础知识,和第一次学确实有了很不一样的感受,第一次学的比较浅,但是回头再进行学习的时候,发现有很多遗漏的东西,所以今天想分享一下新学到的知识,后面会一点一点补充更新 JavaScrip…

c++面试题(14)------顺时针打印矩阵

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个元素。 例如: 输入矩阵: [[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ] ]输出&…

《Go语言圣经》defer

《Go语言圣经》defer 核心概念:defer语句的执行时机 defer是Go语言的一个关键字,它的作用是:延迟执行一个函数调用,该调用会在包围它的函数返回前一刻执行。 关键点: defer语句会在函数即将返回时执行,…

WEB3 的 WebSocket Provider连接方式

1. 什么是 WebSocket Provider? WebSocket Provider 是 web3.js 中用于通过 WebSocket 协议 与以太坊节点(如 Infura、Geth、Parity)建立持久化连接的通信方式。它允许双向实时数据传输,适用于需要实时监听区块链事件的场景。 核心特点 双向通信:客户端和服务器可以主动…

三国大模型:智能重构下的乱世文明图谱

引言:当赤壁烽烟遇见深度学习 一件动态的《全本三国演义》正通过全息投影技术演绎群雄逐鹿的史诗。这个虚实交融的场景,恰似三国大模型技术的隐喻——以人工智能为纽带,连接起汉末三国的烽火狼烟与数字时代的文明重构。作为人工智能与历史学…

AWS数据库迁移实战:本地MySQL零停机上云方案

一、迁移场景 本地环境&#xff1a;自建MySQL 5.7&#xff08;数据量500GB&#xff09;&#xff0c;业务要求迁移停机时间<5分钟 目标架构&#xff1a; 二、迁移四步法 步骤1&#xff1a;环境准备&#xff08;耗时30分钟&#xff09; 1.1 创建Aurora MySQL # AWS CLI创…

uni-app 安卓 iOS 离线打包参考

App 离线打包 原生工程配置 安卓&#xff1a;【uniapp】uniapp 离线打包安卓应用或者云打包发布 app 步骤&问题记录 iOS&#xff1a;uni-app实现XCode苹果本地离线打包APP

mysql History List Length增长

HLL 持续增长导致问题 History List Length&#xff08;HLL&#xff09;是InnoDB存储引擎中用于衡量未清理的undo日志记录数量的指标。当HLL持续增长时&#xff0c;可能对数据库性能和业务产生以下影响&#xff1a; 事务处理延迟增加 高HLL值意味着大量未清理的undo日志&…

VMware替代 | 南京地铁采用ZStack ZSphere虚拟化承载核心业务

南京地铁作为中国主要城市轨道交通系统之一&#xff0c;运营规模庞大&#xff0c;地铁线路覆盖全市主要区域。其核心业务系统&#xff08;包括列车调度、信号控制、乘客信息系统等&#xff09;原部署在VMware平台上。然而&#xff0c;随着VMware产品全面转向订阅制&#xff0c;…

Electron自动更新详解—包教会版

★ 本人在公司项目中实现的Electron更新功能。 ★ 将实现更新过程的每一步都总结了出来&#xff0c;以及过程中我遇到了哪些问题&#xff0c;如何去解决的问题&#xff0c;有哪些注意事项。 ★ 使用贴合实际应用的HTTP服务器做为载体实现更新&#xff0c;而非github。 开始&…

Apache RocketMQ 消息过滤的实现原理与腾讯云的使用实践

导语 本文将系统阐述 Apache RocketMQ 消息过滤机制的技术架构与实践要点。首先从业务应用场景切入&#xff0c;解析消息过滤的核心价值&#xff1b;接着介绍 Apache RocketMQ 支持的两种消息过滤实现方式&#xff0c;帮助读者建立基础认知框架&#xff1b;随后深入剖析 SQL 语…

安卓JetPack篇——LifeCycle原理

LifeCycle 一、什么是Lifecycle 具备宿主生命周期感知能力的组件。它能持有组件&#xff08;如Activity或Fragment&#xff09;生命周期状态的信息&#xff0c;并且允许其他观察者监听宿主的状态。 二、基本原理 1、安卓10以下版本 隐形的Fragment注入在LifecycleOwner&am…

CSS 圆角边框属性(`border-radius`)笔记

一、作用&#xff1a; 用于设置元素四个角的圆角效果&#xff0c;让元素不再死板&#xff0c;更加柔和。 二、基本语法&#xff1a; border-radius: 圆角大小; 单位&#xff1a;px&#xff08;像素&#xff09;或 %&#xff08;百分比&#xff09; 示例&#xff1a; div {  …

python自助棋牌室管理系统

目录 技术栈介绍具体实现截图系统设计研究方法&#xff1a;设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示 技术栈介绍 Django-SpringBoot-php-Node.js-flask 本课题的研究方法和研究步骤基本合理&#xff0c;难度适中&#xf…

计算机——硬盘分区和格式化

硬盘驱动器 硬盘驱动器&#xff08;HDD&#xff09;是一种成熟、经济的大容量存储解决方案。它的核心优势在于每GB成本低和超大容量。然而&#xff0c;其机械结构带来的速度瓶颈、噪音、功耗和对物理冲击的敏感性是其主要的缺点。随着 SSD 价格的持续下降和性能的绝对领先&…

从IEC到UL:技术主权竞争下的断路器合规性战略

1 国际标准体系割裂的现状 在全球低压电器领域&#xff0c;国际标准体系呈现出日益明显的割裂态势。当前主要存在四大标准体系&#xff1a;国际通用的​​IEC标准体系​​、欧洲采用的​​EN标准体系​​、北美实施的​​UL与CSA标准体系​​&#xff0c;以及具有地域特色的​…

第十六届蓝桥杯_省赛B组(D).产值调整

题目如下 这道题看似很简单&#xff0c;其实还是得观察一下&#xff0c;要不然就会… 话不多说回到题目&#xff0c;这个题的坑就在于当A,B,C三个产值相同的时候&#xff0c;再怎么变还是之前的产值&#xff0c;或者也可以通过另外一种方法理解&#xff1a; 通过一个案例来举…

设计模式 | 单例模式——饿汉模式 懒汉模式

单例模式 文章目录 单例模式一、饿汉模式&#xff08;Eager Initialization&#xff09;1. 定义2. 特点3. 饿汉单例模式&#xff08;定义时-类外初始化&#xff09;4. 实现细节 二、懒汉模式&#xff08;Lazy Initialization&#xff09;1. 定义2. 特点3. 懒汉单例模式&#xf…

dify本地部署及添加ollama模型(ubuntu24.04)

说明&#xff1a;ubuntu是虚拟机的&#xff0c;用的桥接模式&#xff0c;与本地同局域网不同ip地址。 参考VM虚拟机网络配置&#xff08;ubuntu24桥接模式&#xff09;&#xff1a;配置静态IP前提&#xff1a;需要有docker及docker-compose环境 参考ubuntu24安装docker及docker…

Python爬虫实战:研究multiprocessing相关技术

一、引言 1.1 研究背景与意义 随着互联网信息的爆炸式增长,网络爬虫已成为获取海量数据的重要工具。传统的单线程爬虫在面对大规模数据采集任务时效率低下,无法充分利用现代计算机多核 CPU 的优势。多线程爬虫虽然在一定程度上提高了效率,但受限于 Python 的全局解释器锁(…