嵌入式学习-土堆目标检测(4)-day28

Pytorch中加载自定义数据集 - VOC

其中需要pip install xmltodict

#voc_dataset.pyimport os
import torch
import xmltodict
from PIL import Image
from torch.utils.data import Dataset
import torchvision.transforms as transformsclass VOCDataset(Dataset):  def __init__(self,img_dir,label_dir,transform,label_transform): #定义一些后面会用的参数      self.img_dir = img_dir                          #img地址       self.label_dir = label_dir                      #label文件地址       self.transform = transform                      #是否要做一些变换       self.label_transform = label_transform          #是否要对label做一些变换self.img_names = os.listdir(self.img_dir)       #os.listdir 获取文件夹下的所有文件名称,列表形式self.label_names = os.listdir(self.label_dir)   #获取label文件夹下的所有文件名称       self.classes_list = ["no helmet","motor","number","with helmet"]#为了转化标记为 : 0,1,2,3def __len__(self):return len(self.img_names)                      #返回照片文件的个数def __getitem__(self, index):img_name = self.img_names[index]                #图片列表[序号] 获取文件名img_path = os.path.join(self.img_dir, img_name) #对地址进行拼接 获取文件的路径image = Image.open(img_path).convert('RGB')     #通过文件地址打开文件,转化为RGB三通道格式#new1.png -> new1.xml#new1.png -> [new1,png] -> new1 + ".xml"label_name = img_name.split('.')[0] + ".xml"    #获取标注的文件名label_path = os.path.join(self.label_dir, label_name)   #拼接获取标注的路径with open(label_path, 'r',encoding="utf-8") as f:       #打开标注文件label_content = f.read()                            #读出标注文件所有的内容label_dict = xmltodict.parse(label_content)             #因为内容是XML格式,xmltodict.parse 将内容转化为 dict 格式target = []                                             #将要返回的数组,定义总体返回容器objects = label_dict["annotation"]["object"]            #获取dict里的标注对象for obj in objects:                                     #获取每个标注里面的信息obj_name = obj["name"]obj_class_id = self.classes_list.index(obj_name)    #将标注的名字(no helmet)转化为数字(0)obj_xmax = float(obj["bndbox"]["xmax"])obj_ymax = float(obj["bndbox"]["ymax"])obj_xmin = float(obj["bndbox"]["xmin"])obj_ymin = float(obj["bndbox"]["ymin"])target.extend([obj_class_id,obj_xmin,obj_ymin,obj_xmax,obj_ymax])   #将信息保存到总体返回容器target = torch.Tensor(target)                                           #转为tensor数据类型if self.transform is not None:image = self.transform(image)                                       #对定义对象时写的对image的操作return image,targetif __name__ == '__main__':train_dataset = VOCDataset(r"E:\HelmetDataset-VOC\train\images",r"E:\HelmetDataset-VOC\train\labels",transforms.Compose([transforms.ToTensor()]),None)print(len(train_dataset))print(train_dataset[11])

Pytorch中加载自定义数据集 - YOLO

如过VOC弄懂了的话,那这个代码会非常简单

#YOLO_dataset.pyimport os
import torchfrom PIL import Image
from torch.utils.data import Dataset
import torchvision.transforms as transformsclass YOLODataset(Dataset):def __init__(self,img_dir,label_dir,transform,label_transform): #定义一些后面会用的参数self.img_dir = img_dir                          #img地址self.label_dir = label_dir                      #label文件地址self.transform = transform                      #是否要做一些变换self.label_transform = label_transform          #是否要对label做一些变换self.img_names = os.listdir(self.img_dir)       #os.listdir 获取文件夹下的所有文件名称,列表形式self.label_names = os.listdir(self.label_dir)   #获取label文件夹下的所有文件名称
#        self.classes_list = ["no helmet","motor","number","with helmet"]#为了转化标记为 : 0,1,2,3def __len__(self):return len(self.img_names)                      #返回照片文件的个数def __getitem__(self, index):img_name = self.img_names[index]                #图片列表[序号] 获取文件名img_path = os.path.join(self.img_dir, img_name) #对地址进行拼接 获取文件的路径image = Image.open(img_path).convert('RGB')     #通过文件地址打开文件,转化为RGB三通道格式#new1.png -> new1.xml#new1.png -> [new1,png] -> new1 + ".txt"label_name = img_name.split('.')[0] + ".txt"    #获取标注的文件名label_path = os.path.join(self.label_dir, label_name)   #拼接获取标注的路径with open(label_path, 'r',encoding="utf-8") as f:       #打开标注文件label_content = f.read()                            #读出标注文件所有的内容target = []object_infos = label_content.strip().split("\n")for object_info in object_infos:info_list = object_info.strip().split(" ")class_id = float(info_list[0])center_x = float(info_list[1])center_y = float(info_list[2])width = float(info_list[3])height = float(info_list[4])target.extend([class_id,center_x,center_y,width,height])# label_dict = xmltodict.parse(label_content)             #因为内容是XML格式,xmltodict.parse 将内容转化为 dict 格式# target = []                                             #将要返回的数组,定义总体返回容器# objects = label_dict["annotation"]["object"]            #获取dict里的标注对象# for obj in objects:                                     #获取每个标注里面的信息#     obj_name = obj["name"]#     obj_class_id = self.classes_list.index(obj_name)    #将标注的名字(no helmet)转化为数字(0)#     obj_xmax = float(obj["bndbox"]["xmax"])#     obj_ymax = float(obj["bndbox"]["ymax"])#     obj_xmin = float(obj["bndbox"]["xmin"])#     obj_ymin = float(obj["bndbox"]["ymin"])#     target.extend([obj_class_id,obj_xmin,obj_ymin,obj_xmax,obj_ymax])   #将信息保存到总体返回容器target = torch.Tensor(target)                                           #转为tensor数据类型if self.transform is not None:image = self.transform(image)                                       #对定义对象时写的对image的操作return image,targetif __name__ == '__main__':train_dataset = YOLODataset(r"E:\HelmetDataset-YOLO\HelmetDataset-YOLO-Train\images", r"E:\HelmetDataset-YOLO\HelmetDataset-YOLO-Train\labels", transforms.Compose([transforms.ToTensor()]), None)print(len(train_dataset))print(train_dataset[11])

模型的 nn.model &模型的可视化

 #model.py
import torch
import torch.nn as nn
from torchvision import transformsfrom yolo_dataset import VOCDatasetclass TuduiModel(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(in_channels=3 , out_channels=20, kernel_size=5)self.conv2 = nn.Conv2d(in_channels=20, out_channels=20, kernel_size=5)def forward(self, x):x = torch.nn.functional.relu(self.conv1(x))return torch.nn.functional.relu(self.conv2(x))if __name__ == '__main__':model = TuduiModel()dataset = VOCDataset(r"E:\HelmetDataset-VOC\train\images",r"E:\HelmetDataset-VOC\train\labels",transforms.Compose([transforms.ToTensor(),transforms.Resize((512, 512)),]),None)img,target = dataset[0]output = model(img)#   print(output)#   print(model)torch.onnx.export(model,img,"tudui.onnx") #模型可视化

ONNX模型格式 

在环境中

pip install onnx

然后

torch.onnx.export(model,img,"tudui.onnx")  #(模型,图片,名字)

再用浏览器打开 netron.app

把生成好的onnx文件拖进网页

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/90236.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/90236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring MVC上下文容器在Web容器中是如何启动的(源码深入剖析)?

文章目录一、双容器架构:MVC容器与根容器的关系二、启动全流程解析1. 启动流程全景图2. 初始化根容器(Root WebApplicationContext)2.1 Tomcat 中启动入口源码解析2.2 Spring 根上下文启动源码解析3. 初始化 MVC 容器(DispatcherS…

【iOS】编译和链接、动静态库及dyld的简单学习

文章目录编译和链接1️⃣核心结论:一句话区分2️⃣编译过程:从源代码到目标文件(.o)2.1 预处理(Preprocessing):“替换变量复制粘贴”2.2 编译(Compilation):…

金山办公WPS项目产品总监陈智新受邀为第十四届中国PMO大会演讲嘉宾

全国PMO专业人士年度盛会珠海金山办公软件有限公司WPS项目产品总监 陈智新先生 受邀为“PMO评论”主办的2025第十四届中国PMO大会演讲嘉宾,演讲议题为:中小团队PMO的成长之路,敬请关注!议题简要:在竞争激烈、需求多变的…

web安全 | docker复杂环境下的内网打点

本文作者:Track-syst1m一.前言本文涉及的相关漏洞均已修复、本文中技术和方法仅用于教育目的;文中讨论的所有案例和技术均旨在帮助读者更好地理解相关安全问题,并采取适当的防护措施来保护自身系统免受攻击。二.大概流程1. 外网打点• 漏洞利…

iTwin 几何属性获取

面积体积半径获取几何属性,如面积,体积,半径,可以使用getMassProperties这个接口async onGetMassProperty(){const vp IModelApp.viewManager.selectedView;const iModel vp?.iModel;if (!iModel) return;console.log("iM…

OpenLayers 快速入门(九)Extent 介绍

看过的知识不等于学会。唯有用心总结、系统记录,并通过温故知新反复实践,才能真正掌握一二 作为一名摸爬滚打三年的前端开发,开源社区给了我饭碗,我也将所学的知识体系回馈给大家,助你少走弯路! OpenLayers…

LeetCode 121. 买卖股票的最佳时机 LeetCode 122. 买卖股票的最佳时机II LeetCode 123.买卖股票的最佳时机III

LeetCode 121. 买卖股票的最佳时机尝试一:暴力解决方法常用两个指针去遍历prices数组,dp[i]用于记录在第i天所获得的最大利润。时间复杂度是O(N^2),超出时间限制。Codeclass Solution(object):def maxProfit(self, prices):"""…

【LeNet网络架构】——深度学习.卷积神经网络

目录 1 MLP 2 LeNet简介 3 Minst数据集 3.1 MINST数据集简介 3.2 MNIST数据集的预处理 4 LeNet手写数字识别 LeNet由Yann Lecun 提出,是一种经典的卷积神经网络,是现代卷积神经网络的起源之一。Yann将该网络用于邮局的邮政的邮政编码识别&#xff…

Python笔记完整版

常用pip源 (1)阿里云 http://mirrors.aliyun.com/pypi/simple/(2)豆瓣 http://pypi.douban.com/simple/(3)清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/(4)中国科学技术大学…

2025 鸿蒙创新赛又来了,万少教你如何强势切入 HarmonyOS AI特性

2025 鸿蒙创新赛又来了,万少教你如何强势切入 前言 ​ 2025 华为HarmonyOS 创新赛又来了,创新赛是鸿蒙生态最大规模开发者官方赛事,最高获百万激励。 参赛资格 面向所有开发者开放以队伍的形式来参加,可以一个人报名一个队伍&a…

【智能模型系列】Unity通过访问Ollama调用DeepSeek模型进行本地部署

【智能模型系列】Unity通过访问Ollama调用DeepSeek模型进行本地部署 目录 一、前言 二、环境准备 三、核心代码解析 1、参数配置 2. CallDeepSeek.cs - API交互控制器 3、 MainPanel.cs - 用户界面控制器 四、源码 一、前言 在本教程中,我将分享如何在Unity中集成本地…

什么是5G-A三防平板?有什么特点?哪些领域能用到?

在工业自动化与数字化转型浪潮中,三防平板电脑已成为“危、急、特”场景的核心工具。这类设备不仅具备坚固耐用的物理防护特性,更融合了先进的通信技术与智能处理能力。而随着5G技术向5G-A阶段演进,新一代三防平板正为行业应用注入全新动能。…

Flink实时流量统计:基于窗口函数与Redis Sink的每小时PV监控系统(学习记录)

题目:利用flink统计网站浏览量,并写入redis。利用窗口函数以及算子实现每小时PV(网站的页面浏览量)统计,对统计后结果数据格式进行设计,存储至Redis中(利用sink将处理后结果数据输出到redis数据…

使用Imgui和SDL2做的一个弹球小游戏-Bounze

使用Imgui和SDL2做的一个弹球小游戏-Bounze 油管上面TheCherno博主分享的一个视频FIRST GAME in C! Did He Do a Good Job? // Code Review (C/SDL2)里面分享了一个Github项目: https://github.com/staticaron/Bounze 使用了Imgui和SDL2,并且可以设置音…

SQL 中 CASE WHEN 及 SELECT CASE WHEN 的用法

SQL 中 CASE WHEN 及 SELECT CASE WHEN 的用法 CASE WHEN 是 SQL 中非常实用的条件表达式,它允许你在查询中实现条件逻辑。以下是详细的用法说明: 1. 基本语法结构 CASE WHEN condition1 THEN result1WHEN condition2 THEN result2...ELSE default_resul…

CentOS 7 Linux 基础知识点汇总

🐧 CentOS 7 Linux 基础知识点汇总为方便初学者快速掌握 CentOS 7 系统的核心操作,本文档整理了常用系统命令、快捷键、目录结构及文件后缀名等基础内容,适合入门参考。 一、常见系统命令 🔍 命令行提示符说明 终端中的提示符包含…

突发限制下的破局之路:国产之光 Lynx 重构 AI 开发安全壁垒

继 Pro 套餐 “明升暗降” 争议后,Cursor 本周再掀波澜 —— 包括 Claude 系列、GPT-4 在内的主流模型一夜之间对中国用户全面封禁。开发者社群瞬间沸腾,“付费却用不了”“项目数据导不出” 的焦虑刷屏,境外工具的政策波动再次给行业敲响警钟…

渗透测试实战 | docker复杂环境下的内网打点

本文作者:Track-syst1m一.前言本文涉及的相关漏洞均已修复、本文中技术和方法仅用于教育目的;文中讨论的所有案例和技术均旨在帮助读者更好地理解相关安全问题,并采取适当的防护措施来保护自身系统免受攻击。二.大概流程1. 外网打点漏洞利用•…

阿里云服务器 CentOS 7 安装 MySQL 8.4 超详细指南

阿里云服务器 CentOS 7 安装 MySQL 8.4 超详细指南 一、准备工作 系统要求: CentOS 7.9 64位2 核(vCPU)2 GiBroot 用户权限 服务器连接工具: FinalShell 下载安装包: 访问 MySQL 官网选择版本:MySQL 8.4.0…

解决 Electron 中 window.open 打开新窗口的各种“坑”

嘿,各位开发者们!今天我们要聊聊在使用 Electron 时遇到的一个经典问题:如何正确地使用 window.open 来打开新窗口? 这听起来似乎很简单,但实际上却充满了各种“惊喜”(或者说“惊吓”)。别担心…