基于昇腾310B4的YOLOv8目标检测推理

YOLOv8目标检测 om 模型推理

本篇博客将手把手教你如何将 YOLOv8 目标检测模型部署到华为昇腾 310B4 开发板上进行高效推理(其他昇腾开发版也可参考此流程)。
整个流程包括:

  • 模型格式转换(ONNX → OM)
  • 昇腾推理环境配置
  • 推理代码实现(图片推理为例)
  • 结果可视化与效果展示

一、前置知识与准备

我们基于 YOLOv8 ONNX 模型,使用华为昇腾 CANN 提供的推理工具链完成模型转换与部署。

项目所需环境如下:

组件版本/建议
Python3.9+
numpy1.24.4
opencv-python4.7.0.72
CANN Toolkit≥ 6.0(需含 atc, ais_bench, infer 等,开发板一般自带)
Ascend310B4 驱动安装并配置环境变量(开发板一般自带)

建议使用以下命令安装依赖:

pip install numpy==1.24.4 opencv-python==4.7.0.72

二、模型转换:ONNX → OM

在昇腾上推理,首先需将 .onnx 模型转换为 .om 格式。使用 CANN 提供的 atc 工具即可完成转换,转换过程较长。

模型转换命令如下:

atc --model=yolov8s.onnx \--framework=5 \--output=yolov8s \--input_format=NCHW \--input_shape="images:1,3,640,640" \--log=error \--soc_version=Ascend310B4

下图为转换过程:
在这里插入图片描述

📌 注意事项:

  • input_shape 必须与你模型实际输入一致
  • soc_version 必须与开发板匹配,例如 Ascend310B1、 Ascend310B4等

查看自己的昇腾开发板型号(310B1、310B4等):

在这里插入图片描述

转换成功后,将生成 yolov8s.om 文件用于后续推理。


三、模型文件下载

如果你没有合适的 YOLOv8 ONNX 模型文件,可以通过以下链接下载我准备好的模型文件包括 om 文件:

百度网盘链接: https://pan.baidu.com/s/1xpAdN7C9CS-L4XBLgBG8Kw
提取码: 8dm8

建议选择以下模型文件之一进行实验:

  • yolov8n.onnx:轻量快速,适合测试
  • yolov8s.onnx:兼顾精度和速度,适合部署

你也可以使用 Ultralytics 官方提供的 YOLOv8 PyTorch 模型导出 ONNX 文件(model.export(format="onnx"))。


四、YOLOv8 OM模型推理流程

我们将使用 python + ais_bench 接口构建推理流程。推理步骤包括:

  1. 加载图像与模型
  2. 预处理图像(尺寸调整、归一化等)
  3. 执行模型推理
  4. 后处理(提取框、置信度、NMS过滤)
  5. 绘制检测结果并保存

👇 以下为推理代码示例部分(infer_yolov8_ascend.py):


推理代码

# -*- coding: utf-8 -*-
import cv2
import numpy as np
from ais_bench.infer.interface import InferSession# 类别定义
CLASSES = {0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck',8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench',14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear',22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase',29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat',35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle',40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple',48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut',55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet',62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell phone', 68: 'microwave',69: 'oven', 70: 'toaster', 71: 'sink', 72: 'refrigerator', 73: 'book', 74: 'clock', 75: 'vase',76: 'scissors', 77: 'teddy bear', 78: 'hair drier', 79: 'toothbrush'
}# 置信度阈值
CONFIDENCE = 0.4
# NMS 的 IoU 阈值
IOU = 0.45# 为每个类别分配随机颜色
colors = np.random.uniform(0, 255, size=(len(CLASSES), 3))def draw_bounding_box(img, class_id, confidence, x, y, x_plus_w, y_plus_h):"""在图像上绘制边界框和类别标签参数:img - 原始图像class_id - 类别IDconfidence - 置信度x, y - 左上角坐标x_plus_w, y_plus_h - 右下角坐标"""label = "{} {:.2f}".format(CLASSES[class_id], confidence)color = colors[class_id]# 画框cv2.rectangle(img, (x, y), (x_plus_w, y_plus_h), color, 2)# 获取文本大小label_size, _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 1)label_width, label_height = label_sizelabel_x = xlabel_y = y - 10 if y - 10 > label_height else y + 10# 背景框cv2.rectangle(img, (label_x, label_y - label_height),(label_x + label_width, label_y + label_height), color, cv2.FILLED)# 文字cv2.putText(img, label, (label_x, label_y), cv2.FONT_HERSHEY_SIMPLEX,0.5, (0, 0, 0), 1, cv2.LINE_AA)def main(session, original_image):"""加载模型,执行推理,绘制检测框并保存结果图像参数:session - 模型original_image - 图片值返回:original_image - 画框的图片detections - 包含每个目标信息的列表"""height, width, _ = original_image.shape# 变为正方形图像用于推理length = max(height, width)image = np.zeros((length, length, 3), np.uint8)image[0:height, 0:width] = original_image# 缩放因子scale = length / 640# 预处理图像blob = cv2.dnn.blobFromImage(image, scalefactor=1.0 / 255, size=(640, 640), swapRB=True)# 模型推理outputs = session.infer(feeds=blob, mode="static")# 转换输出维度:从 (1, 84, 8400) -> (8400, 84)outputs = np.array([cv2.transpose(outputs[0][0])])rows = outputs.shape[1]boxes = []scores = []class_ids = []# 解析输出for i in range(rows):classes_scores = outputs[0][i][4:](minScore, maxScore, minClassLoc, (x, maxClassIndex)) = cv2.minMaxLoc(classes_scores)if maxScore >= CONFIDENCE:box = [(outputs[0][i][0] - outputs[0][i][2] / 2) * scale,  # x 左上角(outputs[0][i][1] - outputs[0][i][3] / 2) * scale,  # y 左上角outputs[0][i][2] * scale,  # 宽outputs[0][i][3] * scale   # 高]boxes.append(box)scores.append(maxScore)class_ids.append(maxClassIndex)# 非极大值抑制result_boxes = cv2.dnn.NMSBoxes(boxes, scores, CONFIDENCE, IOU, 0.5)detections = []# 绘制边界框for i in range(len(result_boxes)):index = result_boxes[i]box = boxes[index]detection = {"class_id": class_ids[index],"class_name": CLASSES[class_ids[index]],"confidence": scores[index],"box": box,"scale": scale,}detections.append(detection)draw_bounding_box(original_image,class_ids[index],scores[index],round(box[0]),round(box[1]),round(box[0] + box[2]),round(box[1] + box[3]))return original_image, detectionsif __name__ == "__main__":model_path = "yolov8s.om"# 创建推理会话session = InferSession(device_id=0, model_path=model_path)# 图片推理input_image_path = "street.jpg"image = cv2.imread(input_image_path)draw_image, _ = main(session, image)# cv2.imshow("Image Detection", draw_image)cv2.imwrite("output_image.jpg", draw_image)cv2.waitKey(0)cv2.destroyAllWindows()

五、推理结果展示

完成推理后,程序会将检测结果绘制在图像上并保存,如下所示:

原图检测后
原图检测后

你可以替换为自己的图像文件进行体验。


六、运行方法与注意事项

  1. .om 模型与推理脚本放于同一目录
  2. 准备一张待检测图片
  3. 执行命令:
python infer_yolov8_ascend.py
  1. 成功运行后,将在当前目录输出检测结果图 output_image.jpg,并弹出窗口展示检测框。

🧯 若 cv2.imshow() 报错,请确保本地图形界面环境正常或注释相关代码,非图形界面系统不支持显示。


总结

本文完整介绍了基于昇腾310B4的 YOLOv8 推理部署流程,该流程也适用于视频流检测或摄像头实时检测,仅需在代码中扩展对应输入源即可。


延伸方向

  • 🎥 摄像头实时检测
  • 🎬 视频流批量检测

如有需要完整代码、转换脚本或模型下载支持,欢迎在评论区留言,我会尽快回复!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/912763.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/912763.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

前端跨域问题解决Access to XMLHttpRequest at xxx from has been blocked by CORS policy

在前端开发中,跨域资源共享(CORS)是一个常见的问题。它涉及到浏览器安全机制,防止网页从一个域获取资源时被另一个域阻止。错误信息如“Access to XMLHttpRequest at xxx from origin has been blocked by CORS policy”是典型的跨…

[ linux-系统 ] 软硬链接与动静态库

软硬链接 介绍 软链接 通过下图可以看出软链接和原始文件是两个独立的文件,因为软链接有着自己的inode编号: 具有独立的 inode ,也有独立的数据块,它的数据块里面保存的是指向的文件的路径,公用 inode 硬链接 通过…

3D 商品展示与 AR 试戴能为珠宝行业带来一些便利?

对于珠宝行业而言,长久以来,如何让消费者在做出购买决策之前,便能真切且直观地领略到珠宝独一无二的魅力,始终是横亘在行业发展道路上的一道棘手难题。而 3D 互动营销的横空出世,恰似一道曙光,完美且精准地…

电子电气架构 --- SOVD功能简单介绍

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 简单,单纯,喜欢独处,独来独往,不易合同频过着接地气的生活,除了生存温饱问题之外,没有什么过多的欲望,表面看起来很高冷,内心热情,如果你身…

【Java编程动手学】 Java中的运算符全解析

文章目录 一、引言二、算术运算符1、基本概念2、具体运算符及示例 三、关系运算符1、基本概念2、具体运算符及示例 四、自增减运算符1、基本概念2、具体运算符及示例 五、逻辑运算符1、基本概念2、具体运算符及示例 六、位运算符1、基本概念2、具体运算符及示例 七、移位运算符…

【前端】1 小时实现 React 简历项目

近期更新完毕。仅包括核心代码 目录结构 yarn.lock保证开发者每次能下载到同版本依赖,一般不需要特别留意 package.json 是 Node.js 项目、前端项目、npm/yarn的配置文件。 Dockerfile 是用来 定义 Docker 镜像构建过程的文本文件。它是一份脚本,告诉 …

python中的pydantic是什么?

Pydantic 是 Python 中一个用于数据验证和设置管理的库,主要通过 Python 类型注解(Type Hints)来定义数据结构,并自动验证输入数据的合法性。它广泛应用于 API 开发(如 FastAPI)、配置管理、数据序列化等场…

腾讯云市场目前饱和度

首先我需要理解市场饱和度的概念。市场饱和度通常指一个产品或服务在潜在市场中的渗透程度,高饱和度意味着市场增长空间有限,低饱和度则表明还有较大发展潜力。 从搜索结果看,腾讯云目前在中国云服务市场排名第三,市场份额约为15%…

EDR、NDR、XDR工作原理和架构及区别

大家读完觉得有帮助记得关注和点赞!!! EDR、NDR、XDR是网络安全中关键的检测与响应技术,它们在覆盖范围、数据源和响应机制上有显著差异。以下是它们的工作原理和架构详解: --- ### 🔍 一、EDR&#xff0…

vue3 + luckysheet 实现在线编辑Excel

效果图奉上: 引入的依赖: "dependencies": {"types/jquery": "^3.5.32","types/xlsx": "^0.0.36","jquery": "^3.7.1","xlsx": "^0.18.5",}在index.html中…

Linux下MinIO分布式安装部署

文章目录 一、MinIO简单说明二、MinIO分布式安装部署1、关闭SELINUX2、开启防火墙2.1、关闭firewall:2.2、安装iptables防火墙 3、安装MinIO4、添加MinIO集群控制脚本4.1添加启动脚本4.2添加关闭脚本 5、MinIO控制台使用 一、MinIO简单说明 1、MinIO是一个轻量的对…

Codeforces Round 980 (Div. 2)

ABC 略 D 这个过程一定是由1向后跳的过程中穿插有几次向前一步一步走。直到跳到一个位置后再把前面所有没有走过的位置倒序走一遍。总分就等于最大位置的前缀和-前面所有起跳位置和。前缀和固定我们只需要求到每个位置的最小起跳和即可。对于这个向后跳和向前走的过程我们可以…

Langchain实现rag功能

RAG(检索增强生成)的核心是通过外部知识库增强大模型回答的准确性和针对性,其工作流程与优化策略如下: 一、RAG 核心流程 ‌知识库构建‌ ‌文档加载与分割‌:将非结构化文档(PDF、Markdown等)…

算法笔记上机训练实战指南刷题

算法笔记上机训练实战指南刷题记录 文章目录 算法笔记上机训练实战指南刷题记录模拟B1001 害死人不偿命的(3n1)猜想B1011 AB 和 CB1016 部分ABB1026 程序运行时间B1046划拳B1008数组元素循环右移问题B1012 数字分类B1018 锤子剪刀布A1042 Shuffling Machine 每天两题&#xff0…

MYSQL基础内容

一、介绍 1.不用数据库:使用IO流对数据进行管理 2.使用数据库:使用SQL语句对开发的数据进行管理,能储存上亿条数据 3.MYSQL: 是流行的关系型数据库管理系统之一,将数据保存在不同的数据表中,通过表与表之…

音视频会议服务搭建(设计方案)-01

前言 最近在做音视频会议系统服务搭建的工作任务,因为内容过多,我会逐篇分享相关的设计方案、开发思路、编程语言、使用的组件集合等等。如果你也有大型音视频会议系统搭建架构的需求,希望这些可以对你有所帮助。 EchoMeet 音视频会议系统架构…

刷leetcode hot100/准备机试--图

图的基础知识【这部分建议使用acm模式】 图论理论基础 | 代码随想录 存储: 一般有邻接表【适合稀疏图】【数组 链表 】和邻接矩阵【适合稠密图】存储方式 注意邻接表 和 邻接矩阵的写法都要掌握! 邻接矩阵 n个节点,申请n*n或者&#xf…

无代码自动化测试工具介绍

无代码自动化测试工具允许用户无需编写代码即可创建和运行测试,通过拖拽式界面或录制回放等可视化界面进行操作。 这些工具利用图形用户界面和预定义命令来创建测试,使非编程人员也能进行自动化测试。 无代码自动化测试工具使团队能够: 使用直观的拖拽界面开发和执行自动化…

python学习打卡day58

DAY 58 经典时序预测模型2 知识点回顾: 时序建模的流程时序任务经典单变量数据集ARIMA(p,d,q)模型实战SARIMA摘要图的理解处理不平稳的2种差分 n阶差分---处理趋势季节性差分---处理季节性 建立一个ARIMA模型&#xf…

分布式锁的实现方式:使用 Redisson 实现分布式锁( Spring Boot )

Redisson提供了分布式和可扩展的Java数据结构&#xff0c;包括分布式锁的实现。 1. 添加依赖 在pom.xml中添加Redisson依赖&#xff1a; <dependency><groupId>org.redisson</groupId><artifactId>redisson-spring-boot-starter</artifactId>…