基于OpenCV的人脸识别:LBPH算法

文章目录

    • 引言
    • 一、概述
    • 二、代码实现
      • 1. 代码整体结构
      • 2. 导入库解析
      • 3. 训练数据准备
      • 4. 标签系统
      • 5. 待识别图像加载
      • 6. LBPH识别器创建
      • 7. 模型训练
      • 8. 预测执行
      • 9. 结果输出
    • 三、 LBPH算法原理解析
    • 四、关键点解析
    • 五、改进方向
    • 总结

引言

人脸识别是计算机视觉领域的一个重要应用,今天我将分享一个使用Python和OpenCV实现的简单人脸识别系统。这个系统能够识别特定人物的照片,并给出识别结果的置信度。

一、概述

这个系统使用了OpenCV的LBPH(Local Binary Patterns Histograms)人脸识别算法,通过训练已知的人脸图像,然后对新的图像进行预测识别。

二、代码实现

import cv2
import numpy as np# 加载训练用的人脸照片
images = []
images.append(cv2.imread('linyuner 1.jpg', cv2.IMREAD_GRAYSCALE))
images.append(cv2.imread('linyuner 2.jpg', cv2.IMREAD_GRAYSCALE))
images.append(cv2.imread('chendulin 1.jpg', cv2.IMREAD_GRAYSCALE))
images.append(cv2.imread('chendulin 2.jpg', cv2.IMREAD_GRAYSCALE))# 对应标签(0代表林允儿,1代表陈都灵)
labels = [0, 0, 1, 1]# 标签字典,用于将数字标签转换为可读名称
dic = {0: '林允儿', 1: '陈都灵', -1: '无法识别'}# 加载待识别的人脸图像
predict_image = cv2.imread('chendulin 3.jpg', cv2.IMREAD_GRAYSCALE)# 创建LBPH人脸识别器,设置阈值为80
recognizer = cv2.face.LBPHFaceRecognizer_create(threshold=80)# 训练识别器
recognizer.train(images, np.array(labels))# 进行预测
label, confidence = recognizer.predict(predict_image)# 输出结果
print('这人是:', dic[label])
print('置信度', confidence)

1. 代码整体结构

这段代码实现了一个简单但完整的人脸识别系统,主要流程包括:

  1. 加载训练图像
  2. 准备对应标签
  3. 创建识别器
  4. 训练模型
  5. 预测新图像
  6. 输出结果

2. 导入库解析

import cv2
import numpy as np
  • cv2:OpenCV库,提供计算机视觉相关功能,这里主要使用其人脸识别模块
  • numpy:Python科学计算基础库,用于处理数组和矩阵运算

3. 训练数据准备

images = []
images.append(cv2.imread('linyuner 1.jpg', cv2.IMREAD_GRAYSCALE))
images.append(cv2.imread('linyuner 2.jpg', cv2.IMREAD_GRAYSCALE))
images.append(cv2.imread('chendulin 1.jpg', cv2.IMREAD_GRAYSCALE))
images.append(cv2.imread('chendulin 2.jpg', cv2.IMREAD_GRAYSCALE))
  • cv2.imread():读取图像文件
    • 第一个参数:图像路径
    • 第二个参数cv2.IMREAD_GRAYSCALE:以灰度模式读取图像,因为人脸识别通常不需要颜色信息
  • 将读取的图像存储在images列表中

4. 标签系统

labels = [0, 0, 1, 1]
dic = {0: '林允儿', 1: '陈都灵', -1: '无法识别'}
  • labels:与训练图像对应的数字标签
    • 0代表"林允儿"
    • 1代表"陈都灵"
  • dic:字典,将数字标签映射为可读的名称
    • -1表示无法识别的情况

5. 待识别图像加载

predict_image = cv2.imread('chendulin 3.jpg', cv2.IMREAD_GRAYSCALE)
  • 同样以灰度模式加载待识别的图像
  • 放入一张陈都灵的照片进行检验,后面代码会显示预测结果
    在这里插入图片描述

6. LBPH识别器创建

recognizer = cv2.face.LBPHFaceRecognizer_create(threshold=80)
  • LBPH(Local Binary Patterns Histograms):局部二值模式直方图
    • 一种高效的人脸识别算法
    • 对光照变化有一定鲁棒性
  • threshold=80:设置识别阈值
    • 当预测的置信度距离大于此值时,返回-1(无法识别)
    • 这个值需要根据实际情况调整

7. 模型训练

recognizer.train(images, np.array(labels))
  • 使用训练图像和对应标签训练模型
  • 将Python列表转换为numpy数组,这是OpenCV函数常见的输入要求

8. 预测执行

label, confidence = recognizer.predict(predict_image)
  • predict():对新的图像进行预测
  • 返回两个值:
    • label:预测的标签(对应之前的0或1)
    • confidence:置信度(距离值),越小表示匹配度越高

9. 结果输出

print('这人是:', dic[label])
print('置信度', confidence)
  • 使用字典将数字标签转换为可读名称
  • 输出识别结果和置信度
  • 结果输出如下:

在这里插入图片描述

三、 LBPH算法原理解析

LBPH工作的三个主要步骤:

  1. 局部二值模式(LBP)特征提取

    • 对每个像素与其邻域像素比较
    • 生成二进制模式
  2. 直方图构建

    • 将图像分成多个小区域
    • 为每个区域构建LBP直方图
  3. 比较直方图

    • 比较输入图像与训练图像的直方图
    • 使用卡方距离等度量方法

四、关键点解析

  1. 图像加载:所有图像都以灰度模式加载(cv2.IMREAD_GRAYSCALE),因为人脸识别通常不需要颜色信息。

  2. 标签系统:使用数字标签(0,1)对应不同人物,并通过字典转换为可读名称。

  3. LBPH算法:Local Binary Patterns Histograms是一种高效的人脸识别算法,对光照变化有一定的鲁棒性。

  4. 阈值设置:阈值设为80,当预测的置信度高于此值时,返回-1(无法识别)。

  5. 训练与预测:先使用已知图像训练模型,然后对新的图像进行预测。

五、改进方向

  1. 增加更多的人脸样本以提高准确性
  2. 实现实时摄像头人脸识别
  3. 添加人脸检测功能,自动裁剪人脸区域
  4. 使用更先进的深度学习模型

总结

通过这个简单的示例,我们了解了如何使用OpenCV实现基础的人脸识别功能。虽然这个系统比较简单,但它展示了人脸识别的基本原理和工作流程。随着样本数量的增加和算法的优化,系统的识别准确率可以进一步提高。

希望这篇博客对你理解人脸识别技术有所帮助!如果你有任何问题或建议,欢迎在评论区留言。

万事胜意,得偿所愿!加油各位!!!🚀🚀🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/81262.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ElasticSearch重启之后shard未分配问题的解决

以下是Elasticsearch重启后分片未分配问题的完整解决方案,结合典型故障场景与最新实践: 一、快速诊断定位 ‌检查集群状态 GET /_cluster/health?pretty # status为red/yellow时需关注unassigned_shards字段值 ‌ 2.查看未分配分片详情 …

CSS- 3.1 盒子模型-块级元素、行内元素、行内块级元素和display属性

本系列可作为前端学习系列的笔记,代码的运行环境是在HBuilder中,小编会将代码复制下来,大家复制下来就可以练习了,方便大家学习。 HTML系列文章 已经收录在前端专栏,有需要的宝宝们可以点击前端专栏查看! 点…

Git/GitLab日常使用的命令指南来了!

在 GitLab 中拉取并合并代码的常见流程是通过 Git 命令来完成的。以下是一个标准的 Git 工作流,适用于从远程仓库(如 GitLab)拉取代码、切换分支、合并更新等操作。 🌐 一、基础命令:拉取最新代码 # 拉取远程仓库的所…

HTML 表格与div深度解析区别及常见误区

一、HTML<div>元素详解 <div>是HTML中最基本的块级容器元素&#xff0c;本身没有语义&#xff0c;主要用于组织和布局页面内容。以下是其核心用法&#xff1a; 1. 基础结构与特性 <div><!-内部可包含任意HTML元素 --><h2>标题</h2><p…

mybatisPlus 新增时 其他字段的值和 id 保持一致实现方法

MyBatis-Plus 实现 sp_id_path 与 id 同步的方案 要实现新增时 sp_id_path 自动与 id 保持一致&#xff0c;需要在实体类和插入逻辑中做相应处理。MyBatis-Plus 提供了几种方式来实现这一需求&#xff1a; 方案一&#xff1a;使用 MyBatis-Plus 的自动填充功能 这是最优雅的…

兰亭妙微设计:为生命科技赋予人性化的交互语言

在医疗科技日新月异的今天&#xff0c;卓越的硬件性能唯有匹配恰如其分的交互语言&#xff0c;方能真正发挥价值。作为专注于医疗UI/UX设计的专业团队&#xff0c;兰亭妙微设计&#xff08;www.lanlanwork.com&#xff09;始终相信&#xff1a;每一处像素的排布&#xff0c;都应…

Tcping详细使用教程

Tcping详细使用教程 下载地址 https://download.elifulkerson.com/files/tcping/0.39/在windows环境下安装tcping 在以上的下载地中找到exe可执行文件&#xff0c;其中tcping.exe适用于32位Windows系统&#xff0c;tcping64.exe适用于64位Windows操作系统。 其实tcping是个…

springCloud/Alibaba常用中间件之Seata分布式事务

文章目录 SpringCloud Alibaba:依赖版本补充Seata处理分布式事务(AT模式)AT模式介绍核心组件介绍AT的工作流程&#xff1a;两阶段提交&#xff08;**2PC**&#xff09; Seata-AT模式使用Seata(2.0.0)下载、配置和启动Seata案例实战前置代码添加全局注解 GlobalTransactional Sp…

COMSOL随机参数化表面流体流动模拟

基于粗糙度表面的裂隙流研究对于理解地下水的流动、污染物传输以及与之相关的地质灾害&#xff08;如滑坡&#xff09;等方面具有重要意义。本研究通过蒙特卡洛方法生成随机表面形貌&#xff0c;并利用COMSOL Multiphysics对随机参数化表面的微尺度流体流动进行模拟。 参数化…

初识——QT

QT安装方法 一、项目创建流程 创建项目 入口&#xff1a;通过Qt Creator的欢迎页面或菜单栏&#xff08;文件→新建项目&#xff09;创建新项目。 项目类型&#xff1a;选择「Qt Widgets Application」。 路径要求&#xff1a;项目路径需为纯英文且不含特殊字符。 构建系统…

7-15 计算圆周率

π​131​352!​3573!​⋯357⋯(2n1)n!​⋯ 输入格式&#xff1a; 输入在一行中给出小于1的阈值。 输出格式&#xff1a; 在一行中输出满足阈值条件的近似圆周率&#xff0c;输出到小数点后6位。 输入样例&#xff1a; 0.01输出样例&#xff1a; 3.132157 我的代码 #i…

【图片识别工具】批量单据识别批量重命名,批量OCR识别图片文字并重命名,批量改名工具的使用步骤和注意事项

一、适用场景 ​​财务与发票管理​​&#xff1a;企业需处理大量电子发票或扫描件&#xff0c;通过OCR识别发票代码、金额等关键信息&#xff0c;自动重命名为发票号_金额.pdf格式&#xff0c;便于归档与税务审计。 ​​物流单据处理​​&#xff1a;物流公司需从运单中提取单…

Modbus TCP转Profinet网关:数字化工厂异构网络融合的核心枢纽

在现代工业生产中&#xff0c;随着智能制造和工业互联网的不断发展&#xff0c;数字化工厂成为了制造业升级的重要方向。数字化工厂的核心在于实现设备、数据和人的互联互通&#xff0c;而这其中&#xff0c;通信协议扮演着至关重要的角色。今天&#xff0c;我们就来探讨开疆智…

win11平台下的docker-desktop中的volume位置问题

因为需要搞个本地的mysql数据库&#xff0c;而且本地安装的程序较多&#xff0c;不想再安mysql了&#xff0c;就想到使用docker来安装。而且因为数据巨大&#xff0c;所以想到直接使用转移data文件夹的方式。 各种查询&#xff0c;而且还使用ai查询&#xff0c;他们都提到&…

【MySQL】项目实践

个人主页&#xff1a;Guiat 归属专栏&#xff1a;MySQL 文章目录 1. 项目实践概述1.1 项目实践的重要性1.2 项目中MySQL的典型应用场景 2. 数据库设计流程2.1 需求分析与规划2.2 设计过程示例2.3 数据库设计工具 3. 电子商务平台实践案例3.1 系统架构3.2 数据库Schema设计3.3 数…

React学习———CSS Modules(样式模块化)

CSS Modules CSS Modules&#xff08;样式模块化&#xff09;是一种用于模块化和局部作用域化CSS样式的技术&#xff0c;让CSS只在当前组件内生效&#xff0c;避免全局样式冲突的技术方案 工作原理 文件命名&#xff1a;通常以.module.css、.module.less、.module.scss等结尾…

agent 智能体应用产品:生图、生视频、代码等

生图片 Lovart&#xff1a;全球首个设计 Agent https://www.lovart.ai/ 生视频 AI 视频 Agent 产品&#xff1a;Medeo https://www.medeo.app/ 代码 vscode copilot、cursor、trae 其他research manus grok等各个大模型产品

青少年ctf平台应急响应-应急响应2

题目&#xff1a; 当前服务器被创建了一个新的用户&#xff0c;请提交新用户的用户名&#xff0c;得到的结果 ssh rootchallenge.qsnctf.com -p 30327 这个命令用于通过 SSH 协议连接到指定的远程服务器。具体解释如下&#xff1a; ssh&#xff1a;这是在 Unix-like 系统中…

码蹄集——圆包含

MT1181 圆包含 输入2个圆的圆心的坐标值&#xff08;x&#xff0c;y&#xff09;和半径&#xff0c;判断断一个圆是否完全包含另一个圆&#xff0c;输出YES或者NO。另&#xff1a;内切不算做完全包含。 格式 输入格式&#xff1a;输入整型&#xff0c;空格分隔。 每行输入一组…

基于EMD-PCA-LSTM的光伏功率预测模型研究

摘要 本文提出了一种结合经验模态分解(EMD)、主成分分析(PCA)和长短期记忆网络(LSTM)的混合预测模型,用于提高光伏功率预测的准确性。该模型首先利用EMD算法将非平稳的光伏功率序列分解为多个本征模态函数(IMF),然后通过PCA对多维气象特征进行降维处理,最后将处理后的特征输…