群晖中相册管理 immich大模型的使用

       相对于其他的相册管理软件,Immich的智能搜索和人脸识别功能是其优势,通过应用机器学习模型,其智能搜索和人脸识别功能更为先进。

一、大模型的下载与安装

       网上有大佬提供了相关大模型的下载:https://url22.ctfile.com/d/58003522-62058436-b932de?p=4215

        其中Roberta-Large-Vit-B-16Plus.zip是中文搜索要用的大模型,buffalo_l.zip是人脸横测的大模型。ViT-B-32__openai.zip好像是提取中文地址用的,好像不用也行,不知是不是新版immich已经自动支持中文地图和中文地址了。

       搜索模型也有较多版本,这个比较大,近5G,下载太慢,我先在网上找了个2.24G的,人脸检测模型也有很多,这只是其中一种,究竟那个效果要好一些,可能要自己试试才知道。下载后要上传到相应文件夹中。我是在/volume1/docker/immich下建了个model-cache文件夹,文件结构如下:

注意下载的文件要解压缩,子目录参考如下(也许不同版本有不同的目录结构,我的人脸检测还下载有另一个模型antelopev2):

       注意:各个模型上传好后,要把immich停用,然后再重建,也许模型才生效。

二、人脸识别及元数据的提取

        打开immich:用你NAS的IP加端口号如192.168.1.100:2283,打开immich客户端,登录后在右边的帐户各下点击系统管理,进入任务界面。

       运行人脸检测,对帐户中的照片进行人脸检测,完成后再根据人脸进行分组。如果照片比较多,这个过程会比较长。

       点击左上角,回到照片界面,点击下面的探索,可以看到人物、地点等,说明人脸检测、人脸识别成功。如对人脸头像不满意,还可以更换头像。

          而地点的出现,说明提取元数据也完成了。

            人脸检测设置比较简单,只需在任务设置里选择好模型就好。

三、智能搜索的设置

        智能搜索的设置就要复杂的多,我是设置后又花了太长时间运行,然后用文字一搜索,竟然没有成功。后来反思,应是以前用的模型有问题,而我也没找到大模型加载成功与否的判断方法,白白在大夏天让电脑在高温下运行了N长的时间。某种程度来说,这才是我写这篇文章的初衷和动力,希望和我一样的菜鸟少走一些弯路。

        首先要在任务设置中打开智能搜索,并将默认的不支持中文的模型替换成现在的模型XLM-Roberta-Large-Vit-B-16Plus。

       其次,还要修改配置文件docker-compose.yml。

         将 - model-cache:/cache改为   - ./model-cache:/cache。大致意思是将当前目录(immich)下的 model-cache目录映射为cache目录(可能在运行人脸识别前就应修改此处)。同样保存后要重新构建immich 项目。

       重新构建项目后,模型XLM-Roberta-Large-Vit-B-16Plus究竟有没正确加载呢?有的网文说要看immich_machine_learning的日志中是否有load XLM-Roberta-Large-Vit-B-16Plus之类。       

        刚才有又重新查看了日志,应该是说明加载成功了:

        但我重新下载模型并重启immich项目时等了好长时间,一直没有任何关于 XLM-Roberta-Large-Vit-B-16Plus的提示:

        为了判断模型加载是否成功,我就在探索中输入中文内容搜索,同时打开终端机,终于发现了我所想要的内容。同时搜索结果也出来了:

        虽然智能搜索还没有运行完成,所以相关数据库还没有建立,这些搜索应是实时搜索,但结果还是很快,准确度也还行。也许数据库建立后,中文搜索会更迅速更准确吧。这才是我们花大量时间部署immich的初衷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/89424.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/89424.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在 Windows 上使用 Docker 运行 Elastic Open Crawler

作者:来自 Elastic Matt Nowzari 了解如何使用 Docker 在 Windows 环境中运行 Open Crawler。 了解将数据摄取到 Elasticsearch 的不同方式,并深入实践示例,尝试一些新方法。 Elasticsearch 拥有大量新功能,助你为特定场景构建最…

iOS高级开发工程师面试——RunTime

iOS高级开发工程师面试——RunTime 一、简介 二、介绍下 RunTime 的内存模型(isa、对象、类、metaclass、结构体的存储信息等) 对象 类 三、为什么要设计 metaclass ? 四、class_copyIvarList & class_copyPropertyList区别? 五、class_rw_t 和 class_ro_t 的区别? 六…

实现分页查询

分页查询分页查询语句项目中添加分页功能按钮设置前后端代码功能实现分页查询语句 限制查询的 sql 语句: select * from student limit 0,4sql 查询结果如下: 分页查询的每一页都对应一行 sql 语句,若每一行都写单独对应的 sql 语句不仅重复…

[QOI] qoi_desc | qoi_encode | qoi_decode

链接:https://phoboslab.org/log/2021/11/qoi-fast-lossless-image-compression (看代码设计的时候,真的大为震撼,伟大的algorithm T.T) docs:QOI图像格式 qoi项目提出了Quite OK Image(QOI&am…

智慧城轨可视化:一屏智管全城

图扑智慧城轨可视化系统,把地铁线路、车站、列车都搬进三维画面。列车晚点预警、站台拥挤提示、设备故障定位…… 这些关键信息一屏聚合,调度员能快速调整发车频次,疏导高峰客流。遇上突发情况,系统联动应急方案,同步显…

包新的Git安装与使用教程(2024九月更新)

目录 一、安装git 1.下载git 2.git安装 3.环境变量配置与测试 二、使用教程 1.创建版本库 2.版本回退 3.删除和恢复文件 一、安装git 1.下载git 官方下载地址:https://git-scm.com/download 然后进入以下页面,点击下载链接即可(windows一般都是…

中望3D 2026亮点速递(1)-全新槽功能螺纹功能,减少繁琐操作

本文为CAD芯智库整理,未经允许请勿复制、转载!中望3D 2026全新的槽功能,包括:(1)可快速生成多种槽形;(2)快速生成一个或多个槽;(3)支持…

2025毫米波雷达技术白皮书:智能汽车与物联网的感知核心

随着人工智能、物联网(IoT)和智能汽车产业的迅猛发展,毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力,广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年&#x…

用 React-Three-Fiber 实现雪花下落与堆积效果:从零开始的 3D 雪景模拟

在 Web3D 开发中,自然现象模拟一直是极具吸引力的主题。本文将基于 React-Three-Fiber(R3F)框架,详解如何实现一个包含雪花下落、地面堆积的完整雪景效果。我们会从基础粒子系统入手,逐步完善物理交互逻辑,…

从抓包GitHub Copilot认证请求,认识OAuth 2.0技术

引言 在现代开发工具中,GitHub Copilot 以智能、嵌入式的人工智能代码补全能力著称。作为一项涉及用户敏感数据和付费授权的服务,其认证授权流程尤为值得技术研究。本文基于实际抓包 VS Code 中的 Copilot 登录认证请求,系统梳理其 OAuth 2.…

Linux操作系统之线程:分页式存储管理

目录 前言: 一、分页式存储管理 二、二级页表的地址转化 三、缺页中断 总结 前言: 我们上篇文章简单介绍了线程的一些知识点,但是还有很多坑没有给大家填上,包括页表部分我们还没为大家说明。 本篇文章我将会继续为大家讲解…

xss1-8

Level-1<script>alert()</script>基础反射型 无任何过滤Level-2"> <script>alert()</script> <"闭合属性&#xff1a;">用来闭合当前标签的value属性注入新标签&#xff1a;闭合属性后&#xff0c;插入独立的<script>…

51c嵌入式~单片机~合集1

自己的原文哦~ https://blog.51cto.com/whaosoft/11897656 一、STM32的启动模式配置与应用 三种BOOT模式 所谓启动&#xff0c;一般来说就是指我们下好程序后&#xff0c;重启芯片时&#xff0c;SYSCLK的第4个上升沿&#xff0c;BOOT引脚的值将被锁存。用户可以通过设…

Typecho分类导航栏开发指南:从基础到高级实现

文章目录 Typecho分类导航栏深度解析:父分类与子分类的完美呈现 引言 一、Typecho分类系统基础 1.1 Typecho分类结构 1.2 获取分类数据的基本方法 二、基础分类导航输出 2.1 简单的平铺式导航 2.2 带计数器的分类导航 三、层级分类导航实现 3.1 递归输出父子分类 3.2 使用Type…

C++异步编程工具 async promise-future packaged_task等

深入探讨 C11 中引入的四个核心异步编程工具&#xff1a;std::async, std::future, std::promise, 和 std::packaged_task。它们共同构成了 C 现代并发编程的基础。 为了更好地理解&#xff0c;我们可以使用一个餐厅点餐的类比&#xff1a; std::future (取餐凭证)&#xff1…

Linux-网络管理

网络管理1. 网络基础1.1 TCP/IP 协议栈&#xff08;四层模型&#xff09;1.2 网络设备配置与基础概念1.3 网络接口命名规则1.4 网络配置文件位置2. 常用网络配置命令2.1 查看网络接口信息2.2 配置 IP 地址2.3 启用/禁用网卡2.4 修改网卡 MAC 地址2.5 配置网卡的 MTU&#xff08…

Linux锁的概念及线程同步

目录 1.常见锁概念 死锁 死锁四个必要条件 避免死锁 避免死锁算法 2. Linux线程同步 条件变量 同步概念与竞态条件 条件变量函数 初始化 销毁 等待条件满足 唤醒等待 简单案例&#xff1a; 条件变量使用规范 1.常见锁概念 死锁 死锁是指在一组进程中的各个进程均占有不会释放的…

docker更换国内加速器-更换华为加速器2025-717亲测可用docker 拉取镜像出错

[rootlocalhost ~]# docker pull nginx Using default tag: latest Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)报错原因就是…

Unity VR多人手术模拟恢复2:客户端移动同步问题分析与解决方案

Unity VR多人手术模拟恢复2&#xff1a;客户端移动同步问题分析与解决方案 &#x1f3af; 问题背景 在开发基于Unity Mirror网络架构的VR多人手术模拟系统时&#xff0c;我们遇到了一个复杂的客户端移动同步问题&#xff1a; 主要操作者&#xff08;第一个客户端&#xff09;&a…

uni-app开发的页面跳转全局加载中

uni-app开发的页面跳转全局加载中首先需要下载插件创建加载中页面组件app.vue页面中监听跳转首先需要下载插件 https://ext.dcloud.net.cn/plugin?id20613 创建加载中页面组件 <!-- 全局自定义加载中 --> <template><view v-if"visible" class&qu…