ann算法的种类有哪些,之间的区别,各自的适用场景

ANN(近似最近邻)算法主要分为三类技术路线:基于树的方法哈希方法图方法,它们在原理、性能及适用场景上有显著差异:


1. 基于树的方法

核心原理:递归划分数据空间形成树状结构(如二叉树或多叉树),通过树遍历快速筛选候选点。
典型算法

  • KD-Tree:按维度交替分割空间,适合低维数据(维度 < 20)。高维时性能退化明显(“维度灾难”)。
  • Annoy(Approximate Nearest Neighbors Oh Yeah):构建多棵二叉树,通过投票机制提升召回率。平衡精度与速度,支持分布式索引(如Spotify推荐系统)。

适用场景
✅ 低维空间精确搜索(如2D/3D地理位置检索)
✅ 中等规模数据集(百万级)
⚠️ 高维数据效率低,需配合降维技术


2. 哈希方法

核心原理:将高维数据映射为低维二进制编码(哈希桶),相似点落在相同或相邻桶中。
典型算法

  • 局部敏感哈希(LSH):设计哈希函数使相似点碰撞概率高。内存占用低,但参数调优复杂,召回率不稳定。
  • 乘积量化(PQ):将向量分割为子向量并分别量化,组合码本压缩表示。压缩比高,适合超大向量库(如十亿级图像检索)。

适用场景
✅ 超大规模高维数据(如图像/视频特征检索)
✅ 资源受限环境(低内存、分布式存储)
⚠️ 二进制编码损失信息,精度略低于图方法


3. 图方法

核心原理:构建近邻图(节点=数据点,边=相似关系),通过图遍历查找最近邻。
典型算法

  • HNSW(Hierarchical Navigable Small World):多层图结构,高层为“高速路”快速定位,底层精细搜索。查询速度最快,精度接近暴力搜索。
  • NSG(Navigating Spreading-out Graph):优化图连通性,减少冗余边。内存效率更高,适合对内存敏感场景。

适用场景
✅ 高精度实时检索(推荐系统、语义匹配)
✅ 十亿级高维数据(如OpenAI Embedding检索)
⚠️ 建图时间长,动态更新成本高


对比总结与选型建议

方法精度查询速度内存占用适用场景
树方法中高低维数据、中等规模数据集
哈希方法极低超大规模数据、资源受限环境
图方法极高极快高精度实时检索、十亿级向量库

决策参考

  • 需求高精度+低延迟 → 选择 HNSW
  • 数据规模超大规模+内存敏感 → 选择 PQ哈希
  • 维度低于20维 → 选择 KD-Tree

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/83513.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云服务器部署Gin+gorm 项目 demo

更多个人笔记见&#xff1a; &#xff08;注意点击“继续”&#xff0c;而不是“发现新项目”&#xff09; github个人笔记仓库 https://github.com/ZHLOVEYY/IT_note gitee 个人笔记仓库 https://gitee.com/harryhack/it_note 个人学习&#xff0c;学习过程中还会不断补充&…

【学习笔记】TCP 与 UDP

TCP&#xff08;Transmission Control Protocol&#xff09;与UDP&#xff08;User Datagram Protocol&#xff09;是 网络通讯 中最基础也最常用的两种 传输层 协议。 文章目录 1. 简介2. OSI 与 TCP/IP 模型中的定位3. 协议原理与关键机制3.1 UDP3.2 TCP 5. 实践&#xff1a;…

HikariCP 可观测性最佳实践

HikariCP 介绍 HikariCP 是一个高性能、轻量级的 JDBC 连接池&#xff0c;由 Brett Wooldridge 开发。它以“光”命名&#xff0c;象征快速高效。它支持多种数据库&#xff0c;配置简单&#xff0c;通过字节码优化和智能管理&#xff0c;实现低延迟和高并发处理。它还具备自动…

Java SpringBoot 调用大模型 AI 构建智能应用实战指南

一、基础知识 &#xff08;一&#xff09;Java基础 Java是一种广泛使用的高级编程语言&#xff0c;具有简单、面向对象、分布式、解释型、健壮、安全、架构中立、可移植、高性能、多线程和动态等特点。在构建基于Spring Boot的AI应用之前&#xff0c;您需要具备扎实的Java基础…

电路图识图基础知识-降压启动(十五)

降压启动电动机控制电路 降压启动&#xff0c;是指启动时降低加在电动机定子绕组上的电压&#xff0c;待电动机启动起来后再将电压 恢复到额定值&#xff0c;使之运行在额定电压下。降压启动可以减小启动电流&#xff0c;从而减小线路电压降。 传统的降压启动包括定子串电阻或…

2025年大模型平台落地实践研究报告|附75页PDF文件下载

本报告旨在为各行业企业在建设落地大模型平台的过程中&#xff0c;提供有效的参考和指引&#xff0c;助力大模型更高效更有价值地规模化落地。本报告系统性梳理了大模型平台的发展背景、历程和现状&#xff0c;结合大模型平台的特点提出了具体的落地策略与路径&#xff0c;同时…

Docker慢慢学

1、Docker DeskTop 2、N8N下载 3、Kafka docker run -d --name kafka -p 9092:9092 -e KAFKA_BROKER_ID1 -e KAFKA_ZOOKEEPER_CONNECTzookeeper:2181 -e KAFKA_ADVERTISED_LISTENERSPLAINTEXT://localhost:9092 -e KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR1 con…

Java 中创建线程主要有三种方式

在 Java 中&#xff0c;创建线程主要有三种方式&#xff0c;每种方式各有特点和适用场景。以下是详细说明和代码示例&#xff1a; 1. 继承 Thread 类 原理&#xff1a;自定义类继承 Thread 并重写 run() 方法&#xff0c;通过调用 start() 启动新线程。 特点&#xff1a;简单直…

ck-editor5的研究 (5):优化-页面离开时提醒保存,顺便了解一下 Editor的生命周期 和 6大编辑器类型

前言 经过前面的 4 篇内容&#xff0c;我们已经慢慢对 CKEditor5 熟悉起来了。这篇文章&#xff0c;我们就来做一个优化&#xff0c;顺便再补几个知识点&#xff1a; 当用户离开时页面时&#xff0c;提醒他保存数据了解一下 CKEditor5 的 六大编辑器类型了解一下 editor 实例对…

第42节:模型优化与部署:Web服务部署(Flask, FastAPI)

1. 引言 在现代人工智能和机器学习应用中,模型的开发只是整个流程的一部分。 将训练好的模型有效地部署为可访问的Web服务,使其能够处理实际请求并返回预测结果,是模型价值实现的关键环节。Python生态系统提供了多种轻量级Web框架,其中Flask和FastAPI是目前最受欢迎的选择…

LabVIEW超宽带紧凑场测量系统

采用 LabVIEW 开发超宽带紧凑场测量系统&#xff0c;实现天线方向图、目标雷达散射截面&#xff08;RCS&#xff09;及天线增益的自动化测量。通过品牌硬件设备&#xff0c;优化系统架构&#xff0c;解决传统测量系统在兼容性、数据处理效率及操作便捷性等方面的问题&#xff0…

vue2使用笔记、vue2和vue3的区别

文章目录 vue2和vue3的区别1. 实现数据响应式的原理不同2. 生命周期不同3. vue 2.0 采用了 option 选项式 API&#xff0c;vue 3.0 采用了 composition 组合式 API4. 新特性编译宏5. 父子组件间双向数据绑定 v-model 不同6. v-for 和 v-if 优先级不同7. 使用的 diff 算法不同8.…

CSS3美化页面元素

1. 字体 <span>标签 字体样式⭐ 字体类型&#xff08;font-family&#xff09; 字体大小&#xff08;font-size&#xff09; 字体风格&#xff08;font-style&#xff09; 字体粗细&#xff08;font-weight&#xff09; 字体属性&#xff08;font&#xff09; 2. 文本 文…

【笔记】Windows 下载并安装 ChromeDriver

以下是 在 Windows 上下载并安装 ChromeDriver 的笔记&#xff1a; ✅ Windows 下载并安装 ChromeDriver 1️⃣ 确认 Chrome 浏览器版本 打开 Chrome 浏览器 点击右上角 ︙ → 帮助 → 关于 Google Chrome 记下版本号&#xff0c;例如&#xff1a;114.0.5735.199 2️⃣ 下载…

工厂模式 vs 策略模式:设计模式中的 “创建者” 与 “决策者”

在日常工作里&#xff0c;需求变动或者新增功能是再常见不过的事情了。而面对这种情况时&#xff0c;那些耦合度较高的代码就会给我们带来不少麻烦&#xff0c;因为在这样的代码基础上添加新需求往往困难重重。为了保证系统的稳定性&#xff0c;我们在添加新需求时&#xff0c;…

Java web学习路径预览

Java web学习路径预览 &#xff08;图源&#xff1a;黑马程序员&#xff09; 目录 Java web学习路径预览 一、HTML、CSS、JS 1. HTML (HyperText Markup Language): 网页的骨架 2. CSS (Cascading Style Sheets): 网页的皮肤 3. JavaScript (JS): 网页的行为 二、Ajax、…

linux、docker、git相关操作

1 linux 1.1解压缩 1.1.1 zip zip xxx.zip file 把名为fle的文件压缩成xxx.zip -r 递归压缩&#xff1a;加上该选项才能压缩文件夹 zip -r example_new.zip 示例集 # 新建压缩包并命名为 example_new.zip zip -r xxx.zip file1 file2 dir1 将多个文件目录压成zip包 unzip fi…

Attention Is All You Need (Transformer) 以及Transformer pytorch实现

参考https://zhuanlan.zhihu.com/p/569527564 Attention Is All You Need (Transformer) 是当今深度学习初学者必读的一篇论文。 一. Attention Is All You Need (Transformer) 论文精读 1. 知识准备 机器翻译&#xff0c;就是将某种语言的一段文字翻译成另一段文字。 由…

深入浅出:Oracle 数据库 SQL 执行计划查看详解(1)——基础概念与查看方式

背景 在当今的软件开发领域&#xff0c;尽管主流开发模式往往倾向于采用单表模式&#xff0c;力图尽可能地减少表之间的连接操作&#xff0c;以期达到提高数据处理效率、简化应用逻辑等目的。然而&#xff0c;对于那些已经上线运行多年的运维老系统而言&#xff0c;它们内部往…

每天掌握一个Linux命令 - fail2ban

Linux 命令工具 fail2ban 使用指南 目录 Linux 命令工具 fail2ban 使用指南一、工具概述二、安装方式1. 包管理器安装&#xff08;推荐&#xff09;Debian/Ubuntu 系统CentOS/RHEL 系统Arch Linux 系统 2. 手动编译安装&#xff08;适用于自定义需求&#xff09; 三、核心功能四…