向量数据库该如何选择?Milvus 、ES、OpenSearch 快速对比:向量搜索能力与智能检索引擎的应用前景

1.milvus VS ES

Milvus 的亮点

  • 功能性:Milvus 不仅支持基本的向量相似性搜索,还支持稀疏向量、批量向量、过滤搜索和混合搜索功能等高级功能。

  • 灵活性:Milvus 支持多种部署模式和多个 SDK,所有这些都在一个强大的集成生态系统中实现。

  • 性能:Milvus 采用HNSW和DiskANN 等优化索引算法以及先进的GPU 加速,可确保高吞吐量和低延迟的实时处理。

  • 可扩展性:其定制的分布式架构可轻松扩展,从小型数据集到超过 100 亿向量的 Collections 都能轻松应对。
    在这里插入图片描述

1.1常规对比

  • milvus-vs-elastic:https://zilliz.com.cn/comparison/milvus-vs-elastic
  • milvus网址:https://milvus.io/
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

1.2 性能对比

VectorDBBench —— 向量数据库性能测试工具

在这里插入图片描述

  • miluvs路线图

Milvus几乎坐稳了向量搜索领域的头把交椅,最近两年加强了向量搜索本身的功能(支持多向量字段的混合搜索、优化了GPU加速),恶补了关键字搜索功能(支持BM25算法),还免费提供主流的重排序算法,相比而言,Elasticsearch对于向量搜索领域的探索,还是比较挤牙膏,连基本的RRF算法,也要收费。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

milvus 客户案例

2.1 唯品会性能提升10倍

案例:https://zilliz.com.cn/customers/%E5%94%AF%E5%93%81%E4%BC%9A

用户痛点:使用 Elasticsearch 导致高延时和高运维成本,ES检索百万商品并召回 TopK 结果的平均延时在 300 ms 左右,milvus30ms,相差10倍

在这里插入图片描述

2.2 点石科技转型 AI 智能服务商

https://zilliz.com.cn/customers/%E7%82%B9%E7%9F%B3%E7%A7%91%E6%8A%80

在这里插入图片描述

2.3 更多案例

https://zilliz.com.cn/customers

https://milvus.io/zh/use-cases

在这里插入图片描述

3.成本问题

Zilliz 定价

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

4. OpenSearch-阿里

基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,目前为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过内置各行业的查询语义理解、机器学习排序算法等能力,以及充分开放的文本向量检索引擎能力,助力开发者快速搭建智能搜索服务。

智能开放搜索 OpenSearch
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
更多内容参考官方文档:https://help.aliyun.com/zh/open-search/high-performance-searchedition/product-overview/?spm=a2c4g.11186623.0.i1

5.embedding维度建议

短文本(如100字左右):- 对于短文本,通常推荐使用较低维度的向量,例如512维或768维

中等长度文本(如500字到2000字):- 中等长度的文本可以使用768维或1024维的向量。这些维度能够较好地平衡信息的丰富性和计算效率。

  • jina-1024维度
    [图片]

在这里插入图片描述

长文本(如超过2000字):- 对于较长的文本,建议使用更高维度的向量,例如1024维或更高?。[目前文本长度在8192]

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/907171.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL进阶之旅 Day 4:子查询与临时表优化

文章标题 【SQL进阶之旅 Day 4】子查询与临时表优化 文章内容 开篇:SQL进阶之旅的第4天 在“SQL进阶之旅”系列中,第4天的主题是子查询与临时表优化。这是SQL开发中不可或缺的一部分,尤其在处理复杂查询时,合理使用子查询和临…

Python学习(2) ----- Python的类型

在 Python 中,一切皆对象,每个对象都有类型。下面是 Python 中的常见内置类型分类和示例: 🟡 1. 数字类型(Numeric Types) 类型说明示例int整数5, -42float浮点数3.14, -0.5complex复数1 2j a 10 …

跨协议协同智造新实践:DeviceNet-EtherCAT网关驱动汽车焊接装配效能跃迁

在汽车制造领域,机器人协作对于提升生产效率与产品质量至关重要。焊接、装配等关键环节,需要机器人与各类设备紧密配合。JH-DVN-ECT疆鸿智能的devicenet从站转ethercat主站协议网关,成为实现这一高效协作的得力助手,尤其是在连接欧…

nginx之proxy_buffering的作用

Nginx 的缓冲机制是为了让后端能更快释放资源,而不是卡在慢客户端上,从而提升整体性能和并发能力。 现实中客户端和后端服务器之间的传输速率可能差异很大。Nginx 的缓冲机制正是为了解决这个不匹配问题。 假设没有缓冲(即 proxy_buffering…

数据库相关问题

1.保留字 1.1错误案例(2025/5/27) 报错: java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near condition, sell…

GO 语言进阶之 进程 OS与 编码,数据格式转换

更多个人笔记见: github个人笔记仓库 gitee 个人笔记仓库 个人学习,学习过程中还会不断补充~ (后续会更新在github上) 文章目录 进程信息OS操作基本例子 编码相关HASH 哈希Base64 encoding 基础64编码 数据格式转换和处…

如何用Spring Cache实现对Redis的抽象

我们在进行Java项目开发时候,经常会用到Redis缓存例如数据库里的一些信息、手机验证码之类的,正常写法就会像去连mysql一样,这种硬编码的方式肯定是非常不合适的。 Autowireprivate UserMapper userMapper;Autowireprivate StringCommand str…

CMake指令:file()

目录 1.简介 2.常用子命令(COMMAND) 2.1.COPY - 复制文件或目录 2.2.RENAME - 重命名文件或目录 2.3.REMOVE - 删除文件或目录 2.4.MAKE_DIRECTORY - 创建目录 2.5.READ - 读取文件内容 2.6.WRITE - 写入文件内容 2.7.GLOB - 按模式匹配文件 2…

使用VuePress开发日志

结合官方教程,补充一些细节。 快速上手 | VuePress中文文档 | VuePress中文网 VuePress使用步骤 创建并进入一个新目录 mkdir vuepress-starter && cd vuepress-starter使用你喜欢的包管理器进行初始化 yarn init # npm init将 VuePress 安装为本地依赖 …

随手记录7

2025年5月26日~2025年6月01日 周一:没做 周二:芹菜炒鸡蛋香肠 周三: 周四: 周五: 周六: 周日:

【无标题】使用JEasyOpc开发OPCDA采集中间件

使用JEasyOpc开发OPCDA采集中间件 1.JEasyOpc下载2.修改JEasyOpc源码及打包安装3.Pom 引入jeasy2.3.2.jar4.maven pom 配置打包5.cmd执行(手动指定 main主程序入口)6.EXE4J打包jar包,生成exe可执行文件 1.JEasyOpc下载 jeasyopc源码下载&…

5 WPF中的Page页面的使用

以下是一个简单的WPF示例,演示如何在三个Page之间进行导航切换,使用Frame控件作为导航容器,并包含基本的导航按钮(前进/后退/主页) Page类更简单,比Window更精简。 代码见下文以及资源文件: htt…

基于51单片机的音乐盒点阵屏proteus仿真

地址: https://pan.baidu.com/s/1hYzg2icjHV8jWJdltJkKxw 提取码:1234 仿真图: 芯片/模块的特点: AT89C52/AT89C51简介: AT89C51 是一款常用的 8 位单片机,由 Atmel 公司(现已被 Microchip 收…

图论:floyed算法

Floyd 算法是一种用于寻找加权图中所有顶点对之间最短路径的经典算法,它能够处理负权边,但不能处理负权环。即如果边权有负数,切负权边与其他边构成了环就不能用该算法。该算法的时间复杂度为 \(O(V^3)\),其中 V 是图中顶点的数量…

STM32之看门狗(IWDG)

一、看门狗外设的原理与应用 背景说明 随着单片机的发展,单片机在家用电器、工业自动化、生产过程控制、智能仪器仪表等领域的应用越来越广泛。然而处于同一电力系统中的各种电气设备通过电或磁的联系彼此紧密相连,相互影响,由于运行方式的…

#RabbitMQ# 消息队列进阶

目录 消息可靠性 一 生产者的可靠性 1 生产者的重连 2 生产者的确认 (1 Confirm* (2 Return 二 MQ的可靠性 1 数据持久化 2 Lazy Queue* 三 消费者的可靠性 1 消费者确认机制 2 消费失败处理 3 业务幂等性 四 延迟消息 消息可靠性 在消息队列中,可靠性…

《计算机组成原理》第 10 章 - 控制单元的设计

目录 10.1 组合逻辑设计 10.1.1 组合逻辑控制单元框图 10.1.2 微操作的节拍安排 10.1.3 组合逻辑设计步骤 10.2 微程序设计 10.2.1 微程序设计思想的产生 10.2.2 微程序控制单元框图及工作原理 10.2.3 微指令的编码方式 1. 直接编码(水平型) 2.…

AstroNex空间任务智能控制研究与训练数据集

数据集概述 AstroNex空间任务智能控制研究与训练数据集是朗迪锋科技基于Multiverse平台精心打造的首个全面覆盖航天器智能控制全周期的综合数据集产品。该数据集汇集了轨道动力学、姿态控制、机器视觉、环境感知等多维度数据,为航天器智能算法研发提供丰富的训练与…

​​3D 几何建模工具库​Open CASCADE(OCCT)简单介绍。

​​Open CASCADE(OCCT)​​ 的新手,我会用最简单的方式帮你理解它是什么、能做什么,以及如何快速上手。 ​​1. OCCT 是什么?​​ ​​一句话定义​​:OCCT 是一个开源的 ​​3D 几何建模工具库​​&…

[7-1] ADC模数转换器 江协科技学习笔记(14个知识点)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 DMA(Direct Memory Access,直接内存访问)是一种硬件特性,它允许某些硬件子系统直接访问系统的内存,而无需CPU的介入。这样,CPU就可以处理其他任务,从而提高系…