Elasticsearch 的自动补全以及RestAPI的使用

Elasticsearch 提供了强大的自动补全 (Autocomplete) 功能,以下为一个基础的自动补全DSL语句

{"suggest": {"my_suggestion": {  // 自定义建议器名称,可按需修改"text": "ap",     // 用户输入的前缀(如搜索框输入的字符)"completion": {"field": "title_completion",  // 必须是 mapping 中定义的 completion 类型字段"size": 5,                    // 返回最多 5 条补全结果"skip_duplicates": true       // 跳过重复结果}}}
}
字段名作用注意事项
suggest固定顶层字段,所有建议查询(包括自动补全)都必须嵌套在该字段下必选
my_suggestion自定义建议器名称,用于区分不同的补全逻辑(可随意命名)必选,需保证语义清晰
text用户输入的前缀(如搜索框实时输入的字符,ES 会用它匹配补全结果)必选,需与业务场景的输入对应
completion固定类型,指定使用 Elasticsearch 「Completion Suggester」实现补全必选
field索引中定义的 completion 类型字段(需提前在 mapping 中配置)必选,字段类型必须正确
size控制返回的补全结果数量(如设置为 10 则最多返回 10 条)可选,默认 5
skip_duplicates是否跳过重复结果(true 则去重,false 保留重复)可选,默认 false

带上下文过滤器的DSL语句,如果你的补全需要区分类别 / 场景(如「手机」和「电脑」分类下的不同补全),可以用 contexts 过滤:

{"suggest": {"my_suggestion": {"text": "ip","completion": {"field": "title_completion","size": 5,"contexts": {  // 上下文过滤规则"category": [  // 假设 mapping 中定义了 category 上下文{"context": "electronics",  // 只返回「电子产品」分类的补全"boost": 2  // 结果权重 +2(可选,用于调整优先级)}]}}}}
}
字段名作用依赖条件
contexts按「上下文」过滤补全结果(如分类、地区等)mapping 需提前定义 context
category自定义的上下文名称(需与 mapping 中配置一致)必选(与 mapping 对应)
context具体的上下文值(如 "electronics" 表示「电子产品」分类)必选
boost给该上下文结果增加权重(影响排序,数值越大越靠前)可选,默认 1

如果用户输入可能有拼写错误,可以开启 fuzzy

{"suggest": {"my_suggestion": {"text": "aple",  // 故意模拟拼写错误"completion": {"field": "title_completion","fuzzy": {      // 开启模糊匹配"fuzziness": 1  // 允许 1 次编辑距离(如增/删/改 1 个字符)}}}}
}
字段名作用场景
fuzzy开启模糊匹配,允许用户输入有拼写错误时仍能匹配结果搜索框输入容错
fuzziness允许的最大编辑距离(0 严格匹配,1 允许 1 处错误,AUTO 自动适配)必选(开启模糊时)

以下为在java代码当中运用的实例

import org.apache.http.HttpHost;
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.search.suggest.Suggest;
import org.elasticsearch.search.suggest.SuggestBuilder;
import org.elasticsearch.search.suggest.SuggestBuilders;
import org.elasticsearch.search.suggest.completion.CompletionSuggestion;
import org.elasticsearch.search.builder.SearchSourceBuilder;
​
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
​
public class SimpleESAutocomplete {public static void main(String[] args) {// 构建 ES 客户端,连接本地 9200 端口try (RestHighLevelClient client = new RestHighLevelClient(RestClient.builder(new HttpHost("localhost", 9200, "http")))) {
​// 执行最简自动补全查询,参数:客户端、索引名、补全字段、用户输入前缀List<String> results = basicCompletionSuggest(client, "users", "name_suggest", "mic");System.out.println("自动补全结果: " + results);
​} catch (IOException e) {e.printStackTrace();}}
​/*** 最简自动补全方法:仅用 Completion Suggester 实现基础补全* 流程拆分:1.准备Request  2.准备DSL  3.发起请求  4.解析结果* @param client   ES 客户端* @param index    索引名称* @param field    补全字段(需是 mapping 中配置的 completion 类型)* @param prefix   用户输入的前缀关键字* @return 补全建议结果列表* @throws IOException 网络或 ES 操作异常*/private static List<String> basicCompletionSuggest(RestHighLevelClient client, String index, String field, String prefix) throws IOException {// 1. 准备 Request(初始化搜索请求 & 绑定索引)SearchRequest searchRequest = new SearchRequest(index); 
​// 2. 准备 DSL(构建补全相关的查询逻辑,设置到 SearchSourceBuilder 中)// 2.1 构建补全建议器CompletionSuggestionBuilder suggestionBuilder = SuggestBuilders.completionSuggestion(field).prefix(prefix)  // 设置用户输入的前缀.size(5);        // 最多返回 5 条补全结果(可按需调整)// 2.2 组装建议查询SuggestBuilder suggestBuilder = new SuggestBuilder();suggestBuilder.addSuggestion("simple_suggest", suggestionBuilder); // 2.3 把建议查询放入搜索源SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();sourceBuilder.suggest(suggestBuilder); // 2.4 将构建好的 DSL 关联到 RequestsearchRequest.source(sourceBuilder); 
​// 3. 发起请求(调用客户端的 search 方法执行查询)SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT); 
​// 4. 解析结果(从响应中提取补全建议并封装成 List 返回)List<String> results = new ArrayList<>();Suggest suggest = response.getSuggest();if (suggest != null) {//根据补全查询名称,获取补全结果CompletionSuggestion completionSuggestion = suggest.getSuggestion("simple_suggest");//获取option里面就是我们要传回的数据completionSuggestion.getOptions().forEach(option -> results.add(option.getText().string()));}return results;}
}

自动补全对字段也是有要求的,比方说类型应该是completion,字段值是多词条的数组以便于分词。、

关键步骤:

  1. 准备 Request:创建SearchRequest并指定索引。

  2. 准备 DSL:

    • 使用CompletionSuggestionBuilder构建补全查询,设置前缀和返回数量。

    • 将补全查询添加到SearchSourceBuilder中。

  3. 发起请求:执行查询并获取响应。

  4. 解析结果:从响应中提取补全建议文本,存入List返回。

注意事项:

  1. 数据准备

    • 必须先在 ES 中创建索引并定义completion类型字段。

    • 向索引中写入文档时,需填充补全字段。

  2. 映射限制

    • completion类型字段不支持分词,仅支持精确前缀匹配。

    • 如需分词后的前缀匹配,可使用search_as_you_type类型。

  3. 部署要求

    • 本地需运行 Elasticsearch 服务(默认 9200 端口)。

    • 依赖 ES Java 客户端(Maven/Gradle 引入)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84845.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1.4、SDH网状拓扑

链形网星形网树形网环形网网孔形网 1.链形拓扑 结构&#xff1a; 节点像链条一样首尾依次串联连接。信号从一个节点传到下一个节点&#xff0c;直至终点。 特点&#xff1a; 简单经济&#xff1a; 结构最简单&#xff0c;成本最低&#xff0c;适用于沿线覆盖&#xff08;如铁…

如何在 ArcGIS 中使用 Microsoft Excel 文件_20250614

如何在 ArcGIS 中使用 Microsoft Excel 文件 软件版本&#xff1a;win11; ArcGIS10.8; Office2024 1. 确认 ArcGIS 10.8 对 .xlsx 文件的支持 ArcGIS 10.8 支持 .xlsx 文件&#xff08;Excel 2007 及以上格式&#xff09;&#xff0c;但需要安装 Microsoft Access Database …

Python----OpenCV(图像处理——图像的多种属性、RGB与BGR色彩空间、HSB、HSV与HSL、ROI区域)

Python----计算机视觉处理&#xff08;opencv&#xff1a;像素&#xff0c;RGB颜色&#xff0c;图像的存储&#xff0c;opencv安装&#xff0c;代码展示&#xff09; Python----计算机视觉处理&#xff08;Opencv&#xff1a;图片颜色识别&#xff1a;RGB颜色空间&#xff0c;…

java设计模式[1]之设计模式概览

文章目录 设计模式什么是设计模式为什么要学习设计模式设计模式的设计原则设计模式的分类 设计模式 什么是设计模式 设计模式是前人根据经验的总结&#xff0c;是软件开发中的最佳实践&#xff0c;帮助开发者在面对复杂设计问题时提供有效的解决方案。设计模式不仅仅只是一种…

aflplusplus:开源的模糊测试工具!全参数详细教程!Kali Linux教程!(四)

使用 afl-lto clang LLVM 编译器 1. -help 显示可用选项 afl-lto --help 其他选项同上&#xff0c;这里不再展开叙述。 afl-lto 1. -help 显示可用选项 afl-lto --help 其他选项同上&#xff0c;这里不再展开叙述。 afl-network-client 1. 帮助文档 afl-network-cl…

区间合并:牛奶

区间合并&#xff1a;牛奶 牛奶 www.acwing.com/problem/content/description/1345/ 本质就是区间合并问题从第一次挤奶才开始计算两个最长时间 import java.util.*;public class Main {static final int N 5010;static Pair[] pairs new Pair[N];static class Pair imple…

Hive实现值列表横向展示(非列转行)

一、场景说明: 当前有各个流程的节点名称和节点时间。数仓中的表存在的格式为纵向存储,分别为节点名称、接收时间 现数据分析过程中需要将每个流程的节点时间横向展示,如果没有该节点则置空 这种区别于行转列和列转行的操作。(具体可参考博主**

蓝桥杯20151 跳石头

问题描述 小明正在和朋友们玩跳石头的小游戏&#xff0c;一共有 n 块石头按 1 到 n 顺序排成一排&#xff0c;第 i 块石头上写有正整数权值 ci​ 。 如果某一时刻小明在第 j 块石头&#xff0c;那么他可以选择跳向第 jcj​ 块石头 &#xff08;前提 jcj≤n &#xff09;或者跳…

深度学习——基于卷积神经网络的MNIST手写数字识别详解

文章目录 引言1. 环境准备和数据加载1.1 下载MNIST数据集1.2 数据可视化 2. 数据预处理3. 设备配置4. 构建卷积神经网络模型5. 训练和测试函数5.1 训练函数5.2 测试函数 6. 模型训练和评估6.1 初始化损失函数和优化器6.2 训练过程 7. 关键点解析8. 完整代码9. 总结 引言 手写数…

Activiti初识

文章目录 1 工作流介绍1_工作流概念介绍2 工作流系统3 适用行业4 具体应用5 实现方式 2 Activiti介绍1_BPM2 BPM 软件3 BPMN 3 使用步骤1_部署 activiti2 流程定义3 流程定义部署4 启动一个流程实例5 用户查询待办任务(Task)6 用户办理任务7 流程结束 4 Activiti应用1_Activiti…

CyclicBarrier入门代码解析

文章目录 核心思想&#xff1a;组队出游&#xff0c;人到齐了才出发 &#x1f68c;最简单易懂的代码示例代码解析运行效果分析CyclicBarrier vs CountDownLatch 的关键区别CyclicBarrier在业务系统里面通常有什么常用的应用场景核心应用模式1. 数据并行处理与ETL&#xff08;最…

Maven 配置中绕过 HTTP 阻断机制的完整解决方案

Maven 配置中绕过 HTTP 阻断机制的完整解决方案 一、背景与问题分析 自 Maven 3.8.1 版本起&#xff0c;出于安全考虑&#xff0c;默认禁止了对 HTTP 仓库的访问。这一机制通过 <mirror> 配置中的 maven-default-http-blocker 实现&#xff0c;其作用是拦截所有使用 HT…

【大厂机试题解法笔记】恢复数字序列

题目 对于一个连续正整数组成的序列&#xff0c;可以将其拼接成一个字符串&#xff0c;再将字符串里的部分字符打乱顺序。如序列8 9 10 11 12,拼接成的字符串为89101112,打乱一部分字符后得到90811211,原来的正整数10就被拆成了0和1。 现给定一个按如上规则得到的打乱字符的字…

MongoDB 事务有哪些限制和注意事项?

MongoDB 的多文档 ACID 事务虽然强大&#xff0c;但在使用时确实有一些限制和需要特别注意的事项。 以下是主要的限制和注意事项&#xff1a; 1. 性能开销 (Performance Overhead) 额外协调: 事务需要额外的协调工作&#xff0c;包括跟踪事务状态、管理锁&#xff08;即使是乐…

CTF实战技巧:获取初始权限后如何高效查找Flag

CTF实战技巧&#xff1a;获取初始权限后如何高效查找Flag 在CTF比赛中&#xff0c;获得初始访问权限只是开始&#xff0c;真正的挑战在于如何在系统中高效定位Flag。本文将分享我在渗透测试中总结的系统化Flag搜索方法&#xff0c;涵盖Linux和Windows双平台。 引言&#xff1a;…

kafka Tool (Offset Explorer)使用SASL Plaintext进行身份验证

一、前面和不需要认证的情况相同&#xff1a; 1、填写Properties中的cluster name和版本&#xff0c;以及zk的ip和port 2、Advanced中填写bootstrap servers 二、和不需要认证时不同的点&#xff1a; 1、Security的Type&#xff0c;不需要认证时选plaintext&#xff0c;需要认…

最小费用最大流算法

最小费用最大流算法 原理 问题:网络中有源点(起点)和汇点(终点),每条边有流量上限和单位流量费用。求: 从源点到汇点的最大流量在流量最大的前提下,总费用最小核心思想:在找增广路时,选择单位费用之和最小的路径(使用SPFA找最短路) 实现步骤 建图:使用链式前向…

从汇编的角度揭开C++ this指针的神秘面纱(上)

C中的this指针一直比较神秘。任何类的对象&#xff0c;都有一个this指针&#xff0c;无处不在。那么this指针的本质究竟是什么&#xff1f;this指针什么时候会被用到&#xff1f;今天通过几段简单的代码&#xff0c;来揭秘一下。 要先揭秘this指针&#xff0c;先来说一下函数调…

18 - GCNet

论文《GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond》 1、作用 GCNet通过聚合每个查询位置的全局上下文信息来捕获长距离依赖关系&#xff0c;从而改善了图像/视频分类、对象检测和分割等一系列识别任务的性能。非局部网络&#xff08;NLNet&…

人工智能学习17-Pandas-查看数据

人工智能学习概述—快手视频 人工智能学习17-Pandas-查看数据—快手视频