Elasticsearch从安装到实战、kibana安装以及自定义IK分词器/集成整合SpringBoot详细的教程ES(三)

 DSL官方地址:

DSL查询分类

Elasticsearch提供了基于JSON的DSL(https://www.elastic.co/docs/explore-analyze/query-filter/languages/querydsl)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有数据,一般测试用。例如:match_all

  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:

    • match_query

    • multi_match_query

  • 精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段。例如:

    • ids

    • range

    • term

  • 地理(geo)查询:根据经纬度查询。例如:

    • geo_distance

    • geo_bounding_box

  • 复合(compound)查询:复合查询可以将上述各种查询条件组合起来,合并查询条件。例如:

    • bool

    • function_score

查询所有

Query基本语法

 match查询:全文检索查询的一种,会对用户输入内容分词,然后去倒排索引库检索,语法:

GET /hotel/_search
{"query": {"match_all": {}}
}

全文检索

GET /hotel/_search
{"query": {"match": {"all": "速8北京后海"}}
}

multi_match:与match查询类似,只不过允许同时查询多个字段

GET /hotel/_search
{"query": {"multi_match": {"query": "北京后海速8","fields": ["brand","name"]}}
}

这两个比较 上面的 效率要高 

GET /hotel/_search
{
  "query": {
    "match": {
      "all": "速8北京后海"
    }
  }
}


GET /hotel/_search
{
  "query": {
    "multi_match": {
      "query": "北京后海速8",
      "fields": ["brand","name"]
    }
  }
}

精确查询 

精确查询一般是查找keyword、数值、日期、boolean等类型字段。所以不会对搜索条件分词

term查询 

# 精确查找
GET /hotel/_search
{"query":{"term": {"city": {"value": "北京"}}}}

区间查询

 区间查询 价格 100-200 gt:大于  lt:小于

区间查询 价格 100-200 gte:大于等于 lte:小于等于

# 区间查询 价格 100-200 gte:大于等于 lte:小于等于
GET /hotel/_search
{"query": {"range": {"price": {"gte": 100,"lte": 200}}}
}# 区间查询 价格 100-200 gt:大于  lt:小于
GET /hotel/_search
{"query": {"range": {"price": {"gt": 1000,"lt": 2000}}}
}

地理查询 

geo_distance 查询 

# geo_distance 查询
GET /hotel/_search
{"query": {"geo_distance":{"distance":"5km","location":"31.23462, 121.47327"}}
}

查询附近的 15km 千米 46 家

查询附近的 5km 千米 15 家

复合查询

复合(compound)查询:复合查询可以将其它简单查询组合起来,实现更复杂的搜索逻辑。常见的有两种:

  • function score:算分函数查询,可以控制文档相关性算分,控制文档排名

  • bool query:布尔查询,利用逻辑关系组合多个其它的查询,实现复杂搜索

Function Score Query

使用 function score query,可以修改文档的相关性算分(query score),根据新得到的算分排序。

测试案例 给“如家”这个品牌的酒店排名靠前一些

# function_score 查询
GET /hotel/_search
{"query": {"function_score": {"query": {"match": {"all": "外滩"}},"functions": [{"filter": {"term": {"brand": "如家"}},"weight": 10}],"boost_mode": "sum"}}
}

function score query定义的三要素是
过滤条件:哪些文档要加分
算分函数:如何计算function  score
加权方式:function score 与 query score如何运算

复合查询 Boolean Query

布尔查询是一个或多个查询子句的组合,每一个子句就是一个子查询。子查询的组合方式有:

  • must:必须匹配每个子查询,类似“与”

  • should:选择性匹配子查询,类似“或”

  • must_not:必须不匹配,不参与算分,类似“非”

  • filter:必须匹配,不参与算分

语法示例
GET /hotel/_search
{"query": {"bool": {"must": [{"match": {"name": "如家"}}],"must_not": [{"range": {"price": {"gt": 400}}}],"filter": [{"geo_distance": {"distance": "10km","location": {"lat": 31.21,"lon": 121.5}}}]}}
}

must 里面会参与算分,参与字段越多 性能越差,如不需要算分的就移除到 filter 里面

搜索结果处理

排序

        elasticsearch默认是根据相关度算分(_score)来排序,但是也支持自定义方式对搜索结果排序。可以排序字段类型有:keyword类型、数值类型、地理坐标类型、日期类型等

keyword、数值、日期类型排序的语法基本一致

普通排序

语句

# sort 排序 查询
GET /hotel/_search
{"query": {"match_all": {}},"sort": [{"score": "desc"},{"price": "asc"}]
}

地理坐标排序

地理坐标 升序排序

# 安 地理坐标 升序排序
GET /hotel/_search
{"query": {"match_all": {}},"sort": [{"_geo_distance": {"location": {"lat": 31.034661,"lon": 121.612282},"order": "asc","unit": "km"}}]
}

分页

基本的分页
# 分页
GET /hotel/_search
{"query": {"match_all": {}},"from": 10,"size": 5,"sort": [{"price": "desc"}]
}

深度分页问题

高亮

语法

GET /hotel/_search
{"query": {"match": {"name": "如家"}},"highlight": {"fields": {"name": {}}}
}

GET /hotel/_search
{"query": {"match": {"all": "如家"}},"highlight": {"fields": {"name": {"require_field_match": "false"}}}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84616.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

我们来学mysql -- keepalive主从高可用

keepalive主从高可用 简明扼要安装KP场景“高可用”配置主keepalived.conf从keepalived.confmysql_check.sh 高可用验证KP运行情况通过vip连接mysqlvip连接上创建数据库关闭主库所在服务器的KPvip连接上再次创建数据库 结尾 简明扼要 搭建mysql的主从八股文如是:主…

Compose笔记(二十六)--DatePicker

这一节主要了解一下Compose中的DatePicker,DatePicker是一个用于选择日期的组件,它提供了直观的界面让用户可以通过日历视图或直接输入来选择年、月、日。我们在开发中时常会用到日期选择器,简单总结如下: API: DatePickerDialog onDismissRequest&…

【靶场】upload-labs-文件上传漏洞闯关

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言1.第一关1.保存html页面2.修改页面html3.访问修改后的本地html文件4.上传php文件5.访问上传的php2.第二关1.抓上传包修改文件类型2.上传成功3.第三关1.phtml php3会被解析为php原理2.上传成功4…

基于 Transformer RoBERTa的情感分类任务实践总结之四——PGM、EMA

整合了以下五大核心技术:R-Drop、PGM 对抗训练、EMA、标签平滑、CosineAnnealing 学习率调度。 1. R-Drop(Regularized Dropout) 原理:同一个样本做两次前向传播(同 dropout mask),计算两次输…

录制mp4 rospy

ros 预览摄像头 #!/usr/bin/env python import rospy from sensor_msgs.msg import Image from cv_bridge import CvBridge import cv2# 初始化 bridge bridge CvBridge()def image_callback(msg):# 将ROS图像消息转换为OpenCV图像cv_image bridge.imgmsg_to_cv2(msg, desir…

超简单部署离线语音合成TTS和语音识别

一篇文章讲清楚超简单 离线语音合成TTS 和 离线语音识别 系统部署 本文只介绍两个轻量级的 语音合成用piper, 语音识别用vosk 部署简单,效果勉强 语音合成 推荐 piper (其他没用过) 安装 linux下安装 pip install piper-tts下载模型(63M) 中文模型下载 zh_CN-huayan-medi…

【算力网】

一、算力网-DNS 1.1、核心架构设计 1.1.1 设计框架 基于SRv6的智能DNS算法设计框架,结合IPv6路由可编程性、动态路径优化及业务感知能力,实现网络性能与用户体验的双重提升:​ ​SRv6-DNS融合架构​ ​控制平面​: DNS服务器集…

shell分析nginx日志的指令

shell指令 查看有多少个IP访问: awk {print $1} log_file|sort|uniq|wc -l 查看某一个页面被访问的次数: grep "/index.php" log_file | wc -l 查看每一个IP访问了多少个页面: awk {S[$1]} END {for (a in S) print a,S[a]} …

CMS软件以及常见分类

CMS(Content Management System,内容管理系统)是 让非技术人员也能便捷创建、编辑、管理网站内容的软件 ,核心是 分离 “内容” 和 “页面设计”(内容存在数据库,页面用模板生成),无…

Spring @Value 典型用法

典型用法 注入常量值 Value("Hello World") private String message;注入配置文件中的属性值(如 application.properties) // 假设你有如下配置: app.nameMyApp app.version1.0.0// Java 类中使用: Value("${ap…

golang -- map实现原理

目录 一、前言二、结构1. hmap(map) 结构2. bmap(buckets) 结构 三、哈希冲突四、负载因子五、哈希函数六、扩容增量扩容等量扩容 一、前言 在现代编程语言中,map 是一种非常重要的数据结构,广泛用于存储和快速查找键值对。Go 语言中的 map 是一种高效且…

Vue2 Extends 继承机制与组件复用实践

extends在某些场景下依然发挥作用,如Options API。子组件将继承父组件的属性、方法、生命周期钩子函数以及混合(mixins)等选项。 注意:子组件可以覆盖、或继承扩展父组件的选项。子组件的生命周期钩子和父组件的钩子一起执行。 &l…

openSUSE MicroOS不可变Linux

openSUSE MicroOS不可Linux 1、openSUSE MicroOS简介安装时可能遇到的问题 2、ssh登录3、openSUSE MicroOS配置国内软件源4、系统变更openSUSE MicroOS安装软件包方法1:进入事务性更新模式安装软件包方法2:继续快照id基于这个快照进行增量安装方法3&…

建站SEO优化之站点地图sitemap

文章目录 编写规范小型网站站点地图小型网站规范示例站点地图说明 大型网站站点地图大型网站规范示例以豆瓣站点地图为例 近期文章: 个人建站做SEO网站外链这一点需要注意,做错了可能受到Google惩罚一文搞懂SEO优化之站点robots.txt网页常见水印实现方式…

Java分层开发必知:PO、BO、DTO、VO、POJO概念详解

目录 引言一、核心概念与定义1、PO(Persistent Object,持久化对象)2、BO(Business Object,业务对象)3、DTO(Data Transfer Object,数据传输对象)4、VO(View O…

Linux下OLLAMA安装卡住怎么办?

网络环境不理想,经常在官方的linux安装脚本执行时卡住,其实主要是下载文件卡住,于是我想到了是否可以把其中下载的过程显化、分步,这样更可控,于是修改了官方的install.sh #!/bin/sh # This script installs Ollama o…

C++面试(5)-----删除链表中指定值的节点

操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 算法描述 给定一个单向链表的头节点 head 和一个特定值 val,要求编写一个函数来删除链表中所有值等于 val 的节点,并返回修改后的链表头节点。 示例: 输…

如何用AI赋能学习

由于博主是大学生,今天花费了大量的时间去进行期末的复习,不过从复习中得到了一些学习的灵感,即:如何用AI赋能学习 当我们需要掌握一门新的技能的时候,我们很容易的想到三种办法:买书自己学,报…

【threejs】每天一个小案例讲解:常见材质

代码仓 GitHub - TiffanyHoo/three_practices: Learning three.js together! 可自行clone,无需安装依赖,直接liver-server运行/直接打开chapter01中的html文件 运行效果图 知识要点 1. MeshBasicMaterial(基础网格材质) • 特…

springboot后端与鸿蒙的结合

软件:鸿蒙devceo3.1,springboot项目采用IDEA 目的: 1、结合springboot后端与鸿蒙的结合运用。 2、Log日志查看console语句的信息。 3、引入 import http from ohos.net.http。 4、调用springboot后端提供的链接发送post 5、TextInput的…