数据的聚合

  1. 聚合可以实现对文档数据的统计,分析,运算,聚合常见有三类(聚合的值一定不能是text类型的):

    桶(Bucket)聚合:用来对文档做分组。

    度量(Metric)聚合:用以计算一些值,比方说最大值,最小值,平均值等。

    管道(pipeline)聚合:其它聚合的结果为基础进行聚合。

    参与聚合的字段类型:keyword,数值,日期,布尔。

  1. DSL实现Bucket聚合

    lasticsearch 的 Bucket 聚合(桶聚合)是将文档分组到 "桶" 中的强大工具,类似于 SQL 中的GROUP BY。每个桶关联一个条件,符合条件的文档会被分到对应的桶中。

    Terms聚合

    • 场景:统计博客文章中每个标签的文档数量。

    • GET /blog/_search
      {"size": 0,  // 不返回原始文档,只返回聚合结果"aggs": {"tags": {"terms": {"field": "tags.keyword",  // 使用keyword类型避免分词"size": 10,  // 返回前10个最常见的标签"order": {"_count": "desc"  // 按文档数量降序排序}}}}
      }
      结果示例
      {"aggregations": {"tags": {"doc_count_error_upper_bound": 0,"sum_other_doc_count": 15,"buckets": [{"key": "elasticsearch","doc_count": 25},{"key": "java","doc_count": 18}]}}
      }
      //大多数 Bucket 聚合默认按文档数量(_count)降序排序。
      //按文档数量排序DSL演示
      GET /products/_search
      {"size": 0,"aggs": {"by_category": {"terms": {"field": "category.keyword","order": {"_count": "desc"  // 按文档数量降序(默认)}}}}
      }
      //结果演示
      {"aggregations": {"by_category": {"buckets": [{ "key": "electronics", "doc_count": 120 },{ "key": "clothing", "doc_count": 80 },{ "key": "books", "doc_count": 50 }]}}
      }
      //场景:只对价格大于 100 的商品进行类别聚合
      //DSL示例
      GET /products/_search
      {"query": {"range": {"price": {"gt": 100}}},"size": 0,"aggs": {"by_category": {"terms": {"field": "category.keyword"}}}
      }
      //结果显示
      {"aggregations": {"by_category": {"buckets": [{"key": "electronics","doc_count": 100,"expensive_products": {"doc_count": 75,  // 价格>100的电子产品数量"count": {"value": 75}}}]}}
      }
       
    • aggs代表聚合,与query同级,此时query的作用是限定聚合的的文档范围

    • 聚合必须的三要素

      • 聚合名称

      • 聚合类型

      • 聚合字段

    • 聚合可配置的属性有:size:指定聚合结果数量,order指定聚合结果排序方式,field指定聚合字段。

  2. DSL实现Metric聚合

    计算所有产品的平均价格

    GET /products/_search
    {"size": 0,  // 不返回原始文档"aggs": {"avg_price": {"avg": {"field": "price"}}}
    }
    //结果显示
    {"aggregations": {"avg_price": {"value": 125.5  // 平均价格}}
    }

    嵌套聚合metric聚合的组合使用

    //按类别分组,计算每个类别的平均价格、最高价格和最低价格。
    GET /products/_search
    {"size": 0,"aggs": {"by_category": {"terms": {"field": "category.keyword"},"aggs": {"avg_price": { "avg": { "field": "price" } },"max_price": { "max": { "field": "price" } },"min_price": { "min": { "field": "price" } },"price_stats": { "stats": { "field": "price" } }}}}
    }

    在java中进行聚合

    import org.elasticsearch.action.search.SearchRequest;
    import org.elasticsearch.action.search.SearchResponse;
    import org.elasticsearch.client.RequestOptions;
    import org.elasticsearch.client.RestHighLevelClient;
    import org.elasticsearch.index.query.QueryBuilders;
    import org.elasticsearch.search.aggregations.AggregationBuilders;
    import org.elasticsearch.search.aggregations.bucket.filter.Filter;
    import org.elasticsearch.search.aggregations.bucket.terms.Terms;
    import org.elasticsearch.search.builder.SearchSourceBuilder;
    ​
    import java.io.IOException;
    ​
    public class FilterAggregationExample {private final RestHighLevelClient client;public FilterAggregationExample(RestHighLevelClient client) {this.client = client;}public void filterAggregation() throws IOException {SearchRequest searchRequest = new SearchRequest("products");SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();// 构建按类别分组的聚合,在每个类别中过滤价格>100的商品searchSourceBuilder.aggregation(AggregationBuilders.terms("by_category").field("category.keyword").subAggregation(AggregationBuilders.filter("expensive_products",QueryBuilders.rangeQuery("price").gt(100)).subAggregation(AggregationBuilders.valueCount("count").field("id"))));searchRequest.source(searchSourceBuilder);SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);// 处理聚合结果Terms byCategory = response.getAggregations().get("by_category");for (Terms.Bucket bucket : byCategory.getBuckets()) {String category = bucket.getKeyAsString();long totalCount = bucket.getDocCount();Filter expensiveProducts = bucket.getAggregations().get("expensive_products");long expensiveCount = expensiveProducts.getDocCount();System.out.println("Category: " + category + ", Total: " + totalCount + ", Expensive: " + expensiveCount);}}
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84390.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++默认构造函数被隐式删除

一、 看cppreference时,发现被隐式删除的构造函数,查询做如下记录: struct F {int& ref; // reference memberconst int c; // const member// F::F() is implicitly defined as deleted };// user declared copy constructor (either …

6.ref创建对象类型的响应式数据

其实ref接收的数据可以是&#xff1a;基本类型、对象类型。若ref接收的是对象类型&#xff0c;内部其实也是调用了reactive函数。 <template><div class"person"><h2>汽车信息&#xff1a;一台{{ car.brand }}汽车&#xff0c;价值{{ car.price }…

如何设计一个用于大规模生产任务的人工智能AI系统

部署一个SOTA模型&#xff0c;让它服务数百万用户&#xff0c;处理TB级别的数据&#xff0c;并且7x24小时可靠运行是件非常有挑战性的工作。我们将探讨构建一个能够创建LLM、多模态模型以及各种其他AI产品的大规模AI系统所需的每个开发阶段。每个开发阶段如何相互关联&#xff…

国债与企业债:稳健与高收益的债券选择

债券市场是投资者获取稳定收益的重要渠道&#xff0c;而国债和企业债是最常见的两种债券类型。它们虽然都属于固定收益类产品&#xff0c;但在风险、收益和适用人群上有显著区别。 1. 概念对比&#xff1a;国家信用 vs. 企业信用 &#xff08;1&#xff09;国债&#xff08;政…

MySQL提升

事务 事务&#xff1a;在多个操作合在一起视为一个整体。要么就不做、要么就做完。 事务应该满足ACID A : 原子性。不可分割。C : 一致性。追求的目标&#xff0c;在开始到结束没有发生预定外的情况。I : 隔离性。不同的事务是独立的。D : 持久性。系统崩溃&#xff0c;数据依然…

MySQL用户和授权

开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务&#xff1a; test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…

基础篇:4. 页面渲染流程与性能优化

页面渲染流程与性能优化详解&#xff08;完整版&#xff09; 一、现代浏览器渲染流程&#xff08;详细说明&#xff09; 1. 构建DOM树 浏览器接收到HTML文档后&#xff0c;会逐步解析并构建DOM&#xff08;Document Object Model&#xff09;树。具体过程如下&#xff1a; (…

vue3 vite.config.js 引入bem.scss文件报错

[sass] Can’t find stylesheet to import. ╷ 1 │ use “/bem.scss” as *; │ ^^^^^^^^^^^^^^^^^^^^^^ ╵ src\App.vue 1:1 root stylesheet 分析 我们遇到了一个在Vue3项目中使用Vite时&#xff0c;在vite.config.js中引入bem.scss文件报错的问题。错误信息指出在App.vue…

python打卡第50天

知识点回顾&#xff1a; resnet结构解析CBAM放置位置的思考针对预训练模型的训练策略 差异化学习率三阶段微调 现在我们思考下&#xff0c;是否可以对于预训练模型增加模块来优化其效果&#xff0c;这里我们会遇到一个问题 预训练模型的结构和权重是固定的&#xff0c;如果修…

MySQL 并发控制和日志

MySQL 是一个广泛使用的关系数据库管理系统&#xff0c;在高并发环境中&#xff0c;如何有效地控制并发和管理日志至关重要。本文将详细介绍 MySQL 的并发控制机制和日志管理策略&#xff0c;以帮助开发人员和数据库管理员更好地理解和优化数据库性能。 一、并发控制 并发控制…

创意意境古风唯美中国风PPT模版分享

故宫文化经典传统PPT模版&#xff0c;创意中国风PPT模版&#xff0c;朱红简约新国风PPT模版&#xff0c;意境中国风PPT模版&#xff0c;最爱中国风PPT模版&#xff0c;意境古风唯美商业计划书PPT模版 创意意境古风唯美中国风PPT模版分享&#xff1a;古风中国风PTP模版分享https…

系统网站首页三种常见布局vue+elementui

左中右菜单布局 <template><el-container><el-menu class"el-menu-vertical-demo" style"width: 80px; height: 100vh;"background-color"#545c64"text-color"#fff"active-text-color"#ffd04b"select"…

复习Git命令、Git命令使用流程、VSCode+Git插件管理工程源码

目录 1 引言 2 直接整理一个常用的流程&#xff0c;而不是死记硬背各种命令 3 解决冲突的说明和理解 4 git fetch的说明和理解 5 真正开发不用Git命令&#xff0c;而是使用VSCode插件管理工程 1 引言 以前主要用svn&#xff0c;Git用的少&#xff0c;这次再复习一下Git命…

384_C++_unit是4字节大小,能存储32位(bit)bool操作,[7][48]这里用于计划表的时间节点内,二维数组中每一位代表一种AI功能的开关状态

前置了解 uint 并不是 C/C++ 标准中的 原生类型,但不同平台或框架可能有定义。通常: 1. uint 可能是 unsigned int 的别名 在某些代码库(如 Arduino、某些嵌入式系统、部分库的头文件)中,uint 可能被定义为:typedef unsigned int uint;此时,uint 的大小和 unsigned in…

css~word-break属性

CSS中如何强制换行“....................................”&#xff1f; 当盒子宽度能放下“...”元素时&#xff0c;正常展示如下&#xff1a; 当盒子宽度不够放“...”元素时&#xff0c;文本就会溢出&#xff0c;导致整个内容被截断&#xff1a; 如何才能让其正常展示而不…

【Algorithm】Union-Find简单介绍

文章目录 Union-Find1 基本概念1.1 Find(x) - 查询操作1.2 Union(x, y) - 合并操作 2 并查集的结构和优化2.1 数据结构设计2.2 两大优化策略&#xff08;关键&#xff09;2.2.1 路径压缩&#xff08;Path Compression&#xff09;2.2.2 按秩合并&#xff08;Union by Rank or S…

LeetCode 高频 SQL 50 题(基础版)之 【高级字符串函数 / 正则表达式 / 子句】· 上

题目&#xff1a;1667. 修复表中的名字 题解&#xff1a; select user_id, concat(upper(left(name,1)),lower(right(name,length(name)-1))) name from Users order by user_id题目&#xff1a;1527. 患某种疾病的患者 题解&#xff1a; select * from Patients where con…

Linux系统的CentOS7发行版安装MySQL80

文章目录 前言Linux命令行内的”应用商店”安装CentOS的安装软件的yum命令安装MySQL1. 配置yum仓库2. 使用yum安装MySQL3. 安装完成后&#xff0c;启动MySQL并配置开机自启动4. 检查MySQL的运行状态 MySQL的配置1. 获取MySQL的初始密码2. 登录MySQL数据库系统3. 修改root密码4.…

Java + Spring Boot项目枚举(Enum)目录建议

在Java Spring Boot项目中&#xff0c;枚举&#xff08;Enum&#xff09;的定义文件没有固定的强制目录&#xff0c;但通常遵循项目结构和最佳实践来组织代码。以下是常见的推荐位置&#xff1a; 1. 领域模型相关枚举 目录: domain/enums 或 model/enums 场景: 当枚举与业务模…

Vue 模板语句的数据来源

&#x1f9e9; Vue 模板语句的数据来源&#xff1a;全方位解析 Vue 模板&#xff08;<template> 部分&#xff09;中的表达式、指令绑定&#xff08;如 v-bind, v-on&#xff09;和插值&#xff08;{{ }}&#xff09;都在一个特定的作用域内求值。这个作用域由当前 组件…