Elasticsearch索引字段的类型

在 Elasticsearch 中,索引字段的类型(即 Mapping 中的字段类型)对搜索和存储性能影响很大。下面是各种常用数据类型的用途及推荐使用场景总结:


1. keyword 类型(精确匹配

  • 适合数据

    • 不需要分词,直接用于过滤、排序、聚合等操作的数据。
  • 常见字段

    • 用户 ID、手机号、身份证、订单号、状态码、城市名称、标签、分类名、性别、IP、UUID 等。
  • 说明

    • keyword 是不可被分词的,整体作为一个字符串处理,支持 term 查询、terms 查询、terms aggregation 聚合等。

例子

"user_id": { "type": "keyword" }
"status": { "type": "keyword" }

2. text 类型(分词全文检索

  • 适合数据

    • 需要做全文搜索(模糊搜索、关键词搜索)的字段。
  • 常见字段

    • 评论内容、商品标题、文章内容、日志描述等。
  • 说明

    • 默认会使用 analyzer 分词器进行分词处理,适合搜索但不适合做聚合或排序。

🔸 例子

"title": { "type": "text" }
"comment": { "type": "text" }

组合用法text + keyword(一个字段两个视图)

"username": {"type": "text","fields": {"keyword": { "type": "keyword" }}
}

这样 username 可以分词搜索,也可以用 username.keyword 精确匹配、排序、聚合。


3. integer / long / float / double

  • 适合数据

    • 数值类型字段,如金额、数量、分数、时间戳等。
  • 常见字段

    • 年龄、价格、库存、评分、时间戳(可用 long 表示)、纬度经度等。
  • 建议选择

    • integer:32位整数,适合一般数值;
    • long:64位整数,如毫秒时间戳;
    • float / double:浮点类型,有精度要求时用 double

🔸 例子

"price": { "type": "double" }
"timestamp": { "type": "long" }

4. date

  • 适合数据

    • 任何格式化的日期时间,比如创建时间、更新时间、登录时间等。
  • 常见字段

    • createTime, updateTime, logTime
  • 说明

    • 支持范围查询和时间聚合;
    • 可以通过 format 指定日期格式。

🔸 例子

"create_time": { "type": "date", "format": "yyyy-MM-dd HH:mm:ss||epoch_millis" }

5. boolean

  • 适合数据

    • true/false 类型,如是否删除、是否启用等。

🔸 例子

"is_deleted": { "type": "boolean" }

6. nested

  • 适合数据

    • 对象数组结构,需要对数组中每个对象进行独立查询时使用。

🔸 例子(用户有多个订单):

"orders": {"type": "nested","properties": {"order_id": { "type": "keyword" },"amount": { "type": "double" }}
}

7. object

  • 适合数据

    • 简单对象结构(非数组),如 address。

🔸 例子

"address": {"type": "object","properties": {"province": { "type": "keyword" },"city": { "type": "keyword" }}
}

不推荐的数据类型(谨慎使用)

类型说明
text 做聚合或排序会报错,需要用 keyword
大文本字段text,并避免在 UI 上分页返回
非结构化 JSON不推荐嵌套太深的结构体,会影响性能

总结推荐表

数据类型推荐映射类型用途
用户名text + keyword模糊搜索 + 精准聚合
状态码keyword精确过滤
评论内容text分词搜索
创建时间date时间范围查询
价格/分数double数值计算
是否删除标识boolean布尔条件
时间戳long毫秒时间
地址结构体object结构化字段
对象数组(如订单)nested嵌套多值数组

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86305.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86305.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kubernetes证书续签-使用kubeadm更新证书(下)

#作者:任少近 文章目录 查看kubelet证书查看kubelet当前所使用的证书 更换 node上的kubelet证书生成node1所需要的kubelet.conf文件生成node2所需要的kubelet.conf文件查看csr 更新 ~/.kube/config 文件重启相关组件 查看kubelet证书 以上少了kubelet的证书&#…

AI智能体长期记忆系统架构设计:从认知模型到生产实践

1 长期记忆:AI智能体的认知基石 1.1 人类记忆与AI记忆的类比 #mermaid-svg-VIPKAFe7VgN4UHFA {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-VIPKAFe7VgN4UHFA .error-icon{fill:#552222;}#mermaid-svg-VIPKAFe7V…

快速上手:利用音频大模型与Java提取视频文案

文章目录 1、前言2、需求说明2.1 需求说明2.2 数据准备 3、功能实现3.1 使用视频理解大模型能力3.1.1 三方平台视频在线链接解析3.1.2 三方平台视频内网链接解析3.1.3 三方平台视频转存本地服务 3.2 使用音频识别大模型能力3.2.1 三方平台视频在线链接解析3.2.2 三方平台视频详…

LLM复杂记忆存储-多会话隔离案例实战

导读:在多用户并发的对话系统中,会话隔离问题往往成为开发者面临的技术难题。当数千个用户同时与AI助手交互时,如何确保每个用户的对话历史完全独立,避免数据混淆和隐私泄露? 本文深入剖析了基于RunnableWithMessageHi…

【PX4-AutoPilot教程-TIPS】PX4系统命令行控制台ConsolesShells常用命令(持续更新)

PX4系统命令行控制台 Consoles & Shells 常用命令 查看每个应用程序的堆栈使用情况获取所有可用命令和APP的列表应用程序启动、停止和状态查询查看本地文件系统查看剩余的可用RAM查看工作队列中正在运行的内容以及运行速率查看特定的uORB话题调试uORB话题进行模式切换和故障…

国内优秀wordpress主题推荐

在国内,WordPress 主题市场虽然不如国外那样庞大,但依然有许多优秀且适合中国用户需求的主题。以下是一些经过评估和推荐的国内优秀WordPress主题,涵盖不同类型的网站需求,如博客、企业官网、资源站、社区论坛等。 WP汉主题 WP汉…

第 6 章:进阶话题

第 6 章:进阶话题 过拟合vs欠拟合:模型复杂度和泛化能力的关系 在前面的章节中,我们已经学习了神经网络的基础知识、常见架构和基本训练流程。然而,在实际的深度学习项目中,仅仅掌握这些基础知识是不够的。我们还需要…

4.2_1朴素模式匹配算法

知识总览: 什么是字符串的模式匹配: 主串:想从该串获取结果的串 模式串:想搜索的内容,不一定在主串中能搜到,子串一定能在主串中搜到 字符串模式匹配:在主串找模式串并返回找到的第一个模式串…

华为云Flexus+DeepSeek征文|华为云ModelArts搭建Dify-LLM应用开发平台(AI智能选股大模型)

前言 在当今数字化时代,人工智能(AI)技术在金融领域的应用愈发广泛,其中 AI 智能选股大模型备受关注。为了构建高效且精准的 AI 智能选股大模型,选择合适的开发平台和工具至关重要。华为云 ModelArts 作为一款面向 AI …

C4.5算法深度解析:决策树进化的里程碑

C4.5是机器学习史上最经典的算法之一,由ID3之父Ross Quinlan在1993年提出。作为ID3的革命性升级,它不仅解决了前代的核心缺陷,更开创了连续特征处理和剪枝技术的先河,成为现代决策树的奠基之作。 本文由「大千AI助手」原创发布&am…

leetcode 65

#include <string> #include <vector> #include <unordered_map> using namespace std;class Solution { public:bool isNumber(string s) {// 定义状态转移表vector<unordered_map<char, int>> states {{{ , 0}, {s, 1}, {d, 2}, {., 4}}, // …

微服务(nacos+myibatis)中如何在一个模块调用多数据库源的一种方案

#nacos配置默认数据库 spring.datasource.typecom.alibaba.druid.pool.DruidDataSource spring.datasource.driverNamecom.mysql.jdbc.Driver #默认数据库名 master spring.datasource.dynamic.primarymaster spring.datasource.dynamic.strictfalse spring.datasource.d…

高标准通信国际接轨,Ethercat与PROFINET网关实现全自动化生产线

在呼和浩特&#xff0c;集成商以其先进的食品饮料行业解决方案&#xff0c;为乳制品行业打造了一个智能化工厂的典范。这个工厂的核心是PROFINET全集成自动化&#xff08;TIA&#xff09;&#xff0c;它通过SIMATIC S7-1200 PLC和ethercat系统&#xff0c;构建了一个强大的PROF…

Netty 引用计数抽象类 AbstractReferenceCountedByteBuf 详解

核心类图 ----------------------------- ---------------------------------- | ReferenceCountUpdater | | AbstractReferenceCountedByteBuf | | <T extends ReferenceCounted>| | (extends AbstractByteBuf) | ----------…

用Python做一个手机镜头

文章目录 设置光学参数添加光学器件 设置光学参数 官方文档&#xff1a;设计手机镜头 rayoptics中提供了OpticalModel类&#xff0c;可用于创建光学模型对象。OpticalModel类中的【optical_spec】成员&#xff0c;是一个OpticalSpecs对象&#xff0c;可用于指定光圈、视野、光…

16.1 Python应用容器化终极指南:Dockerfile多阶段构建与安全优化实战

Python应用容器化终极指南:Dockerfile多阶段构建与安全优化实战 #mermaid-svg-6Yor3ONhmPaQAcY6 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-6Yor3ONhmPaQAcY6 .error-icon{fill:#552222;}#mermaid-svg-6Yor3ON…

基于SpringBoot + Vue打造的画师约稿平台实现

概述 基于SpringBoot Vue打造的画师约稿平台&#xff0c;该平台设计精美、功能完善&#xff0c;无论是想要搭建类似平台的开发者&#xff0c;还是对画师约稿系统感兴趣的人士&#xff0c;都能从中获取有价值的信息。 主要内容 ​​用户端功能​​&#xff1a; 如图所示&…

杰理-耳机-可视化sdk-最大音量提示音-7016G

杰理-耳机-可视化sdk-最大音量提示音 1.音量最大的时候发出消息 2.通过 MSG_FROM_AUDIO 进行发送 3.创建地方接收&#xff0c;并且播放提示音 学习q群:187115320

抖音图文带货权限怎么开通

在这个数字化营销蓬勃发展的时代&#xff0c;抖音作为一个流量巨大的平台&#xff0c;为广大创作者和商家提供了丰富的变现途径。其中&#xff0c;图文带货权限就是一个有效的拓宽变现能力的一个渠道。 那么&#xff0c;如何才能开通抖音的图文带货功能呢&#xff1f; 开通抖…

80、指标监控-Boot Admin Server

80、指标监控-Boot Admin Server Boot Admin Server是一个用于监控和管理Spring Boot应用程序的开源工具&#xff0c;以下是其相关介绍&#xff1a; #### 主要功能 - **应用状态监控** - 显示应用的在线状态、启动时间、运行时长等基本信息。 - 监控JVM指标&#xff0c;如内存…