【Elasticsearch】全文搜索与精确匹配：match与term查询

屿小夏

发布于 2025-08-24 08:18:51

1.4K0

📑前言

在使用Elasticsearch进行数据检索时，开发者常常会面临一个关键问题：如何选择合适的查询方式来满足不同的搜索需求？在众多查询类型中，match 和 term 查询是最基础、最常用的两种，但它们的适用场景和行为机制却大相径庭。理解它们之间的区别，是掌握Elasticsearch高效检索能力的第一步。本文将深入探讨 match 与 term 查询的核心原理、使用场景、性能差异以及常见误区，帮助你根据实际需求做出正确的选择。

一、Elasticsearch中的查询类型概述

Elasticsearch 是一个分布式的搜索与分析引擎，其强大的全文搜索能力源于底层的倒排索引机制。在执行查询时，Elasticsearch 提供了丰富的查询 DSL（Domain Specific Language），其中 match 和 term 是最基础的两种查询方式。

match** 查询**：用于全文搜索，支持分词、模糊匹配和相关性评分。
term** 查询**：用于精确匹配，不进行分词，直接匹配字段的原始值。

虽然两者都用于查找文档，但它们的底层逻辑完全不同，因此使用不当可能导致查询结果不符合预期。

二、match 查询：面向全文搜索的智能匹配

2.1 基本用法

match 查询是最常用的全文搜索查询。它会对输入的查询字符串进行分词处理，然后在倒排索引中查找匹配的文档。例如：

{
  "query": {
    "match": {
      "title": "快速入门 Elasticsearch"
    }
  }
}

在这个例子中，Elasticsearch 会将 "快速入门 Elasticsearch" 按照指定的分词器（如 standard 或 ik_smart）进行分词，可能得到 ["快速", "入门", "Elasticsearch"]，然后查找 title 字段中包含这些词项的文档。

2.2 分词与相关性评分

match 查询的核心优势在于它支持全文检索。它不仅关注是否包含关键词，还通过 TF-IDF 或 BM25 算法计算文档的相关性得分（_score），从而实现结果排序。

例如，搜索“Elasticsearch 教程”，文档中同时包含这两个词的得分会高于只包含一个词的文档。

2.3 操作符控制：and 与 or

match 查询支持通过 operator 参数控制匹配逻辑：

{
  "query": {
    "match": {
      "content": {
        "query": "搜索 引擎",
        "operator": "and"
      }
    }
  }
}

operator: "or"（默认）：只要包含任一词项即可匹配。
operator: "and"：必须同时包含所有词项。

这使得 match 查询在灵活性上远超简单的关键词匹配。

2.4 适用场景

用户输入的自然语言搜索（如电商商品搜索、文章检索）
需要支持模糊匹配和相关性排序的场景
字段内容为文本（text）类型，且已启用分词

三、term 查询：面向精确匹配的底层操作

3.1 基本用法

term 查询用于精确匹配字段的原始值，不进行任何分词处理。它直接在倒排索引中查找完全一致的 term。例如：

{
  "query": {
    "term": {
      "status": "published"
    }
  }
}

这个查询会查找 status 字段精确等于 "published" 的文档。

3.2 不分词是关键

term 查询不会对查询值进行分词。例如，如果你对一个 text 类型字段使用 term 查询：

{
  "query": {
    "term": {
      "title": "快速入门 Elasticsearch"
    }
  }
}

由于 title 字段在索引时已被分词，而 term 查询试图匹配整个字符串 "快速入门 Elasticsearch"，这在倒排索引中并不存在，因此不会返回任何结果。

3.3 适用于 keyword 类型字段

为了正确使用 term 查询，字段应为 keyword 类型。keyword 类型字段不会被分词，整个值作为一个 term 存储。例如：

PUT /my_index
{
  "mappings": {
    "properties": {
      "status": { "type": "keyword" },
      "category": { "type": "keyword" }
    }
  }
}

此时，term 查询可以精确匹配 status 的值。

3.4 适用场景

过滤操作：如按状态、分类、标签、用户ID等精确筛选
聚合分析中的条件过滤
需要完全匹配的场景，如订单号、身份证号、邮箱等

四、match 与 term 的核心区别对比

特性	match 查询	term 查询
是否分词	是	否
适用字段类型	text	keyword
匹配方式	全文搜索，支持模糊匹配	精确匹配，大小写敏感
相关性评分	支持（_score）	不支持（_score 通常为1.0）
性能	相对较慢（需分词和评分）	快（直接查倒排索引）
典型用途	搜索用户输入的关键词	过滤固定值（如状态、类别）