Elasticsearch bool query小结

栏目: 后端 · 发布时间: 6年前

内容简介:最近有一个线上的es查询问题,最后确定在使用其中找到相关的查询语句:

最近有一个线上的es查询问题,最后确定在使用 bool query 多条件组合查询时出现 should 子句查询失效,于是查找资料来确定问题所在。

其中 Elasticsearch : 5.5.0

问题

找到相关的查询语句:

"query": {
    "bool": {     // bool query 查询
      "should": [ // should子句
        {
          "match_phrase": {
            "name": {
              "query": "星起",
              "boost": 30,
              "slop": 5
            }
          }
        }
      ],
      "filter": { // #filter子句
        "bool": {
          "must": [
            {
              "terms": {
                "round": ["A轮"]
              }
            },
          ]
        }
      }
    }
  }
复制代码

问题在于:使用 bool query 组合查询时, shouldfilter 组合查询的结果只匹配了 filter 子句,并不匹配 should 子句,达不到 shouldfilter 取交集的预期。

解决方法

翻了一下官方文档: Bool Query | Elasticsearch Reference [5.5] | Elasticshould 的解释:

The clause (query) should appear in the matching document. If the bool query is in aquery context and has a must or filter clause then a document will match the bool query even if none of the should queries match. In this case these clauses are only used to influence the score. If the bool query is afilter context or has neither must or filter then at least one of the should queries must match a document for it to match the bool query. This behavior may be explicitly controlled by settings theminimum_should_match parameter.

大体的意思就是: should 子句是在匹配文档中使用的,如果 bool 查询是在 query 上下文,并且有 must 或者 filter 子句时不管 should 查询是否匹配,都不影响 must 或者 filter 子句的查询。这些子句只是影响查询的 score 而已。如果 bool 查询是在 filter 上下文 或者 既没有 must 也没有 filter 则应至少一个 should 查询必须匹配 bool 查询。也可以显式设置minimum_should_match这个参数来解决。 从官方文档可以看出,有2种方式可以在 bool query 取各数据的交集:

filter
minimum_should_match

解决方案

用上面提到2种方式,我们分别尝试一下是否可以达到预期目标。

方案一

使用 filter 上下文:

"query": {
    "bool": {
      "filter": { // filter上下文
        "bool": {
          "should": [ // should子句
            {
              "match_phrase": {
                "name": {
                  "query": "星起",
                  "boost": 30,
                  "slop": 5
                }
              }
            }
          ],
          "filter": { // filter子句
            "bool": {
              "must": [
                {
                  "terms": {
                    "round": ["A轮"]
                  }
                }
              ]
            }
          }
        }
      }
    }
  }
复制代码

测试结果如下:

"hits": {
    "total": 1,
    "max_score": null,
    "hits": [
      {
        "_index": "index_name",
        "_type": "hub/product",
        "_id": "id",
        "_score": 0.0, // filter下分值为0.0
        "_source": {
          "round": "A轮",
          "name": "星起Starup",
          "created_at": "2015-12-25T22:20:36.210+08:00",
          "sector_name": "企业服务"
        },
        "highlight": {
          "name": ["<em>星起</em>Starup"]
        },
        "sort": []
      }
    ]
  }
复制代码

测试结果满足 shouldfilter 子句交集,需要注意结果的分值为 0.0 , 没有对查询结果匹配程度打分。

方案二

使用 minimum_should_match ,至少匹配一项 should 子句,可以如下设置:

"query": {
    "bool": {     
      "should": [ // should 子句
        {
          "match_phrase": {
            "name": {
              "query": "星起",
              "boost": 30,
              "slop": 5
            }
          }
        }
      ],
      "minimum_should_match": 1, // 最少匹配一项should中条件子句
      "filter": { // filter子句
        "bool": {
          "must": [
            {
              "terms": {
                "round": ["A轮"]
              }
            },
          ]
        }
      }
    }
  }
复制代码

测试结果如下:

"hits": {
    "total": 1,
    "max_score": null,
    "hits": [
      {
        "_index": "index_name",
        "_type": "hub/product",
        "_id": "id",
        "_score": 757.66394,
        "_source": {
          "round": "A轮",
          "name": "星起Starup",
          "created_at": "2015-12-25T22:20:36.210+08:00",
          "sector_name": "企业服务"
        },
        "highlight": {
          "name": ["<em>星起</em>Starup"]
        },
        "sort": [757.66394]
      }
    ]
  }
复制代码

数据为 shouldfilter 子句的交集,符合预期的结果,并且有相应的匹配程度分值。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

零边际成本社会

零边际成本社会

[美]杰里米·里夫金 / 赛迪研究院专家组 / 中信出版社 / 2014-11-1 / 49.00

在这本书中,《第三次工业革命》作者杰里米•里夫金开创性地探讨了极致生产力、协同共享、产消者、生物圈生活方式等全新的概念,详细地描述了数以百万计的人生产和生活模式的转变。他认为,“产消者”正在以近乎零成本的方式制作并分享自己的信息、娱乐、绿色能源和3D打印产品。他们也通过社交媒体、租赁商、合作组织以极低或零成本的模式分享汽车、住房、服装和其他物品;学生更多地参与到基于零成本模式的开放式网络课程…… ......一起来看看 《零边际成本社会》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具