DocValues

栏目: 后端 · 发布时间: 6年前

内容简介:在搜索引擎中,我们通常都是对域名(field)构建倒排索引(inverted index),实现了域值(Values)到文档(document)的映射,而DocValues则是构建了一个正向索引,实现文档到域值的映射。下面是官方给出的DocValues的介绍DocValues目前主要有五种类型,随后的博客中会一一详细介绍

DocValues

在搜索引擎中,我们通常都是对域名(field)构建倒排索引(inverted index),实现了域值(Values)到文档(document)的映射,而DocValues则是构建了一个正向索引,实现文档到域值的映射。下面是官方给出的DocValues的介绍 https://wiki.apache.org/solr/DocValues =

What docvalues are:

  1. NRT-compatible: These are per-segment datastructures built at index-time and designed to be efficient for the use case where data is changing rapidly.
  2. Basic query/filter support: You can do basic term, range, etc queries on docvalues fields without also indexing them, but these are constant-score only and typically slower. If you care about performance and scoring, index the field too.
  3. Better compression than fieldcache: Docvalues fields compress better than fieldcache, and "insanity" is impossible.
  4. Able to store data outside of heap memory: You can specify a different docValuesFormat on the fieldType (docValuesFormat="Disk") to only load minimal data on the heap, keeping other data structures on disk.

What docvalues are not:

  1. Not a replacement for stored fields: These are unrelated to stored fields in every way and instead datastructures for search (sort/facet/group/join/scoring).
  2. Not a huge improvement for a static index: If you have a completely static index, docvalues won't seem very interesting to you. On the other hand if you are fighting the fieldcache, read on.
  3. Not for the risk-averse: The integration with Solr is very new and probably still has some exciting bugs!

DocValues的类型

DocValues目前主要有五种类型,随后的博客中会一一详细介绍


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

热搜:搜索排名营销大揭秘

热搜:搜索排名营销大揭秘

【美】肖恩·布拉德利 / 中国人民大学出版社有限公司 / 2018-7-30 / CNY 55.00

首部大数据在我国政府管理场景中的应用实践案例读本,全面展示我国电子政务与数字化建设的成果,深度理解实施国家大数据战略的重要意义。 本书作者作为国内最早从事大数据应用研究的实践者之一,亲历了中国大数据的发展历程、主要事件、应用案例以及行业变化。 在本书中,作者将其所亲历的大数据发展历程进行了阐述,从大数据的基本概念、特点到实践解读,通俗易懂,给我们的实际工作提供了重要参考。作者将帮助读者......一起来看看 《热搜:搜索排名营销大揭秘》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试