Apache Lucene 9.0 发布,Java 全文检索引擎架构

栏目: 软件资讯 · 发布时间: 3年前

内容简介:Apache Lucene 9.0 现已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在...

Apache Lucene 9.0 现已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的 工具 包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

主要更新内容

  • 支持索引高维度的数字向量,以执行最近的邻居搜索,使用分层可导航的小世界图算法
  • 针对塞尔维亚语、尼泊尔语和泰米尔语的新分析器
  • 对日语的 IME 友好的自动建议
  •  Snowball 2,增加了印地语、印度尼西亚语、尼泊尔语、塞尔维亚语、泰米尔语和意第绪语的词干
  • 为瑞典语和挪威语提供了新的规范化/词干功能
  • 分类法分面的速度提高了400%
  • 多维点的索引速度提高 10-15%
  • 对以点为索引的字段的 排序 速度提高了数倍。这个优化在 8.x 版本后期是一个选择项,现在从 9.0 版本开始也是选择项了
  • ConcurrentMergeScheduler 现在假定快速 I/O,在启发式方法会错误地检测系统是否有现代 I/O 的情况下,可能会提高索引的速度
  • 发布列表的编码从 FOR-delta 改为 PFOR-delta,以进一步节省磁盘空间
  • 文件格式都从 big-endian 顺序改为 little-endian 顺序
  • Lucene 9 不再有分支的包。这需要在 lucene-core JAR 之外重新命名一些包,所以你需要相应地调整一些导入
  • 在模块系统中使用 Lucene 9 应该被认为是实验性的

详情请查看更新公告

 


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

大数据日知录

大数据日知录

张俊林 / 电子工业出版社 / 2014-9 / 69.00元

大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规......一起来看看 《大数据日知录》 这本书的介绍吧!

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具