Apache Lucene 9.0 发布,Java 全文检索引擎架构

栏目: 软件资讯 · 发布时间: 4年前

内容简介:Apache Lucene 9.0 现已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在...

Apache Lucene 9.0 现已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的 工具 包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

主要更新内容

  • 支持索引高维度的数字向量,以执行最近的邻居搜索,使用分层可导航的小世界图算法
  • 针对塞尔维亚语、尼泊尔语和泰米尔语的新分析器
  • 对日语的 IME 友好的自动建议
  •  Snowball 2,增加了印地语、印度尼西亚语、尼泊尔语、塞尔维亚语、泰米尔语和意第绪语的词干
  • 为瑞典语和挪威语提供了新的规范化/词干功能
  • 分类法分面的速度提高了400%
  • 多维点的索引速度提高 10-15%
  • 对以点为索引的字段的 排序 速度提高了数倍。这个优化在 8.x 版本后期是一个选择项,现在从 9.0 版本开始也是选择项了
  • ConcurrentMergeScheduler 现在假定快速 I/O,在启发式方法会错误地检测系统是否有现代 I/O 的情况下,可能会提高索引的速度
  • 发布列表的编码从 FOR-delta 改为 PFOR-delta,以进一步节省磁盘空间
  • 文件格式都从 big-endian 顺序改为 little-endian 顺序
  • Lucene 9 不再有分支的包。这需要在 lucene-core JAR 之外重新命名一些包,所以你需要相应地调整一些导入
  • 在模块系统中使用 Lucene 9 应该被认为是实验性的

详情请查看更新公告

 


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Parsing Techniques

Parsing Techniques

Dick Grune、Ceriel J.H. Jacobs / Springer / 2010-2-12 / USD 109.00

This second edition of Grune and Jacobs' brilliant work presents new developments and discoveries that have been made in the field. Parsing, also referred to as syntax analysis, has been and continues......一起来看看 《Parsing Techniques》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码