内容简介:Apache Tika 1.19 发布了,Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取工作提供了一个统一的界面。其次,Tika 也提供了便利的扩展 API,用来丰富其对...
Apache Tika 1.19 发布了,Tika 是一个内容抽取的 工具 集合(a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取工作提供了一个统一的界面。其次,Tika 也提供了便利的扩展 API,用来丰富其对第三方文件格式的支持。
Apache Tika 1.19 包含许多改进和错误修复,其中包括:
要求 Java 8 或更高版本
支持使用 Java 11 构建
改进基于表格的空单元的处理格式
升级至 Commons-Compress 1.18
升级至 Apache POI 4.0.0
……
完整更新内容请查看更新日志。
下载地址 http://tika.apache.org/download.html
【声明】文章转载自:开源中国社区 [http://www.oschina.net]
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- Apache Tika 1.24 发布,内容抽取工具集合
- Apache Tika 1.17 发布 ,内容抽取工具集合
- Apache Tika 1.18 发布,内容抽取工具集合
- Apache Tika 1.19.1 发布,内容抽取工具集合
- Apache Tika 1.19.1 发布,内容抽取工具集合
- Apache Tika 1.22 发布,内容抽取工具集合
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Out of their Minds
Dennis Shasha、Cathy Lazere / Springer / 1998-07-02 / USD 16.00
This best-selling book is now available in an inexpensive softcover format. Imagine living during the Renaissance and being able to interview that eras greatest scientists about their inspirations, di......一起来看看 《Out of their Minds》 这本书的介绍吧!