Web 爬虫 Apache Nutch 1.15 发布,支持 Java 10

栏目: 编程工具 · 发布时间: 7年前

内容简介:Apache Nutch 1.15 已发布。Nutch是一个成熟的、可用于生产的 Web 爬虫。 Nutch 1.x 可以依靠 Apache Hadoop™ 数据结构进行细粒度配置,这对于批处理非常有用。此版本包含100多项 bug 修复和改进,完整的更改列表可下载地址:

Apache Nutch 1.15 已发布。Nutch是一个成熟的、可用于生产的 Web 爬虫。 Nutch 1.x 可以依靠 Apache Hadoop™ 数据结构进行细粒度配置,这对于批处理非常有用。

此版本包含100多项 bug 修复和改进,完整的更改列表可 查阅发布说明 。其中值得注意的包括:

  • NUTCH-1480 具有不同配置的多索引 writer 实例现在可以将文档索引到多个 Solr 或 Elasticsearch 实例中

  • NUTCH-2375 使用新的 MapReduce API

  • NUTCH-2583 更新依赖库,这也使得 Nutch 可在 Java 9 和 10 上运行和编译

  • NUTCH-2549 对 protocol-http 插件进行修复和改进

  • NUTCH-2576 一个基于 okhttp 库的新 HTTP 协议实现,如果与 Java 9 或更高版本一起使用,则支持 HTTP / 2

  • NUTCH-1129 一个基于 Any23 项目的新插件,用于提取链接数据

下载地址:


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

产品增长力

产品增长力

李阳 / 机械工业出版社 / 2018-4-1 / 59

本书由京东资深数据产品经理撰写,重新定义了数据与产品、业务的关系,从数据分析方法、数据价值挖掘、数据结果倒逼业务优化3个层次,以及设计、运营和优化3个维度,为产品增长提供了科学的依据和方法论,得到了PMCaff创始人阿德、GrowingIO创始人&CEO张溪梦、增长官研究院创始人范冰、腾讯高级产品经理刘涵宇等专家的高度评价。 全书内容以理论为主线,以实操为目标,萃取技术实操与管理思维中的精华......一起来看看 《产品增长力》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具