- 授权协议: Apache
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://github.com/yahoo/anthelion
软件介绍
Anthelion 是 Nutch 插件,专注于爬取语义数据。
注意:此项目包括完整的 Nutch 1.6 版本,此插件放置在 /src/plugin/parse-anth
Anthelion 使用在线学习方法来基于页面上下文预测富数据 Web 页面,从之前查看的页面提取的元数据获取反馈。
主要有三个扩展:
AnthelionScoringFilter
WdcParser
TripleExtractor
示例:
R for Data Science
Hadley Wickham、Garrett Grolemund / O'Reilly Media / 2016-12-25 / USD 39.99
http://r4ds.had.co.nz/一起来看看 《R for Data Science》 这本书的介绍吧!
