- 授权协议: Apache
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: http://code.google.com/p/duke/
- 软件文档: http://code.google.com/p/duke/w/list
软件介绍
Duke 是一个快速灵活的去除重复数据的引擎,基于 Lucene 开发,普通笔记本电脑可以在 11 分钟内处理完 100 万条记录。
下图是 Duke 的架构:
Duke 是一个快速灵活的去除重复数据的引擎,基于 Lucene 开发,普通笔记本电脑可以在 11 分钟内处理完 100 万条记录。
下图是 Duke 的架构: