- 授权协议: MIT
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://github.com/sing1ee/simhash-java
- 软件文档: https://github.com/sing1ee/simhash-java/blob/master/README.md
软件介绍
simhash 算法的 java 实现。
特点
计算字符串的 simhash
通过构建智能索引来计算所有字符串之间的相似性,因此可以处理大数据
使用
使用输入文件和输出文件运行 Main
inputfile 的格式(参见 src / test_in):一个文件每行用 utf8 字符集
outputfile 格式
start //start flag first line // doc sencode lien // doc1\tdist the dist is the hamming distance between doc and doc1 end //end flag
在线进制转换器
各进制数互转换器
HTML 编码/解码
HTML 编码/解码
