simhash 算法的 java 实现 simhash-java

码农软件 · 软件分类 · 常用工具包 · 2019-08-14 06:41:30

软件介绍

simhash 算法的 java 实现。

特点

  • 计算字符串的 simhash

  • 通过构建智能索引来计算所有字符串之间的相似性,因此可以处理大数据

使用

  • 使用输入文件和输出文件运行 Main

  • inputfile 的格式(参见 src / test_in):一个文件每行用 utf8 字符集

  • outputfile 格式

     

start //start flag

first line // doc

sencode lien // doc1\tdist the dist is the hamming distance between doc and doc1 

end //end flag

本文地址:https://codercto.com/soft/d/12319.html

具体数学(英文版第2版)

具体数学(英文版第2版)

[美] Ronald L. Graham、Donald E. Knuth、Oren Patashnik / 机械工业出版社 / 2002-8 / 49.00元

This book introduces the mathematics that supports advanced computer Programming and the analysis of algorithms. The primary aim of its well-known authors is to provide a solid and relevant base of ma......一起来看看 《具体数学(英文版第2版)》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

html转js在线工具
html转js在线工具

html转js在线工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具