simhash-java simhash 算法的 java 实现

程序名称:simhash-java

授权协议: MIT

操作系统: 跨平台

开发语言: Java

simhash-java 介绍


simhash 算法的 java 实现。

特点

  • 计算字符串的 simhash

  • 通过构建智能索引来计算所有字符串之间的相似性,因此可以处理大数据

使用

  • 使用输入文件输出文件运行 Main

  • inputfile 的格式(参见 src / test_in):一个文件每行用 utf8 字符集

  • outputfile 格式

    start //start flag

    first line // doc

    sencode lien // doc1\tdist the dist is the hamming distance between doc and doc1 

    end //end flag

simhash-java 官网

https://github.com/sing1ee/simhash-java

相关编程语言

BlazeDS 是一个基于服务器的Java 远程控制(remoting...
OVal 是一个可扩展的Java对象数据验证框架,验证的规...
Volta 是一套开发工具,专为开发分布式、实时系统应...
OpenDDS 是一个开源的 C++ 实现的 对象管理组织 OMG...
JADE (Java Agent DEvelopment Framework) 是一个完...
FastMM ,在D2006和2007中已代替了原来的内存管理器。