Generalized Suffix Tree Java Implementation
我正在寻找一个Java实现的广义后缀树(GST),具有以下特点:
在使用say 1000字符串创建GST之后,我想知道这1000个字符串中有多少包含其他字符串"s"。
搜索必须安静快速,因为我需要将搜索应用于大约10万个平均长度为10的候选字符串。
尝试语义发现工具包。它在T/SRC/Java/ORG/SD/TEX/RexxTead上实现
我在Java中创建了一个后缀树,允许您轻松添加自己的搜索功能和其他匹配算法。我的博客文章,后缀树在Java中,有一个概述,以及下载最新版本的说明。我的Java实现是基于Mark Nelson的快速字符串搜索后缀树文章。
2016-06-18更新
- 包含上述后缀树实现的库现在可以在https://bitback.org/globalmentor/globalmentor-core上找到。
- 该库的最新版本可从Maven Central获得,网址为http://search.maven.org/search%7cga%7c1%7cg%3a%22com.globalmentor%22%20和%20a%3a%22globalmentor core%22。
有一个非通用后缀树的Java实现可在:HTTP:/ILYA KEEPLLIN .BLGSPOT.COM/200 9/04/EXIX-TIEES-JAVA UKONSCNEN算法.HTML
您可以在Java中找到一个通用后缀树的实现。我尽量把它记录下来,这样你会发现它很有用。
以下是我对suffixtree的实现:https://github.com/losvald/sglj/blob/master/src/main/java/org/sglj/util/pattrie.java
此外,它还支持在节点中存储任意数据,并查找与前缀关联的一组值。