具有后缀树的最短不可重复子串

问题描述

我需要设计一种高效的算法来查找文本中的最短不可重复子串。在本质上;在文本中只出现一次的最短字符串。这必须仅使用后缀树

示例 1:

Text: AATGCCTA 然后 Result: G

示例 2:

Text: AAAAGGGG 然后 Result: AG

解决方法

shortes 不可重复子串是所有后缀中最短的唯一前缀。

参见卢西安·伊利 (Lucian Ilie) 的《Minimum Unique Substrings and Maximum Repeats》 和 W. F. 史密斯。