用更少的内存找到最长的回文序列

问题描述

| 我正在尝试从Cormem的算法简介第3版(第405页)解决动态编程问题,该问题要求以下内容:   回文是一个非空字符串   一些字母读起来一样   前进和后退。示例   回文是一长串   1,
civic
racecar
aibohphobia
  (对回文症的恐惧)。      给出一个有效的算法来查找   最长回文是   给定输入字符串的子序列。   例如,给定输入   
character
,您的算法应   返回
carac
。 好吧,我可以通过两种方式解决它: 第一个解决方案: 字符串的最长回文序列(LPS)就是它本身的最长公共子序列及其反向。 (在解决一个相关问题后,我将构建此解决方案,该问题要求序列的最长增加子序列)。 由于它只是一个LCS变体,因此还需要O(n²)时间和O(n²)内存。 第二种解决方案: 第二种解决方案更为详尽,但也遵循通用的LCS模板。它来自以下重复发生:
lps(s[i..j]) = 
    s[i] + lps(s[i+1]..[j-1]) + s[j],if s[i] == s[j];
    max(lps(s[i+1..j]),lps(s[i..j-1])) otherwise
用于计算lps长度的伪代码如下:
compute-lps(s,n):

    // palindromes with length 1
    for i = 1 to n:
        c[i,i] = 1
    // palindromes with length up to 2
    for i = 1 to n-1:
        c[i,i+1] = (s[i] == s[i+1]) ? 2 : 1

    // palindromes with length up to j+1
    for j = 2 to n-1:
        for i = 1 to n-i:
            if s[i] == s[i+j]:
                c[i,i+j] = 2 + c[i+1,i+j-1]
            else:
                c[i,i+j] = max( c[i+1,i+j],c[i,i+j-1] )
如果我想有效地构造lps,仍然需要O(n²)时间和内存(因为我将需要表上的所有单元格)。分析诸如LIS之类的相关问题,该问题可以通过类似于LCS的方法以更少的内存来解决(LIS可以用O(n)内存解决),我想知道是否可以用O(n )的记忆。 LIS通过链接候选子序列来实现此界限,但是对于回文式而言,难度更大,因为这里重要的不是子序列中的前一个元素,而是第一个元素。有谁知道是否有可能这样做,或者以前的解决方案内存最佳吗?     

解决方法

这是一个非常有效的内存版本。但是我没有证明它始终是7内存。 (通过预处理步骤,它可能比
O(n2)
CPU更好,尽管
O(n2)
是最坏的情况。) 从最左边的位置开始。对于每个位置,请跟踪最远点的表,在该表上可以生成长度为1、2、3等的反射子序列。(这意味着指向我们点左侧的子序列会反射到右侧。)每个反映的子序列我们都存储一个指向子序列下一部分的指针。 当我们正确地工作时,我们从字符串的RHS到位置搜索当前元素的任何出现位置,并尝试使用这些匹配项来改善以前的界限。完成后,我们将查看最长的镜像子序列,并可以轻松构建最佳回文。 让我们考虑一下
character
。 我们从最好的回文开始是字母“ c”,然后通过字符串末尾的对ѭ11pair到达镜像子序列。 接下来考虑位置1处的\'c \'。我们最好的镜像子序列
(length,end,start)
现在是
[(0,11,0),(1,6,1)]
。 (我将省略需要生成的链表,以实际找到回文。 接下来考虑位置2上的
h
。我们没有改善边界ѭ13the。 接下来考虑位置3的
a
。我们将边界提高到
[(0,1),(2,5,3)]
。 接下来考虑位置4的ѭ18。我们将边界提高到
[(0,10,4),3)]
。 (这是链表有用的地方。 遍历列表的其余部分,我们不会改善该范围。 因此,我们以最长的镜像列表长度为2结束。然后,我们将遵循链接列表(我在本说明中没有记录发现它是
ac
。因为该列表的末尾在
(5,3)
处)我们可以翻转列表,插入字符
4
,然后追加列表以获得
carac
。 通常,它将需要的最大存储器是存储最大镜像子序列的所有长度加上存储器以存储所述子序列的链表。通常,这将是非常少量的内存。 在经典的内存/ CPU权衡下,您可以对列表进行一次时间
O(n)
预处理,以生成大小为
O(n)
的数组散列,这些散列出现在特定序列元素上。这可以让您扫描“使用此配对改善镜像子序列”,而不必考虑整个字符串,对于较长的字符串,这通常可以节省大量CPU资源。     ,@Luiz Rodrigo问题中的第一个解决方案是错误的:字符串的最长公共子继承(LCS)及其反向不一定是回文。 示例:对于字符串CBACB,CAB是字符串及其相反的LCS,并且显然不是回文。 但是,有一种方法可以使其起作用。构造字符串的LCS及其反向字符之后,取其左半部分(包括奇数长度的字符串的中间字符),并在其右边加上反向的左半部分(如果字符串的长度为奇数,则不包括中间字符) )。 显然它将是回文,并且可以简单地证明它将是字符串的子序列。 对于以上LCS,以这种方式构建的回文将是CAC。