如果 Trie 结构中的另一个词没有使用一个词的节点,则删除它们

问题描述

从树中删除一个词时,我试图删除该词的节点,如果它们没有被用于另一个词。

所以我不想在删除单词时只标记一个节点。真正应该删除未使用的节点。

如果在 trie 中找不到这个词,我希望删除方法返回 False,如果删除成功,它应该返回 True。

这是我的 Trie 课程:

class Trie(object):
    def __init__(self):
        self.children = {}
        self.end = "#"

    def append_word(self,word: str):
        node = self.children
        for c in word:
            node = node.setdefault(c,{})
        node[self.end] = self.end

这是我根据研究尝试实施的 delete 方法

    def delete(self,word):
        node = self
        parent = self
        for char in word:
            if char in node.children:
                parent = node
                node = node.children[char]
            else:
                return False
        if not node.children:
            del parent.children[char]
            del node
            return True
        else:
            node.end = "#"
            return True

在这里遗漏了什么?

我正在从另一个类的 trie 实例调用这样的函数

self.trie.delete(user_input)

解决方法

您尝试的问题与以下两点有关:

  • 您的 append_word 方法显示节点没有 children 属性。它们是字典。唯一具有 children 属性的对象是 Trie 实例,而您只有一个这样的实例。结构的其余部分是一个以 children 属性开头的嵌套字典

  • 使用 parent 您只保留 last 父级,而不是所有祖先。要做到这一点,您需要回溯潜在的多个祖先,直到遇到仍在使用另一个词的祖先。所以实际上您需要一个祖先列表而不是一个 parent 引用。

这是更正后的实现:

def delete(self,word):
    node = self.children
    stack = []
    for char in word:
        if char not in node:  # Word is not in the Trie
            return False
        stack.append(node)  # Collect as ancestor
        node = node[char]
    if self.end not in node:  # End-of-word marker is missing,so word is not in Trie
        return False
    del node[self.end]   # Remove end-of-word marker
    for char in reversed(word):  # Backtrack in reversed order
        if len(node):  # Still in use for another word?
            break
        node = stack.pop()
        del node[char]
    return True