问题描述
Python中最接近Haskell递归数据类型的东西是什么? (即在定义类型时使用类型自己的定义。)
编辑:
要给出递归类型的更具体定义,下面是Haskell中的二叉树:
data Tree a = Leaf a | Branch (Tree a) (Tree a)
我的理解方式如下:二叉树可以是叶子,也可以包含两个子树,它们又是类型树本身。
有关Haskell中的递归类型的更多信息,可以在这里参考:https://www.haskell.org/tutorial/goodies.html
我实际上想到的是将Haskell中的单词树定义转换为Python。这是我的一个旧项目中WordTree
的定义:
data WordTree = Word String | Subword String [WordTree] | Root [WordTree]
WordTree
是一种n叉树结构,其中单词的公共前缀存储在父级中,其余部分以排序的方式存储在树的叶子中。我相信这个类型定义有点类似于Trie。但是,由于Haskell是一种功能编程语言,它允许这种类型的定义是递归的。对于这种类型的类型定义,在Python中(或者通常在面向对象的程序中)最接近的是什么?
解决方法
由于Python是动态类型的,因此定义所需的类没有问题。
class Tree:
left = None
right = None
def __init__(self,left,right):
self.left = left
self.right = right
即使您有兴趣键入这些定义,也可以像使用任何其他基于类的面向对象语言一样进行操作:
from typing import Union
class Tree:
left: Union['Tree',int]
right: Union['Tree',int]
def __init__(self,left: Union['Tree',int],right: Union['Tree',int]) -> None:
self.left = left
self.right = right
请注意使用字符串作为类型名称(在最新的Python版本中可以避免使用该字符串)。
有关直接递归代数类型(例如
),请参见mypy中的open issueTree = Union[Tuple['Tree','Tree'],int]
定义您描述的WordTree
的最常见(尽管不一定推荐)方法是使用超类和浅层次结构:
from typing import List,final
class WordTree: pass
@final
class Word(WordTree):
word: str
@final
class Subword(WordTree):
subword: str
children: List[WordTree]
@final
class Root(WordTree):
children: List[WordTree]
使用这种实现可能需要使用isinstance
检查(尽管Python3.9为您提供了nice sugar)。在此示例中,省略了构造函数,以避免混乱。您可能想使用dataclass
轻松地获得它们以及其他行为。
到目前为止,Python还没有办法禁止不相关的类继承自WordTree
,从而破坏了一些静态推理此类程序的能力。
其他一些OOP语言,例如Scala和Kotlin和(很快)Java,可以采用这样的定义(使用sealed
classes),并为您提供与类型检查和语法构造相似的定义由功能语言(例如Haskell)提供。
据我所知,通常仅针对纯数据类(例如AST)建议使用这种设计。它不适合定义面向用户的容器(例如trie),因为它公开了数据结构的内部工作原理。因此,即使您采用该设计,也可能希望将其用作实现细节,并使用另一个类Trie
,供客户端代码通过定义明确的API使用。该类可以有一个WordTree
字段,或任何其他实现相同逻辑的方式。
IMO对于实现面向对象的设计与功能设计的区别非常重要。后者专注于数据流和静态推理,而前者专注于API,可扩展性和去耦。我认为这是有帮助的,当在语言和环境之间进行移植时-尽管如上所述,某些语言会尝试同时启用这两种设计方法。