如何解决在自定义编程语言中调用函数的难题？

问题描述

几个月来我一直在思考如何解决在自定义编程语言中调用函数的问题。对同一函数的无限递归调用有一个奇怪的事情，我在精神上难以超越。

我会这样说明。假设您正在调用诸如 doFoo(1,2) 之类的函数，现在您必须实现它。发生的事情（在我看来）是，您首先将变量推入堆栈，然后跳转到函数。但是让我们专注于第一步，将变量压入堆栈。

您要做的是创建一个堆栈框架，并将其推入堆栈。但是为了创建堆栈帧，您需要在内存中分配空间。因此，要创建堆栈帧，您首先要调用自定义的 allocateMemory(size) 类函数。现在这个函数需要将它的变量压入栈中，创建一个栈帧......所以你通过调用{{1 }} 来自原始 allocateMemory(size) 函数。但后来又发生了！一次又一次。什么都需要分配内存，但是内存分配需要压入栈，需要分配内存，需要压入栈......等

所以我刚刚想到的可能解决这个问题的方法是将这种“推入堆栈”的操作视为原子原始操作。从本质上讲，从“更高”的抽象级别来看，推入堆栈只是一步。就像我想象的那样，程序集会在引擎盖下创建堆栈帧，但它是在硬件中实现的（我认为？），所以您只需执行 allocateMemory(size)，其余部分在较低级别的系统中抽象出来。

这样的想法某种程度上解决了问题，但并不完全。

出于这个问题的目的，我正在构建一个自定义语言解释器以在浏览器中运行。本质上，它会像解释字节码的 VM 一样工作。假设我们有字节码，它具有 push <value> 的等效命令，它创建了一个堆栈帧（以某种方式）。问题是，我在哪里/如何实现 push <value> 命令的实现？在VM解释器下面？这意味着我必须在 JavaScript 域中编写分配逻辑和堆栈帧的创建，然后自定义语言将在 VM 域中运行，调用 JavaScript 域以在堆栈上分配内容。

但我真的不想那样做。我想用这种自定义语言编写一切！那么我怎样才能做到这一点呢？就好像我需要创建层的虚拟机。一个 VM 正在运行，它创建堆栈帧并处理来自更高级别 VM 的命令。较低级别的 VM 是使用非常低级别的原语实现的，比“推入堆栈”还小。它基本上使用 push 和 store 和 fetch，仅此而已。

基本上我在这里迷路了。我如何处理这种情况或思考它以克服心理障碍？有没有办法避免创建这些类型的层？有没有更好的方法来概念化这个？

解决方法

通常，管理运行时程序所需的堆栈和运行时本身管理的堆栈是完全独立的，概念上不在同一级别。
此外，您不能通过使用本身已经实现的高级分配机制作为先决条件来实现。

然而，这两件事显然没有跟在你的问题后面，这就是为什么我不确定除了你需要以不同的方式解决问题之外还有很多答案。我建议首先使用 C 或程序集实现分配，然后在您的语言运行时使用它。那么接下来的步骤应该会更明显。

我想我要做的事情是从协程和我看到的关于有一个二级堆栈的东西中得到启发的。

基本上，如果操作只是移动堆栈指针的位置（按活动记录的大小递增），则可以在单个步骤中完成“入栈”操作。然后它是createStackFrame(size)，它所做的就是移动一个指针。这可以在较低级别的 VM 中实现。所以在创建堆栈帧时不需要“分配内存”。您预先为大堆栈（例如 8MB）分配足够的内存。这样就可以避免在运行时进行分配。

但是接下来就有点棘手了。我读过关于分段堆栈的协程，它们具有大小为 4096 字节（大约为一页）的小堆栈“段”，并且它们链接在一起形成一个链表。因此，基于这个想法，假设单个线程/协程/纤程/回调使用自己的堆栈执行，分为多个段，以便它可以增长。我知道这有一个颠簸的问题，但我还没有那么远。但是我们可以处理多个协程/纤程/线程，每个协程都有自己的分段堆栈。

这样做的方法是引入第二个堆栈，一个仅用于内存分配过程！为了实现为协程/线程/纤程动态创建堆栈，您需要分配一个新堆栈（比如 4096 字节）。该分配算法可能是一组复杂的函数调用（例如实现 malloc），远远超过我们已经决定的一步 createStackFrame(size)。 createStackFrame(size) 只是一步，因为我们已经预先分配了堆栈（假设是我们当前光纤的当前堆栈）。所以它只需要改变一个指针位置。但是我们用于分配新堆栈的 malloc，称为 createStack()，可能需要做很多事情。为了解决这个问题，而不是遇到原始问题中概述的递归难题，我们有一个第二个堆栈，一个仅用于 createStack() 或 malloc 实现！

那么我们调用 createStackFrame(size) 之前可以先检查是否即将用完堆栈段空间，如果是，我们将处理器切换为使用“分配堆栈”，并且然后使用该堆栈运行分配算法（如果我们保持我们的算法足够简单，它是固定的并且不会增长）。一旦它分配了一些空间，就会切换回最后一个线程/光纤/协程堆栈，并将新的内存分配空间链接到它。但是这种分配堆栈和常规协程堆栈之间的切换将使您不会遇到本文中的递归问题。分配堆栈不需要自己重新分配，因此只能使用原子 createStackFrame(size)！

calling-convention compiler-construction programming-languages virtual-machine