x86-64 System V abi - 参数传递的参数分类

问题描述

第 3.2.3 节中的 x86_64 System V ABI 指定函数调用的哪些参数进入哪些寄存器,哪些被压入堆栈。我无法理解聚合分类的算法,它说(突出显示的是我的):

聚合(结构和数组)和联合类型的分类工作如下:

  1. 如果一个对象的大小大于 8 个八字节,或者它包含未对齐的字段,则它具有类 MEMORY。
  2. 如果 C++ 对象对于调用而言是非平凡的,如 C++ ABI13 中所指定,则通过不可见引用传递(该对象在参数列表中被具有类 INTEGER 的指针替换)。立>
  3. 如果聚合的大小超过单个 8 个字节,将分别对每个字节进行分类。每个八字节都被初始化为 NO_CLASS 类。
  4. 对象的每个字段都被递归分类,以便始终考虑两个字段结果类是根据八字节中字段的类来计算的: (a) 如果两个类相等,这就是结果类。 (b) 如果其中一个类是 NO_CLASS,则结果类是另一个类。 (c) 如果其中一个类是 MEMORY,则结果是 MEMORY 类。(d) 如果其中一个类是 INTEGER,则结果是整数。 (e) 如果其中一个类是 X87、X87UP、COMPLEX_X87 类,则使用 MEMORY 作为类。(f) 否则使用类 SSE。
  5. 然后进行合并后清理: (a) 如果其中一个 是 MEMORY,则整个参数在内存中传递。 (b) 如果 X87UP 前面没有 X87,则整个参数在内存中传递。 (c) 如果聚合的大小超过两个 8 字节并且第一个 8 字节不是 SSE 或任何其他 8 字节不是 SSEUP,则整个参数在内存中传递。 (d) 如果 SSEUP 前面没有 SSE 或 SSEUP,则转换为 SSE

我不明白第 (3)、(4) 和 (5) 点。具体来说,我有以下问题:

第一季度。在第 (3) 点中,“每个都单独分类”,作者的意思是“每个八字节”吗?如果是这样,那么我希望接下来是对八字节分类的解释。

第 2 季度。在第 (4) 点中,“对象的每个字段”是指“作为(在第 (3) 点中分离的结果的八字节的每个字段)吗?

第三季度。在第(4)点中,“总是考虑两个字段”中的“两个字段”是指两个连续的字段吗?

第四季度。在第 (4) 点中,“结果类”是指对象的类、八字节的类、第二个考虑的字段的类,还是其他的类?在最后一种情况下,结果类在哪里使用?这是否意味着算法保持第一个字段的字段不变,然后迭代计算下一个字段的类,直到我们在八字节中拥有所有字段的类?还是说我们算法一次处理两个字段?

问题 5。在第 (4) 点中,如果只有一个字段怎么办?还是偶数个字段?

Q6。在第 (5) 点中,字段或八字节的“类之一”?

如果有人可以提供更正式/更精确的东西 - 例如,伪代码或流程图 - 那将是理想的。

解决方法

the gcc implementation

对第 1 点的澄清(回应评论说“八是一个错字,应该是两个”):

  1. 如果一个对象的大小大于 8 个八字节,或者它包含未对齐的字段,则它具有类 MEMORY。
      /* On x86-64 we pass structures larger than 64 bytes on the stack.  */
      if (bytes > 64)
        return 0;

该函数返回用于参数的寄存器数量,零表示应该使用内存。

(后来经过分析,如果有两个以上的八字节,只有第一个为SSE,其余为SSEUP时才使用寄存器,如5.(c)所指出:

(c) 如果聚合的大小超过两个 8 字节并且第一个 8 字节不是 SSE 或任何其他 8 字节不是 SSEUP,则整个参数在内存中传递。)


第一季度。在第(3)点中,“每个都单独分类”,作者是指“每个八字节”吗?

是的。在代码中,每个八字节被称为一个word

每个八字节都被初始化为类 NO_CLASS。

  int words = CEIL (bytes + (bit_offset % 64) / 8,UNITS_PER_WORD);
  // ...
      for (i = 0; i < words; i++)
        classes[i] = X86_64_NO_CLASS;

第 2 季度。在第 (4) 点中,“对象的每个字段”是指“作为(在第 (3) 点中分离的结果的八字节的每个字段)吗?

不,它们是指结构/类、联合或数组元素的每个字段。这些在代码中的几个地方处理,但您会看到 for 循环,如:

          for (field = TYPE_FIELDS (type); field; field = DECL_CHAIN (field))

这就是为什么它是递归的。字段本身可以是聚合类型。从每个字段和递归函数开始应用整个逻辑:

  • 要么返回0,表示整个事情都在内存中传递,
  • 或者它返回将使用的寄存器数量(8 个字节)以及每个寄存器的类(通过嵌套字段递归将在具有非聚合类型的字段处终止)。
                      num = classify_argument (TYPE_MODE (type),type,subclasses,(int_bit_position (field)
                                               + bit_offset) % 512);
                      if (!num)
                        return 0;

第三季度。在第(4)点中,“总是考虑两个字段”中的“两个字段”是指两个连续的字段吗?

我认为这里的“字段”不准确。并且不连续。它正在做的是合并到目前为止为每个 word 确定的类,并为对应于相同 word 的字段递归确定类。见下文:

                      pos = (int_bit_position (field)
                            + (bit_offset % 64)) / 8 / 8;
                      for (i = 0; i < num && (i + pos) < words; i++)
                        classes[i + pos]
                          = merge_classes (subclasses[i],classes[i + pos]);

pos(该字段所在的八字节)开始,每个类都与该字段的递归调用确定的子类合并。


第四季度。在第 (4) 点中,“结果类”是指对象的类、八字节的类、第二个考虑的字段的类,还是其他的类?

现在描述的是 merge_classes 函数,它接受两个类并返回八字节的合并类。我们正在迭代字段,但类是八字节的。

在最后一种情况下,结果类在哪里使用?

每个类都会确定对应寄存器的类型(GPR/SSE/X87等)。


问题 5。在第 (4) 点中,如果只有一个字段怎么办?还是偶数个字段?

我希望此时回答“两个字段”。例如,如果一个结构体有一个字段,则该类将针对该八字节初始化为 NO_CLASS,然后对于该字段,它将被确定为 INTEGER。然后在合并时,类将变为 INTEGER


Q6。在第 (5) 点中,字段或八字节的“类之一”?

一个八字节。类总是指一个八字节。