问题描述
第 3.2.3 节中的 x86_64 System V ABI 指定函数调用的哪些参数进入哪些寄存器,哪些被压入堆栈。我无法理解聚合分类的算法,它说(突出显示的是我的):
聚合(结构和数组)和联合类型的分类工作如下:
- 如果一个对象的大小大于 8 个八字节,或者它包含未对齐的字段,则它具有类 MEMORY。
- 如果 C++ 对象对于调用而言是非平凡的,如 C++ ABI13 中所指定,则通过不可见引用传递(该对象在参数列表中被具有类 INTEGER 的指针替换)。立>
- 如果聚合的大小超过单个 8 个字节,将分别对每个字节进行分类。每个八字节都被初始化为 NO_CLASS 类。
- 对象的每个字段都被递归分类,以便始终考虑两个字段。 结果类是根据八字节中字段的类来计算的: (a) 如果两个类相等,这就是结果类。 (b) 如果其中一个类是 NO_CLASS,则结果类是另一个类。 (c) 如果其中一个类是 MEMORY,则结果是 MEMORY 类。(d) 如果其中一个类是 INTEGER,则结果是整数。 (e) 如果其中一个类是 X87、X87UP、COMPLEX_X87 类,则使用 MEMORY 作为类。(f) 否则使用类 SSE。
- 然后进行合并后清理: (a) 如果其中一个类 是 MEMORY,则整个参数在内存中传递。 (b) 如果 X87UP 前面没有 X87,则整个参数在内存中传递。 (c) 如果聚合的大小超过两个 8 字节并且第一个 8 字节不是 SSE 或任何其他 8 字节不是 SSEUP,则整个参数在内存中传递。 (d) 如果 SSEUP 前面没有 SSE 或 SSEUP,则转换为 SSE
我不明白第 (3)、(4) 和 (5) 点。具体来说,我有以下问题:
第一季度。在第 (3) 点中,“每个都单独分类”,作者的意思是“每个八字节”吗?如果是这样,那么我希望接下来是对八字节分类的解释。
第 2 季度。在第 (4) 点中,“对象的每个字段”是指“作为(在第 (3) 点中分离的结果的八字节的每个字段)吗?
第三季度。在第(4)点中,“总是考虑两个字段”中的“两个字段”是指两个连续的字段吗?
第四季度。在第 (4) 点中,“结果类”是指对象的类、八字节的类、第二个考虑的字段的类,还是其他的类?在最后一种情况下,结果类在哪里使用?这是否意味着算法保持第一个字段的字段不变,然后迭代计算下一个字段的类,直到我们在八字节中拥有所有字段的类?还是说我们算法一次处理两个字段?
问题 5。在第 (4) 点中,如果只有一个字段怎么办?还是偶数个字段?
Q6。在第 (5) 点中,字段或八字节的“类之一”?
如果有人可以提供更正式/更精确的东西 - 例如,伪代码或流程图 - 那将是理想的。
解决方法
对第 1 点的澄清(回应评论说“八是一个错字,应该是两个”):
- 如果一个对象的大小大于 8 个八字节,或者它包含未对齐的字段,则它具有类 MEMORY。
/* On x86-64 we pass structures larger than 64 bytes on the stack. */
if (bytes > 64)
return 0;
该函数返回用于参数的寄存器数量,零表示应该使用内存。
(后来经过分析,如果有两个以上的八字节,只有第一个为SSE,其余为SSEUP时才使用寄存器,如5.(c)所指出:
(c) 如果聚合的大小超过两个 8 字节并且第一个 8 字节不是 SSE 或任何其他 8 字节不是 SSEUP,则整个参数在内存中传递。)
第一季度。在第(3)点中,“每个都单独分类”,作者是指“每个八字节”吗?
是的。在代码中,每个八字节被称为一个word
。
每个八字节都被初始化为类 NO_CLASS。
int words = CEIL (bytes + (bit_offset % 64) / 8,UNITS_PER_WORD);
// ...
for (i = 0; i < words; i++)
classes[i] = X86_64_NO_CLASS;
第 2 季度。在第 (4) 点中,“对象的每个字段”是指“作为(在第 (3) 点中分离的结果的八字节的每个字段)吗?
不,它们是指结构/类、联合或数组元素的每个字段。这些在代码中的几个地方处理,但您会看到 for
循环,如:
for (field = TYPE_FIELDS (type); field; field = DECL_CHAIN (field))
这就是为什么它是递归的。字段本身可以是聚合类型。从每个字段和递归函数开始应用整个逻辑:
- 要么返回0,表示整个事情都在内存中传递,
- 或者它返回将使用的寄存器数量(8 个字节)以及每个寄存器的类(通过嵌套字段递归将在具有非聚合类型的字段处终止)。
num = classify_argument (TYPE_MODE (type),type,subclasses,(int_bit_position (field)
+ bit_offset) % 512);
if (!num)
return 0;
第三季度。在第(4)点中,“总是考虑两个字段”中的“两个字段”是指两个连续的字段吗?
我认为这里的“字段”不准确。并且不连续。它正在做的是合并到目前为止为每个 word
确定的类,并为对应于相同 word
的字段递归确定类。见下文:
pos = (int_bit_position (field)
+ (bit_offset % 64)) / 8 / 8;
for (i = 0; i < num && (i + pos) < words; i++)
classes[i + pos]
= merge_classes (subclasses[i],classes[i + pos]);
从 pos
(该字段所在的八字节)开始,每个类都与该字段的递归调用确定的子类合并。
第四季度。在第 (4) 点中,“结果类”是指对象的类、八字节的类、第二个考虑的字段的类,还是其他的类?
现在描述的是 merge_classes
函数,它接受两个类并返回八字节的合并类。我们正在迭代字段,但类是八字节的。
在最后一种情况下,结果类在哪里使用?
每个类都会确定对应寄存器的类型(GPR/SSE/X87等)。
问题 5。在第 (4) 点中,如果只有一个字段怎么办?还是偶数个字段?
我希望此时回答“两个字段”。例如,如果一个结构体有一个字段,则该类将针对该八字节初始化为 NO_CLASS
,然后对于该字段,它将被确定为 INTEGER
。然后在合并时,类将变为 INTEGER
。
Q6。在第 (5) 点中,字段或八字节的“类之一”?
一个八字节。类总是指一个八字节。