问题描述
我了解到,如果被呼叫者使用了caller saved registers (rax rdx rcx rsi rdi r8 r9 r10 r11)
中的任何一个,那么它必须在呼叫者执行call
指令之前进行保存并在之后进行恢复。
通过以下示例,
int read();
void print(int i);
int main()
{
int a = read();
int b = read();
int c = read();
int d = read();
int e = read();
int f = read();
int g = read();
print(a);
print(b);
print(c);
print(d);
print(e);
print(f);
print(g);
}
注意
-
变量
a - g
应该使用所有callee saved registers (rbp rsp rbx r12 r13 r14 r15)
。而且我们不能同时使用rbp
或rsp
,因为其中之一必须用于寻址堆栈存储器。 -
read
和print
来自某个外部编译单元。因此,当我们编译当前的编译单元时,尤其是在main
函数的寄存器分配期间,我们并不真正了解它们的调用方保存寄存器的用法。
在godbolt和-O3
中,它将编译为以下内容
main:
pushq %r15
pushq %r14
pushq %r13
pushq %r12
pushq %rbp
pushq %rbx
subq $24,%rsp # spill here
call read()
movl %eax,12(%rsp) # spill here
call read()
movl %eax,%ebx
call read()
movl %eax,%r15d
call read()
movl %eax,%r14d
call read()
movl %eax,%r13d
call read()
movl %eax,%r12d
call read()
movl 12(%rsp),%edi
movl %eax,%ebp
call print(int)
movl %ebx,%edi
call print(int)
movl %r15d,%edi
call print(int)
movl %r14d,%edi
call print(int)
movl %r13d,%edi
call print(int)
movl %r12d,%edi
call print(int)
movl %ebp,%edi
call print(int)
addq $24,%rsp
xorl %eax,%eax
popq %rbx
popq %rbp
popq %r12
popq %r13
popq %r14
popq %r15
ret
注意
-
变量
a
溢出到12(%rsp)
中。 -
我们不需要浪费任何
caller saved registers
,因为根本没有使用它们,因此在这里效率更高。
我的问题
-
如果我们不使用
caller saved registers
,看起来我们真的不需要处理它们。因此,什么时候应该使用caller saved registers
? -
对于
read
和print
之类的被叫者,因为我们不知道它们的寄存器使用情况,我们应该如何为caller saved registers
进行溢出?
谢谢
解决方法
似乎“调用者已保存/被调用者已保存”这个令人困惑和不直观的术语误导了您,认为每个寄存器都应该始终由某人保存。请参阅What are callee and caller saved registers?-“保持通话”与“电话瘫痪”在便于记忆和心理模型上都更加有用。像函数arg一样,破坏值是很正常的。
如果我们不使用它们,看起来我们真的不需要处理溢出调用者保存的寄存器。
请注意,您的函数确实使用了几个调用密集(“保存了呼叫者”)寄存器:它使用RDI将arg传递给print(int)
,并将RAX设为main的返回值值。
如果在呼叫密集寄存器中有一个值需要在整个函数调用中保留下来,则GCC选择将该值mov
read()
到保留调用的寄存器中。例如 mov %eax,%ebp
返回时,其返回值以EAX表示,下次调用将销毁该值。因此它使用12(%rsp)
或其他任何方法将其保存到保留呼叫的寄存器中,或将其中的一个溢出到-fomit-frame-pointer
中。
(请注意,GCC使用push / pop来保存/恢复其使用的保留呼叫寄存器的调用者值。)
GCC的默认代码生成策略是保存/恢复保留调用的寄存器,以在各个调用之间保存值,而不是在此函数内部 溢出到内存中。对于不太重要的情况,这通常是一件好事,尤其是对于循环内的调用。有关更多信息,请参见Why do compilers insist on using a callee-saved register here?。
而且我们不能同时使用rbp或rsp,因为其中之一必须用于寻址堆栈存储器。
也错误:使用read
(在大多数优化级别上),RBP只是另一个保留呼叫的寄存器。您的函数使用它来保存dot
返回值。 (EBP是RBP的低32位。)
我了解到,如果被调用方使用了任何已保存的调用方寄存器(rax rdx rcx rsi rdi r8 r9 r10 r11),那么它必须在调用方调用指令之前保存并在调用方调用之后恢复。
应该是
我了解到,如果调用者使用了任何已保存的调用者寄存器(rax rdx rcx rsi rdi r8 r9 r10 r11),那么它必须在调用者的调用指令之前保存并在调用者指令之后恢复。 >
调用者保存寄存器是那些可能被任何调用函数破坏的寄存器。您不确定是否有给定的被叫方使用它们,因此您必须假设最坏的情况。但是,呼叫者仅在使用它们时才需要保存它们。如果不是,那么您就不在乎它们是否会被破坏。