问题描述
我正在编写一段代码来获取函数的参数,而无需使用stdarg
。
参数将始终是整数。
该平台是Linux x86_64。
因此,调用约定应为:寄存器%rdi
,%rsi
,%rdx
,%rcx
,%r8
和%r9
中的前6个参数,然后堆栈上的以下参数。考虑到这一点,我最终获得了以下代码,该代码使用内联汇编获取前6个参数,然后使用指向堆栈的指针来解析其余参数。
#define CFI_DEF_CFA_OFFSET 16ull
void get_args (int arg1,...)
{
register int rdi __asm__ ("rdi"); // 1st arg
register int rsi __asm__ ("rsi");
register int rdx __asm__ ("rdx");
register int rcx __asm__ ("rcx");
register int r8 __asm__ ("r8" );
register int r9 __asm__ ("r9" ); // 6th arg
printf("%d %d %d %d %d %d\n",rdi,rsi,rdx,rcx,r8,r9);
uint64_t frame_pointer = (uint64_t)__builtin_frame_address(0) + CFI_DEF_CFA_OFFSET;
printf("%d\n",*((int*)frame_pointer)); // 1st stack argument
frame_pointer += 8ull; // going to the next
printf("%d\n",*((int*)frame_pointer)); // and so on ...
}
int main (void)
{
get_args(666,42,64,555,1111,8888,7777,4444);
}
这在GCC上可以正常工作,但是内联汇编部分在Clang上不起作用(它可以编译,但是值似乎是随机垃圾)。 由于我对汇编的了解有限,并且可能对类似问题的注释产生误解,因此我不知道是否可以使用Clang以类似的方式读取这些特定的寄存器,如果可以,可以使用什么语法读取。
感谢您的帮助!
解决方法
至少有两个topstop问题,还有其他问题:
该函数可以内联,在这种情况下,没有理由期望args在任何特定的寄存器中,或者根本不存在,因为它们在C级别上是未使用的。不会在-O0
发生,但是只能用于调试模式玩具实验,除非您使用__attribute__((noinline))
或将其放在与调用方不同的文件中,请注意 使用链接时优化。这是针对GCC和clang的展示。
更根本的是,GNU C register-asm local variables唯一有据可查(并因此得到保证)的作用是确保"r"
约束选择为扩展asm()
语句注册。 您所依赖的行为由文档明确保证不 ,因此不受GCC的正式支持。它可能会在将来的任何GCC版本中中断。
它曾经被记录在案,而GCC本身仍然碰巧不止于此,因此通常读取未初始化的C变量将获得该寄存器中最初的内容,但clang不会。就像读取任何其他未初始化的变量一样。查看由编译器生成的asm,以查看代码的编译方式(例如,在https://godbolt.org/上)
还有问题:在这些变量进入作用域之前,任何编译器生成的代码都可能使用寄存器。在函数顶部可能不太可能。
要执行所需的操作,请将函数声明为采用6个整数/指针args ,然后可变。因此,寄存器arg均具有实际有效的C名称,并且您在任何地方都不需要 asm
关键字。或手动将get_args
写入asm。
如果您希望传递较少的args,请在调用编译器时撒谎,例如通过提供具有更少参数的原型。
也许可以使用__attribute__ ((weak,alias (get_args)))
为可变参数函数声明一个原型,您可以使用任意数量的args来调用该可变参数函数,但是其asm符号名称与您声明的函数相同。 (这可能会阻止内联,如果它是正确有效的C,则实际上并不必要。)
我没有尝试过,因为它基本上没有意义。如果要执行依赖于调用约定而不是C抽象机的怪异操作,请在asm中编写它。 C不是一种可移植的汇编语言,,即使使用内联汇编程序试图将其击败,现代C也离它很远。
,似乎有几种方法可以做到这一点。
- 我可以声明该函数为6个参数,然后是可变参数。
void get_args (int argc,int a1,int a2,int a3,int a4,int a5,...);
在这里,我可以按名称获取前6个参数,然后使用指向堆栈的指针获取其余参数 要调用少于6个参数的函数,我可以通过声明另一个原型来欺骗编译器。例如:
void get_args (int argc,...);
- 我可以使用这种汇编语法将寄存器读入变量:
void get_args(int argc,...)
{
int rdi,rsi,rdx,rcx,r8,r9;
// 32-bit alias (why ? ...) ↓
__asm__ __volatile__("movl %%r8d,%%eax" : "=a"(r8) :: "rdi","rsi","rdx","rcx","r8","r9");
// repeat this for the 5 other registers ↑
}
同样,通过获取堆栈地址(例如,使用__builtin_frame_address(0)
来获取> 6的args。)