Clang:通过内联汇编获取函数的参数

问题描述

我正在编写一段代码获取函数的参数,而无需使用stdarg。 参数将始终是整数。 该平台是Linux x86_64。 因此,调用约定应为:寄存器%rdi%rsi%rdx%rcx%r8%r9中的前6个参数,然后堆栈上的以下参数。考虑到这一点,我最终获得了以下代码,该代码使用内联汇编获取前6个参数,然后使用指向堆栈的指针来解析其余参数。

#define CFI_DEF_CFA_OFFSET 16ull

void get_args (int arg1,...)
{
    register int rdi __asm__ ("rdi"); // 1st arg
    register int rsi __asm__ ("rsi");
    register int rdx __asm__ ("rdx");
    register int rcx __asm__ ("rcx");
    register int r8  __asm__ ("r8" );
    register int r9  __asm__ ("r9" ); // 6th arg

    printf("%d %d %d %d %d %d\n",rdi,rsi,rdx,rcx,r8,r9);

    uint64_t frame_pointer = (uint64_t)__builtin_frame_address(0) + CFI_DEF_CFA_OFFSET;
    printf("%d\n",*((int*)frame_pointer)); // 1st stack argument
    frame_pointer += 8ull; // going to the next
    printf("%d\n",*((int*)frame_pointer)); // and so on ...
}

int main (void)
{
    get_args(666,42,64,555,1111,8888,7777,4444);
}

这在GCC上可以正常工作,但是内联汇编部分在Clang上不起作用(它可以编译,但是值似乎是随机垃圾)。 由于我对汇编的了解有限,并且可能对类似问题的注释产生误解,因此我不知道是否可以使用Clang以类似的方式读取这些特定的寄存器,如果可以,可以使用什么语法读取。

感谢您的帮助!

解决方法

至少有两个topstop问题,还有其他问题:

该函数可以内联,在这种情况下,没有理由期望args在任何特定的寄存器中,或者根本不存在,因为它们在C级别上是未使用的。不会在-O0发生,但是只能用于调试模式玩具实验,除非您使用__attribute__((noinline))或将其放在与调用方不同的文件中,请注意 使用链接时优化。这是针对GCC和clang的展示。

更根本的是,GNU C register-asm local variables唯一有据可查(并因此得到保证)的作用是确保"r"约束选择为扩展asm()语句注册。 您所依赖的行为由文档明确保证 ,因此不受GCC的正式支持。它可能会在将来的任何GCC版本中中断。
它曾经被记录在案,而GCC本身仍然碰巧不止于此,因此通常读取未初始化的C变量将获得该寄存器中最初的内容,但clang不会。就像读取任何其他未初始化的变量一样。查看由编译器生成的asm,以查看代码的编译方式(例如,在https://godbolt.org/上)

还有问题:在这些变量进入作用域之前,任何编译器生成的代码都可能使用寄存器。在函数顶部可能不太可能。


要执行所需的操作,请将函数声明为采用6个整数/指针args ,然后可变。因此,寄存器arg均具有实际有效的C名称,并且您在任何地方都不需要 asm关键字。或手动将get_args写入asm。

如果您希望传递较少的args,请在调用编译器时撒谎,例如通过提供具有更少参数的原型。

也许可以使用__attribute__ ((weak,alias (get_args)))为可变参数函数声明一个原型,您可以使用任意数量的args来调用该可变参数函数,但是其asm符号名称与您声明的函数相同。 (这可能会阻止内联,如果它是正确有效的C,则实际上并不必要。)

我没有尝试过,因为它基本上没有意义。如果要执行依赖于调用约定而不是C抽象机的怪异操作,请在asm中编写它。 C不是一种可移植的汇编语言,,即使使用内联汇编程序试图将其击败,现代C也离它很远。

,

似乎有几种方法可以做到这一点。

  • 我可以声明该函数为6个参数,然后是可变参数。
void get_args (int argc,int a1,int a2,int a3,int a4,int a5,...);

在这里,我可以按名称获取前6个参数,然后使用指向堆栈的指针获取其余参数 要调用少于6个参数的函数,我可以通过声明另一个原型来欺骗编译器。例如:

void get_args (int argc,...);
  • 我可以使用这种汇编语法将寄存器读入变量:
void get_args(int argc,...)
{
    int rdi,rsi,rdx,rcx,r8,r9;
    // 32-bit alias (why ? ...)   ↓
    __asm__ __volatile__("movl %%r8d,%%eax" : "=a"(r8) :: "rdi","rsi","rdx","rcx","r8","r9");
    // repeat this for the 5 other registers         ↑
} 

同样,通过获取堆栈地址(例如,使用__builtin_frame_address(0)来获取> 6的args。)