使用 `rax` 到 `jmp` 到一个函数是否安全?

问题描述

您好,我遇到过需要将参数传递到如下预定义函数中的情况:

void dojmp(args...)
{
    args[0]->func(args...);
}

我不想写多个跳转函数来传递不同的参数,而是想使用裸跳转,这样跳转后相对堆栈和寄存器数据不发生变化。像下面这样。

void __attribute__((naked)) dojmp(void)
{
    __asm__ __volatile__    (   
        "jmp %%rax  \n\t"
        :
        :"a"(args[0]->func)
        :"memory"                   
    );
}

而gcc编译的结果是:

<dojmp>:
  mov    %rdi,%rax
  mov    (%rax),%rax
  jmpq   *%rax

现在我的问题是,使用 rax 作为跳转目标(对于 gcc)和 void 返回函数是否​​安全??

因为通常 rax 会存储返回值。但是我调用的所有函数都是无效的....


在这里记住它是为了将相对地址传递到汇编代码中,以防我弄乱了我的笔记。

#include <stdio.h>

#define offsetof(TYPE,MEMBER) ((size_t)&((TYPE *)0)->MEMBER)


struct have_func{
    int a;
    void* func;
};

int main()
{
    printf("hello world\n");
}

void __attribute__((naked)) dojmp(struct have_func * args)
{
    asm volatile(
        "jmpq *%P0(%%rdi)\n\t" 
        :
        : "i"(offsetof(struct have_func,func))
    );
}

解决方法

为此您不需要内联汇编。 调用这个包装器函数应该完全等同于将一个函数指针转换为你用于包装器的同一个原型。(在传递给目标函数的参数方面。)


请记住,RAX 返回值寄存器不会由函数写入,直到 after 你已经跳转到它,所以是的,当然可以使用 RAX 作为临时 before 尾调用,甚至是带有返回值的函数。那不是问题。你弄乱了 RAX,然后函数运行,然后它返回给你的调用者。

然而,x86-64 System V 确实使用 AL 作为可变参数函数来传递 XMM 寄存器 arg 的计数。如果您的函数实际上是可变参数,则在实际 C 源代码中使用 void foo(arg a,...) 和文字 ... 时,执行此操作是有问题的。然后需要通过 AL(为了现代实现的效率,以及在一般情况下的正确性,包括旧的 GCC 代码生成,它将使用 AL 计算跳转到 movdqa 存储序列。)>

无论如何在 naked 函数中使用扩展 Asm 在技术上是不安全或不支持的(因为处理操作数涉及编译器生成的代码)。因此,出于多种原因,您最好的选择是使用内存间接跳转,而不是要求编译器为您加载:

 asm( "jmpq *(%rdi)" );

offsetof(args,func) 硬编码为 0,因此您可以对其进行 static_assert(或放置在结构中的任何位置)。

使用像 "i"(offsetof(..))"m"(args[0]->func) 这样的扩展 Asm 可能可行,但在技术上不受 a naked function 支持。 (因为它是扩展汇编)。

这个属性允许编译器构造必要的函数声明,同时允许函数体是汇编代码。指定的函数不会有编译器生成的序言/尾声序列。只有基本的 asm 语句可以安全地包含在裸函数中(请参阅基本 Asm)。 虽然使用扩展的 asm 或基本的 asm 和 C 代码的混合似乎可以工作,但不能依赖它们可靠地工作并且不受支持。


在编译器生成的 asm 中引入这个额外的间接(并击败内联)只是为了让编译器对函数类型感到满意,这有点糟糕。 https://gcc.gnu.org/wiki/DontUseInlineAsm

如果你能完全避免内联汇编会更好,尽管这可能以使用可变参数函数指针类型为代价,但实际上将它指向非可变参数函数。 x86-64 System V 可以很好地处理这个问题,至少如果没有一个 args 在您不需要它们时最终被默认提升。

args[0]->func(args,...)

例如

  void (*arg0func)(struct Arg,...) = ( void (*)(struct Arg,...) )args[0]->func;
  arg0func(args,whatever you were going to pass);

您可以使用 CPP 宏对其进行包装。

甚至可能有一种方法可以编写一个可变参数函数,该函数可以内联并将其所有参数转发到另一个函数。