LD_PRELOAD 是否可能只影响主可执行文件? 实际问题简化的问题

问题描述

实际问题

我有一个认情况下使用 EGL 和 SDL 1.2 分别处理图形和用户输入的可执行文件。使用 LD_PRELOAD,我用 GLFW 替换了两者。

除非用户安装了 GLFW 的 Wayland 版本,否则这正常工作,这取决于 EGL 本身。因为所有的 EGL 调用要么被存根不做任何事情,要么调用 GLFW 等效项,所以它不起作用(即 eglSwapBuffers 调用 glfwSwapBuffers 调用 eglSwapBuffers 等等)。我无法删除 EGL 存根,因为它会同时调用 EGL 和 GLFW,并且主可执行文件是闭源代码,因此我无法对其进行修改

有没有办法让 LD_PRELOAD 影响主可执行文件而不影响 GLFW?或者有什么其他的解决方案可以达到同样的效果

简化的问题

我做了一个简单的例子来演示这个问题。

主要可执行文件

#include <stdio.h>

extern void do_something();

int main() {
    do_something();
    fputs("testing B\n",stderr);
}

共享库:

#include <stdio.h>

void do_something() {
    fputs("testing A\n",stderr);
}

预加载的库:

#include <stdio.h>

int fputs(const char *str,FILE *file) {
    // Do nothing
    return 0;
}

当不使用预加载的库时,输出为:

testing A
testing B

使用时,输出什么都没有。

我正在寻找一种方法预加载的库只影响主可执行文件输出将是:

testing A

谢谢!

解决方法

您可以检查返回地址是否在可执行文件或库中,然后调用“真实”函数或执行您的存根代码,如下所示:

#define _GNU_SOURCE

#include <dlfcn.h>
#include <link.h>
#include <stdio.h>
#include <stdlib.h>

static struct {
    ElfW(Addr) start,end;
} *segments;
static int n;
static int (*real_fputs)(const char *,FILE *);

static int callback(struct dl_phdr_info *info,size_t size,void *data) {
    n = info->dlpi_phnum;
    segments = malloc(n * sizeof *segments);
    for(int i = 0; i < n; ++i) {
        segments[i].start = info->dlpi_addr + info->dlpi_phdr[i].p_vaddr;
        segments[i].end = info->dlpi_addr + info->dlpi_phdr[i].p_vaddr + info->dlpi_phdr[i].p_memsz;
    }
    return 1;
}

__attribute__((__constructor__))
static void setup(void) {
    real_fputs = dlsym(RTLD_NEXT,"fputs");
    dl_iterate_phdr(callback,NULL);
}

__attribute__((__destructor__))
static void teardown(void) {
    free(segments);
}

__attribute__((__noinline__))
int fputs(const char *str,FILE *file) {
    ElfW(Addr) addr = (ElfW(Addr))__builtin_extract_return_addr(__builtin_return_address(0));
    for(int i = 0; i < n; ++i) {
        if(addr >= segments[i].start && addr < segments[i].end) {
            // Do Nothing
            return 0;
        }
    }
    return real_fputs(str,file);
}

不过,这有一些警告。例如,如果您的可执行文件调用一个库函数,该函数对您正在挂钩的函数进行尾调用,那么这将错误地认为该库调用是一个可执行文件调用。 (您也可以通过为这些库函数添加包装器来缓解这个问题,即无条件地转发到“真实”函数,并使用 -fno-optimize-sibling-calls 编译包装器代码。)此外,无法区分匿名可执行内存(例如,JITted 代码)最初来自可执行文件或库。

要对此进行测试,请将我的代码保存为 hook_fputs.c,将您的主要可执行文件保存为 main.c,将您的共享库保存为 libfoo.c。然后运行这些命令:

clang -fPIC -shared hook_fputs.c -ldl -o hook_fputs.so
clang -fPIC -shared libfoo.c -o libfoo.so
clang main.c ./libfoo.so
LD_PRELOAD=./hook_fputs.so ./a.out
,

分别为两种情况实现插入库。

创建一个包装脚本或程序,使用 ldd 找出确切的 EGL 库版本及其目标二进制文件动态链接的路径;然后,在 GLFW 库上使用 ldd 来确定它是否与 EGL 链接。最后,让它在 LD_PRELOAD 环境变量中使用适当的插入库的路径执行目标二进制文件。