问题描述
我正在尝试设计一个 LLVM IR pass,它从 LLVM IR 获取一些信息(特别是:IR 调用指令中使用的类型),并以某种方式将此 IR 级分析与二进制级地址相关联。例如,我想知道 call
指令(在最终二进制文件中的某个地址处)正在调用具有特定类型签名的函数。
一些观察:
- 显而易见的问题是,当 IR 通行证运行时,最终地址尚不可用。
- 虽然 IR 指令不会 1:1 映射到机器指令,但假设 IR 中的
call
将映射到机器代码中的call
应该是相对安全的。 - 可以反汇编二进制文件,查看被调用的函数,并获取其类型。但是,这不适用于间接调用指令(这就是我尝试在 IR 中执行此操作的原因)。
在 this comment 中,针对类似问题的建议方法是“注入 [] 一些您稍后可以在可执行文件中发现的元数据”。但是,我找不到有关如何使元数据在二进制文件中存活的任何信息。
解决方法
您可以使用调试位置(这是一种元数据)将 IR 调用与最终调用联系起来。如果您确保 IR 中的每个调用都有一个文件名、行和列,那么这个 hack 应该是可能的。我敢肯定,存在更清洁的解决方案。