强制相对RIP寻址?

问题描述

有什么方法可以强制编译器或汇编器仅生成相对于RIP的寻址代码

我正在尝试找到一种方法,以提供从常规编程模型到图灵完整的抽象计算模型的映射。

解决方法

这似乎与您在评论中的讨论有关
Is C actually Turing-complete?在cs.SE上(在您发布此信息之前,我刚好看到它)。

请注意,相对于PC的寻址无法帮助您实现无限存储。所需的数据大小可以是无限制的,大于代码的大小,因此PC相对寻址的偏移量部分应为无限制的大小。 (它通常仅可用于静态存储。)

我以为您建议使用的指针是相对于其自身地址(而不是代码)的,对于x86-64之类的传统ISA仍然需要无限制的寄存器宽度,因此您最好只使用{{3} }抽象的计算模型。 x86-64需要一个寄存器中的整个绝对地址,或至少2个部分之和等于绝对地址。 ([base + idx*scale],其中scale是2位左移)。 add rdi,[rdi]向指针添加了指向偏移量(如C ptr += *ptr),但仍然需要结果适合寄存器。


如果您要阻止编译器对静态数据使用绝对内存寻址,那么可以,很简单,请使用gcc -fPIE-fPIC

但是,如果您的意思是仅使用 [rip + rel32]寻址,则永远不要使用[reg][base + idx*scale + disp0/8/32]的任何常规[RIP + rel32]替代集,{no ,当然不适用于实际的编译器。 RIP相对寻址只能访问静态存储,因此将自己限制在那将意味着没有堆栈空间和指针。 x86-64唯一的RIP相对寻址模式是[rip + rel32],其中rel32是嵌入在机器代码中的常量,而不是寄存器值。

(也许您可以使用自我修改的代码来修改RIP + rel32寻址模式的rel32,但是没有主流的编译器会这样做。不清楚如何管理堆栈空间的重入性仅包含您要修改的函数的机器代码的一个副本,但是也许将正确的数据保留在堆栈空间中将使您可以恢复调用者的rel32偏移量。

在手写asm中,您当然可以做任何您想做的事,但是限制自己重写rel32位移会使它(严格吗?)不如普通x86-64强大,而不是图灵完整。


如果您正在寻找诸如[PC + other_register]之类的寻址模式,我认为32位ARM可以做到这一点。它具有索引寻址,程序计数器可作为16个通用寄存器之一访问(与AArch64不同)。这样一来,您就可以对静态数组进行PC相对索引。再次强调,这并不是明显的帮助。对于固定PC上的任何给定指令以寻址任意数量的存储单元,“其他寄存器”必须具有无限的宽度。


图灵无限制C:

我认为这是不可能的,除非您松开语言以消除以下事实:每种类型(包括指针)都有预先确定的固定宽度,而不取决于要处理的输入大小。

图灵完备的C实现可以无限次地在循环中调用malloc,例如,用fgets读取输入行,并在到达每一行时将它们加到带有标准递归方法。使用基于C指针的标准节点布局:
struct node { struct node *left,*right; const char *str; };。然后稍后遍历该树并以排序的顺序输出行。

要使树生效,任何现有节点都必须能够指向新分配的注释。据我所知,相对于段的寻址并没有使您更接近于此。这个二叉树示例可能是对无界C的一个很好的石蕊测试,其中包括指向其他​​对象的指针,其排列取决于输入。


您在评论中描述的内容似乎是在x86 asm中编写UTM状态机的本地部分,每个状态都有自己的2GiB内存空间,并且能够向前或向后跳到下一个状态。没有真正的随机访问或真正的指针的明确方法,只有在一种状态的代码内。

为UTM的每个步骤使用有限的C实现并不能为您提供整体的图灵完整的 C实现,它为您提供了一种带状非随机访问的Turing机器,当您的问题规模超出了您在一个“州”或“存储库”或您所谓的内部所做的一切。