在汇编 x86 实模式中寻址如何工作?为什么标签返回不同的值?

问题描述

我有两种引导加载程序代码变体(它应该在引导加载程序代码的 512b 之后移动 1kb 堆栈)。 起始物理地址始终为 0x7c00(标签“开始”)。 BIOS 在 RAM 中复制引导加载程序代码。 当我使用“MOV SP,开始+1024+512”时:

  1. SP 将是 0x7c00 + 1024 + 512,因为物理地址应该是 SS:SP = 0
  2. SP 将是 0 + 1024 + 512,因为物理地址应该是 SS:SP = 0x07c0

但是如果我写“jmp start”,处理器将始终转到地址 0x7c00。它会计算

  1. 0 + 0x07c0
  2. 0x07c0

为什么 MOVLMP 中的“start”返回不同的值?或者它会是一样的,但是在 MOV 处理器中不添加段,而在 JMP添加在这种情况下,“开始”是否将根据 DS:SI 而不是 CS:IP 计算? 另一个例子。如果我最后添加代码

mov SI,main
lodsb ;write data from main to AL

处理器将始终访问完整的物理地址段+偏移量,并在寄存器 AL获取值“S”。 SI 将仅等于偏移量?并且处理器会在 lodsb 执行过程中添加段?

额外问题:

处理器如何执行“jmp main”?该指令位于“mov ds,ax”之上。因此 2 变体中的代码错误,但它可以工作。

BIOS加载bootloader时CS寄存器的认值是多少?显然 CS:IP 应该是 0x7c00。

1 个变体

[bits 16]
[org 0x7c00]
start:  ;offset= 0x7c00
jmp main
db    "Some data" ;actually fake BIOS Parameter Block(BPB)
main: 
mov ax,0 
mov ds,ax ; data segment =0.
mov ss,ax ; stack segment = 0
mov sp,start+1024+512 ;stack pointer = 0x7c00+1024+512

2 变体

[bits 16]
[org 0x0000]
start:  ;offset= 0x0000
jmp main
db    "Some data" ;actually fake BIOS Parameter Block(BPB) 
main:
mov ax,0x07c0 
mov ds,ax ; data segment =0x07c0.
mov ss,ax ; stack segment =0x07c0.
mov sp,start+1024+512 ;stack pointer = 0+1024+512

解决方法

... 总是转到地址 0x7c00。它将计算...

在分段内存模型中,您不仅应该考虑有效(物理)地址,还必须始终将地址视为实模式或 16 位保护模式下的 (16+16) 位值或32 位保护模式下的 (16+32) 位值。

假设您的程序包含指令 mov al,cs:[100h]

该指令将从地址​​ CS:0x100 中读取一些字节,实际上是 (CS<<4)+0x100

如果跳转到0x7C0:0,这条指令将访问地址为(0x7C0<<4)+0x100=0x7D00的内存;如果执行跳转到 0:0x7C00,该指令将访问地址为 (0<<4)+0x100=0x100 的内存。

这意味着如果您跳转到 0x7C0:00:0x7C00,您的程序会执行不同的操作。因此,据说 0x7C0:00:0x7C00 是两个不同的地址。

假设 main 位于物理地址 0x7C40

这意味着main的地址既不是0x7C40也不是0x40,而是0:0x7C40(在“变体1”中)或者是{{1 }}(在“变体 2”中),因为您始终必须将地址指定为段和偏移量对。

在保护模式下的分段内存模型中,这更加复杂,使用正确的段更为重要!

SI 将仅等于偏移量?
另外,在这种情况下,“开始”是否会根据 DS:SI 而不是 CS:IP 计算?

0x7C0:0x40 指令访问地址 lodsbDS:SI 访问 stosb

这意味着 ES:DI 只保存偏移量,SI 只保存段。

变体 1 和 2 将向 DS 寄存器加载不同的值,因为 SI 在一个变体中位于地址 main(这意味着:0:0x7C40)并且在另一个变体中的 SI=0x7C40 (0x7C0:0x40)。

因此,在变体 1 中,您必须设置 SI=0x40,在变体 2 中,您必须设置 DS=0

在一种情况下,DS=0x7C0 将访问地址 lodsb,在另一种情况下,0:0x7C40 将访问地址 lodsb。在这两种情况下,访问 RAM 中的相同字节:物理地址 0x7C0:0x40

处理器如何执行“jmp main”?该指令位于“mov ds,ax”之上。因此 2 变体中的代码有错误,但它可以工作。

0x7C40 指令有两种变体:

一种变体不会将固定值写入 JMP 寄存器,而是向 IP 寄存器添加一些常量值。因此,如果将 IP 添加到 0x40,代码会在 0x7C0:0 处继续执行。如果将 0x7C0:0x40 添加到 0x40,代码会在 0:0x7C00 处继续执行。在这两种情况下,下一条指令都位于物理地址 0:0x7C40。 (可能,0x7C40 就是这种变体。)

另一个变体将一对段和偏移量作为参数。您不能跳转到地址 jmp main,但您可以跳转到地址 0x7C40 或地址 0:0x7C40

BIOS加载bootloader时CS寄存器的默认值是多少?

有一些 BIOS 会跳转到 0x7C0:0x40,但标准似乎是 0x7C0:0

出于这个原因,许多引导加载程序执行跳转到 0:0x7C00(例如)以确保 0x7C0:0x60 寄存器具有定义的值。