问题描述
我使用的是 x86 MASM32 汇编器。代码开始时,BX 的地址总是 078BH。这种情况的原因是什么?否则,会出现“编写生成8B07H机器码的汇编代码”之类的问题。我猜这个问题可以像“MOV AX,[BX]”那样解决,但 [BX] 是 078BH,不是 8B07H。
解决方法
你的问题比较混乱,所以我不确定我是否理解正确。
MOV AX,[BX]
实际上是做什么的?
指令...
- ... 将
BX
寄存器的值与DS
寄存器指定的段的基地址相加
如何从DS
寄存器计算基地址取决于 CPU 的操作模式(“实模式”或“保护模式”)。 - ... 从该总和表示的地址处的内存读取一个字节
- ... 将该字节写入
AX
的低字节(这意味着:AL
) - ... 从内存中读取下一个字节
- ... 将该字节写入
AX
的高字节(这意味着:AH
)
假设 BX
包含值 456h
,DS
指定的段具有基地址 23000h
。那么地址是23000h+456h
= 23456h
。假设地址 23456h
处的内存包含值 0CDh
,地址 23457h
处的内存包含值 0ABh
,那么 AX
将包含值 {{ 1}} 操作后。
代码开始时,BX的地址总是078BH。造成这种情况的原因是什么?
我不知道 emu8086。
在真实计算机上,寄存器的值取决于计算机的操作系统。在我的 Ubuntu Linux 版本下,程序启动时 0ABCDh
的值为 0。
否则,会出现类似“编写生成BX
机器码的汇编代码”之类的问题。我猜这个问题的答案是 8B07H
但 MOV AX,[BX]
是 [BX]
,不是 078BH
。
8B07H
是一个 16 位的数字,但 x86 系统的内存是以字节(8 位为单位)组织的。所以第一个问题是:在这种情况下 8B07H
是什么意思?
这可能意味着第一个字节应为 8B07H
,第二个字节应为 08Bh
。
在这种情况下,指令 07h
将完成这项工作,而不是 MOV [AX],BX
:
这条指令或多或少与MOV AX,[BX]
相反:它将数据写入内存。这一次,寄存器MOV AX,[BX]
中的数据被写入寄存器BX
和DS
指定的内存中。
因为在 x86 系统上,某些数据的低字节存储在第一个字节中,而高字节存储在第二个字节中,因此值 AX
将存储为两个字节:1234h
第一个字节和第二个字节中的 34h
。
12h
也是如此:78Bh
存储在第一个字节中,8Bh
存储在第二个字节中。
编辑
问题是“编写生成8B07H值的汇编代码。”。
...
我在互联网上搜索了这个问题,解决的是 07h
。
在 RAM 内存中,您只能存储数字。要存储字母“A”,则存储数字 65(例如)。
汇编器指令也以数字形式存储。
指令MOV AX,[BX]
被存储为两个数字MOV AX,[BX]
和8Bh
。不过……
所以,在汇编程序执行后,最终应该在一个寄存器(AX、BX 等)中生成 8B07H 值。
...这与程序正在做什么无关:
指令被存储为07h
和8Bh
,就像Java程序中的单词07h
存储为字母 main
、m
、a
和 i
。
这意味着内存已经包含值 n
和 8Bh
在程序启动之前。
出现这种情况的原因是什么?
新 CPU 类型的每个发明者都必须定义数字的含义。对于 16 位模式的 ARM CPU(这是新的 Apple PC 或 Raspberry Pi 使用的),07h
和 8Bh
表示 07h
,这与 {{1} 完全不同}}。
您必须查看相应 CPU 的文档才能了解 lsls r3,r1,#30
和 mov ax,[bx]
的确切含义。
在 Intel 8086 文档中,您会找到一个包含以下行的表格(第 4-31 页):
8Bh
值 07h
是 1st byte |2nd byte |more bytes|meaning
---------+-----------+----------+---------------
... | ... | ... | ...
8B |mod reg r/m| disp | MOV reg16,r/m
... | ... | ... | ...
(二进制)。这是第二个字节 (07h
),因此您可以查找其他一些表(在 8086 文档中,这些表位于第 4-20 页):
00 000 111
和 mod reg r/m
的组合意味着:mod=00
= r/m=111
r/m
表示:[BX]
= reg=000
所以指令 reg16
,AX
是 8Bh
。