在将 XGETBV 的结果用于 XSETBV 之前,我是否应该屏蔽它们?


我正在尝试执行一些 UEFI 应用程序。

我发现此代码在 VirtualBox 上崩溃(test success 未打印,而 test start 已打印):

#include <stdint.h>

void* ConOut;
uint64_t (*OutputString)(void* protocol,void* string);

void printChar(int c) {
    unsigned char data[4] = { (unsigned char)c };
    if (c == '\n') printChar('\r');

void printString(const char* str) {
    while (*str != '\0') printChar((unsigned char)*(str++));

void entry(void* unused,uint64_t* table) {

    ConOut = (void*)table[8];
    OutputString = (uint64_t (*)(void*,void*))((uint64_t*)ConOut)[1];

    printString("waiting for breakpoint set...\n");
        volatile int j;
        for (j = 0; j < 1000000000; j++);

    printString("test start\n");

    __asm__ __volatile__ (
        /* marker for setting breakpoint */
        "cmp $0xdeadbeef,%%eax\n\t"
        /* turn on OSXSAVE */
        "mov %%cr4,%%rax\n\t"
        "or $0x40000,%%rax\n\t"
        "mov %%rax,%%cr4\n\t"
        /* read XCR[0] */
        "xor %%eax,%%eax\n\t"
        "xor %%edx,%%edx\n\t"
        "xor %%ecx,%%ecx\n\t"
        /* write XCR[0] */
    : : : "%eax","%ecx","%edx");
    printString("test success\n");

    for (;;) __asm__ __volatile__ ("cli\n\thlt\n\t");


C:\MyInstalledApps\TDM-GCC-64\bin\gcc -Wall -Wextra -nostdlib -e entry -m64 -Wl,--subsystem=10 minimum_test.c -o minimum_test.efi

从我的检查中,我发现 EDX:EAX 通过 00000000:0000001f 指令设置为 xgetbv 并且 xsetbv 导致 #GP(中断向量 13)故障查看价值。

奇怪的是,当我通过单步执行 VirtualBox 执行 xgetbv 指令时,它将 EDX:EAX 设置为 00000000:00000001,因此没有发生任何错误并打印 test success

参考 Intel® 64 and IA-32 Architectures Software Developer Manuals,我发现它是关于 XGETBV 的:

如果更少 超过 64 位在被读取的 XCR 中实现,返回到 EDX:EAX 的值在未实现的位定位中 未定义。

然后,关于 XSETBV:

如果当前权限级别不是 0。
如果在 ECX 中指定了无效的 XCR。
如果 EDX:EAX 中的值设置了 ECX 指定的 XCR 中保留的位。
如果试图清除 XCR0 的位 0。
如果尝试将 XCR0[2:1] 设置为 10b。

这种情况是根据 EDX:EAX 值设置保留位。由于从 XGETBV 返回的未实现位的值未定义,因此在将 XGETBV 的结果传递给 XSETBV 之前将其屏蔽似乎是合理的。 用于屏蔽的值可以通过 CPUID with EAX=0x0D,ECX=0 获得。 添加一些代码来应用屏蔽后,XSETBV 在 VirtualBox 上运行良好。

另一方面,Intel 手册中也有关于 XSETBV 的说明:

XCR 中的未定义或保留位应设置为值 以前读过。

这看起来应该将保留位设置为通过 XGETBV 获得的值,我不应该应用 maskimg 来强制这些位变为零。

作为结论,在将 XGETBV 的结果传递给 XSETBV 之前,我应该还是不应该通过 cpuID 获得的有效位来屏蔽 XGETBV 的结果?



  • Windows 10 家庭版 (x64)
  • Intel(R) Core(TM) i7-9750H cpu @ 2.60GHz 2.59GHz
  • 内存 16.0 GB
  • VirtualBox 6.1.18 r142142 (qt5.6.2)

来宾 (VM) 环境:

  • 操作系统:其他/未知(64 位)
  • 基本内存:128 MB
  • 芯片组:PIIX3
  • 启用 I/O APIC
  • EFI:已启用
  • 1 个 cpu
  • 加速:VT-x/AMD-V、嵌套分页、PAE/NX
  • 半虚拟化接口:


#include <stdint.h>

void* ConOut;
uint64_t (*OutputString)(void* protocol,data);

void printString(const char* str) {
    while (*str != '\0') printChar((unsigned char)*(str++));

void printInt(uint64_t value,int radix,int minDigits) {
    char vStr[128] = "";
    char* pStr = vStr + 120;
    int digits = 0;
    do {
        *(pStr--) = "0123456789ABCDEF"[value % radix];
        value /= radix;
    } while (value > 0 || digits < minDigits);
    printString(pStr + 1);

void stop(void) {
    __asm__ __volatile__(
        "jmp 1b\n\t"

void entry(void* unused,uint64_t* table) {
    uint32_t eax,ebx,ecx,edx,cs,cr0,xcr0_low,xcr0_high;
    uint32_t cpuid_max,eax_mask,edx_mask;
    unsigned char src_test[32],dst_test[32] = {0};
    int i;

    ConOut = (void*)table[8];
    OutputString = (uint64_t (*)(void*,void*))((uint64_t*)ConOut)[1];

    __asm__ __volatile__ (
        "xor %%eax,%%eax\n\t"
    : "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx));
    printString("cpuID.00H: EAX=0x"); printInt(eax,16,8);
    printString(",EBX=0x"); printInt(ebx,ECX=0x"); printInt(ecx,EDX=0x"); printInt(edx,8);
    if (eax < 1) {
        printString("cpuID.01H not supported!\n");
    cpuid_max = eax;

    __asm__ __volatile__ (
        "mov $1,"=d"(edx));
    printString("cpuID.01H: EAX=0x"); printInt(eax,8);
    if (!((ecx >> 26) & 1)) {
        printString("xsave (ECX[26]) not supported!\n");

    if (cpuid_max >= 0x0D) {
        __asm__ __volatile__ (
            "mov $0xd,%%eax\n\t"
            "xor %%ecx,%%ecx\n\t"
        : "=a"(eax),"=d"(edx));
        printString("cpuID.0DH: EAX=0x"); printInt(eax,8);
        eax_mask = eax;
        edx_mask = edx;
    } else {
        printString("cpuID.0DH not supported\n");
        eax_mask = UINT32_C(0xffffffff);
        edx_mask = UINT32_C(0xffffffff);

    __asm__ __volatile__ (
        "mov %%cs,%%ax\n\t"
        "movzwl %%ax,%0\n\t"
        "mov %%cr0,%%rax\n\t"
    : "=g"(cs),"=a"(cr0));
    printString("CPL check: CS=0x"); printInt(cs,4);
    printString(",CR0=0x"); printInt(cr0,8);
    if (!cr0 & 1) {
        printString("not in protected mode!\n");
    if ((cs & 3) != 0) {
        printString("CPL is not zero!\n");

    printString("waiting for breakpoint set...\n");
        volatile int j;
        for (j = 0; j < 1000000000; j++);

    printString("turning on OSXSAVE\n");
    __asm__ __volatile__ (
        /* turn on OSXSAVE */
        "mov %%cr4,%%cr4\n\t"
    : : : "%eax");

    __asm__ __volatile__ (
        /* marker for setting breakpoint */
        "cmp $0xdeadbeef,%%eax\n\t"
        /* read XCR[0] */
        "xor %%eax,%%ecx\n\t"
    : "=a"(xcr0_low),"=d"(xcr0_high) : : "%ecx","cc");
    printString("XCR[0] = ");
    printInt(xcr0_high,8); printChar(':');
    printInt(xcr0_low,8); printChar('\n');

    xcr0_low |= 6;

#if 0
    printString("applying mask\n");
    xcr0_low &= eax_mask;
    xcr0_high &= edx_mask;
    (void)eax_mask; (void)edx_mask;

    printString("new XCR[0] will be: ");
    printInt(xcr0_high,8); printChar('\n');

    printString("turning on AVX\n");
    __asm__ __volatile__ (
        /* marker for setting breakpoint */
        "cmp $0xdeadbeef,%%ecx\n\t"
        /* turn on AVX */
        "xor %%ecx,%%ecx\n\t"
    : : "a"(xcr0_low),"d"(xcr0_high) : "%ecx","cc");

    for (i = 0; i < 32; i++) src_test[i] = 123 * (i + 1);
    printString("testing AVX instruction\n");
    for (i = 0; i < 32; i++) {
        printChar((i + 1) % 16 == 0 ? '\n' : ' ');
    printString("dest before:\n");
    for (i = 0; i < 32; i++) {
        printChar((i + 1) % 16 == 0 ? '\n' : ' ');
    __asm__ __volatile__ (
        "vmovups (%0),%%ymm0\n\t"
        "vmovups %%ymm0,(%1)\n\t"
    : : "r"(src_test),"r"(dst_test));
    printString("dest after:\n");
    for (i = 0; i < 32; i++) {
        printChar((i + 1) % 16 == 0 ? '\n' : ' ');

    printString("test done.\n");


cpuID.00H: EAX=0x00000016,EBX=0x756E6547,ECX=0x6C65746E,EDX=0x49656E69
cpuID.01H: EAX=0x000906ED,EBX=0x00010800,ECX=0x56DA220B,EDX=0x178BFBFF
cpuID.0DH: EAX=0x00000007,EBX=0x00000340,EDX=0x00000340,EDX=0x00000000
CPL check: CS=0x0038,CR0=0xC0010033
waiting for breakpoint set...
turning on OSXSAVE
XCR[0] = 00000000:0000001F
new XCR[0] will be: 00000000:0000001F
turning on AVX


cpuID.00H: EAX=0x00000016,EBX=0x00100800,ECX=0x77FAFBBF,EDX=0xBFEBFBFF
cpuID.0DH: EAX=0x0000001F,EBX=0x00000240,ECX=0x00000440,CR0=0x80000013
waiting for breakpoint set...
turning on OSXSAVE
XCR[0] = 00000000:00000001
new XCR[0] will be: 00000000:00000007
turning on AVX
testing AVX instruction
7B F6 71 EC 67 E2 5D D8 53 CE 49 C4 3F BA 35 B0
2B A6 21 9C 17 92 0D 88 03 7E F9 74 EF 6A E5 60
dest before:
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
dest after:
7B F6 71 EC 67 E2 5D D8 53 CE 49 C4 3F BA 35 B0
2B A6 21 9C 17 92 0D 88 03 7E F9 74 EF 6A E5 60
test done.




