问题描述
我正在开发一个驱动程序,其中设备内存范围映射到用户空间(通过 IOCTL)以供应用程序写入。它有效:
vma->vm_flags |= VM_DONTcopY;
vma->vm_flags |= VM_DONTEXPAND;
down_write(¤t->mm->mmap_sem);
ret = vm_iomap_memory(vma,from,sz_required);
up_write(¤t->mm->mmap_sem);
其中 from
是从 pci_resource_start()
获得的物理地址,其中添加了一些偏移量。
应用程序也需要从设备读取,所以我将应用程序映射的区域的大小增加PAGE_SIZE
,用dma_alloc_coherent()
分配一个页面,并尝试将其插入到末尾vma 但返回 EBUSY。我做错了什么?我应该能够将多个物理范围拼接到一个 vma 中,包括实内存和设备映射,还是不支持?
在新代码中,页面是这样分配的,dma_addr
被传递给设备,因此它知道写到哪里:
dma = dma_alloc_coherent(&device,PAGE_SIZE,&dma_addr,GFP_KERNEL);
memset(dma,0xfe,PAGE_SIZE);
set_memory_wb((unsigned long)dma,1);
并将映射代码改为:
vma->vm_flags |= VM_DONTcopY;
vma->vm_flags |= VM_DONTEXPAND;
vma->vm_flags |= VM_MIXEDMAP;
down_write(¤t->mm->mmap_sem);
ret = vm_iomap_memory(vma,sz_required);
up_write(¤t->mm->mmap_sem);
down_write(¤t->mm->mmap_sem);
ret = vm_insert_page(vma,vma->vm_end - PAGE_SIZE,virt_to_page(dma));
up_write(¤t->mm->mmap_sem);
内核在 x86_64 上为 4.15
解决方法
按照 Map multiple kernel buffer into contiguous userspace buffer?
中的“hack”操作使其正常工作在 vm_iomap_memory()
之前,我将 vma->vm_end
递减 PAGE_SIZE
并在之后恢复旧值。此外,我从 dma_alloc_coherent()
切换到 alloc_page()
跟随 dma_map_page()
虽然不是我满意的解决方案。必须有更好的方法,也许是 vm_ops
中的故障处理程序?尽管考虑到我确切地知道我将要映射的内容和位置,这似乎适得其反。
它似乎适用于 x86_64 和 aarch64