虚拟文件系统如何处理读取和写入等系统调用?

问题描述

(所有代码片段均取自:https://docs.huihoo.com/doxygen/linux/kernel/3.7/dir_97b3d2b63ac216821c2d7a22ee0ab2b0.html

嗨!为了确定我的问题,我一直在研究 Linux fs 代码一个月来进行研究,但我被困在这里。所以我在 include/linux/fs.h 中查看这段代码(如果我没记错的话,它包含了 read_write.copen.c代码使用的几乎所有主要结构和指针的定义),我观察到了这一点代码片段:

struct file_operations {
 1519     struct module *owner;
 1520     loff_t (*llseek) (struct file *,loff_t,int);
 1521     ssize_t (*read) (struct file *,char __user *,size_t,loff_t *);
 1522     ssize_t (*write) (struct file *,const char __user *,loff_t *);
 1523     ssize_t (*aio_read) (struct kiocb *,const struct iovec *,unsigned long,loff_t);
 1524     ssize_t (*aio_write) (struct kiocb *,loff_t);
 1525     int (*readdir) (struct file *,void *,filldir_t);
 1526     unsigned int (*poll) (struct file *,struct poll_table_struct *);
 1527     long (*unlocked_ioctl) (struct file *,unsigned int,unsigned long);
 1528     long (*compat_ioctl) (struct file *,unsigned long);
 1529     int (*mmap) (struct file *,struct vm_area_struct *);
 1530     int (*open) (struct inode *,struct file *);
 1531     int (*flush) (struct file *,fl_owner_t id);
 1532     int (*release) (struct inode *,struct file *);
 1533     int (*fsync) (struct file *,int datasync);
 1534     int (*aio_fsync) (struct kiocb *,int datasync);
 1535     int (*fasync) (int,struct file *,int);
 1536     int (*lock) (struct file *,int,struct file_lock *);
 1537     ssize_t (*sendpage) (struct file *,struct page *,loff_t *,int);
 1538     unsigned long (*get_unmapped_area)(struct file *,unsigned long);
 1539     int (*check_flags)(int);
 1540     int (*flock) (struct file *,struct file_lock *);
 1541     ssize_t (*splice_write)(struct pipe_inode_info *,unsigned int);
 1542     ssize_t (*splice_read)(struct file *,struct pipe_inode_info *,unsigned int);
 1543     int (*setlease)(struct file *,long,struct file_lock **);
 1544     long (*fallocate)(struct file *file,int mode,loff_t offset,1545               loff_t len);
 1546 };

在这里,您可以看到他们定义了这些非常具体的系统调用,这些系统调用已在各自的文件中声明。例如,read_write.c 将读取和写入系统调用的定义分别定义为 SYSCALL_DEFINE3(read,fd,buf,count)SYSCALL_DEFINE3(write,count)。现在出于研究目的,我基本上进入了这两个定义并追查了每个函数调用(至少那些在 Doxygen 文档中链接函数调用)发生在每个函数内部,以及这些函数调用中的函数调用但无法回答一个非常简单的问题。 这两个系统调用如何调用虚拟文件系统以进一步调用文件系统读取实际数据块所需的驱动程序? (如果它是特定于文件系统的,那么请在代码中向我显示它将它交给 FS 驱动程序的位置)

附言我对打开的系统调用做了同样的搜索,但能够找到他们调用 namei.c 代码的一部分来专门执行该任务的位置:struct file *do_filp_open(int dfd,struct filename *pathname,const struct open_flags *op,int flags)在这里,他们使用具有来自 inode 的相关信息的结构 nameidata 来打开文件

解决方法

Linux 中的内核文件系统

在 Linux 中,内核文件系统以模块化方式实现。例如,每个 struct inode 都包含一个指向 struct file_operations 的指针,它与您在问题中复制的结构相同。该结构体包含用于各种文件操作的函数指针。

例如,成员 ssize_t (*read) (struct file *,char __user *,size_t,loff_t *); 是一个函数指针,指向一个以 struct file *char *size_tloff_t * 作为参数的函数,并返回 ssize_t

将系统调用路由到底层文件系统

当read系统调用发生时,内核VFS代码找到对应的inode,然后调用struct file_operations中指定的文件系统的read函数。这是 read 系统调用的跟踪:

  1. 调用 read() syscall handler
  2. 调用 ksys_read(),
  3. 调用 vfs_read()

这就是 vfs_read() 的神奇之处:

if (file->f_op->read)
    ret = file->f_op->read(file,buf,count,pos);
else if (file->f_op->read_iter)
    ret = new_sync_read(file,pos);
else
    ret = -EINVAL;

一个相关的结构体 struct file 也包含一个指向 struct file_operations 的指针。上面的 if 条件检查此文件是否有 read() 处理程序,如果存在则调用它。如果 read() 处理程序不存在,它会检查 read_iter 处理程序。如果两者都不存在,则返回 -EINVAL

示例:ext4

在 ext4 中,struct file_operations 被定义为 here。它在多个地方使用,但与 inode here 相关联。 ext4 定义了一个 read_iter 处理程序(即 ext4_file_read_iter),但不是一个 read 处理程序。因此,当对 ext4 文件调用 read(2) 时,最终会调用 ext4_file_read_iter()

此时,我们已经了解了文件系统特定的代码。从这里可以进一步探索 ext4 如何管理块。

,

我建议使用 ftrace 找出完整的代码库。它提供了内核中所有的函数调用跟踪。

https://lwn.net/Articles/370423/