问题描述
(所有代码片段均取自:https://docs.huihoo.com/doxygen/linux/kernel/3.7/dir_97b3d2b63ac216821c2d7a22ee0ab2b0.html)
嗨!为了确定我的问题,我一直在研究 Linux fs 代码近一个月来进行研究,但我被困在这里。所以我在 include/linux/fs.h
中查看这段代码(如果我没记错的话,它包含了 read_write.c
和 open.c
等代码使用的几乎所有主要结构和指针的定义),我观察到了这一点代码片段:
struct file_operations {
1519 struct module *owner;
1520 loff_t (*llseek) (struct file *,loff_t,int);
1521 ssize_t (*read) (struct file *,char __user *,size_t,loff_t *);
1522 ssize_t (*write) (struct file *,const char __user *,loff_t *);
1523 ssize_t (*aio_read) (struct kiocb *,const struct iovec *,unsigned long,loff_t);
1524 ssize_t (*aio_write) (struct kiocb *,loff_t);
1525 int (*readdir) (struct file *,void *,filldir_t);
1526 unsigned int (*poll) (struct file *,struct poll_table_struct *);
1527 long (*unlocked_ioctl) (struct file *,unsigned int,unsigned long);
1528 long (*compat_ioctl) (struct file *,unsigned long);
1529 int (*mmap) (struct file *,struct vm_area_struct *);
1530 int (*open) (struct inode *,struct file *);
1531 int (*flush) (struct file *,fl_owner_t id);
1532 int (*release) (struct inode *,struct file *);
1533 int (*fsync) (struct file *,int datasync);
1534 int (*aio_fsync) (struct kiocb *,int datasync);
1535 int (*fasync) (int,struct file *,int);
1536 int (*lock) (struct file *,int,struct file_lock *);
1537 ssize_t (*sendpage) (struct file *,struct page *,loff_t *,int);
1538 unsigned long (*get_unmapped_area)(struct file *,unsigned long);
1539 int (*check_flags)(int);
1540 int (*flock) (struct file *,struct file_lock *);
1541 ssize_t (*splice_write)(struct pipe_inode_info *,unsigned int);
1542 ssize_t (*splice_read)(struct file *,struct pipe_inode_info *,unsigned int);
1543 int (*setlease)(struct file *,long,struct file_lock **);
1544 long (*fallocate)(struct file *file,int mode,loff_t offset,1545 loff_t len);
1546 };
在这里,您可以看到他们定义了这些非常具体的系统调用,这些系统调用已在各自的文件中声明。例如,read_write.c 将读取和写入系统调用的定义分别定义为 SYSCALL_DEFINE3(read,fd,buf,count)
和 SYSCALL_DEFINE3(write,count)
。现在出于研究目的,我基本上进入了这两个定义并追查了每个函数调用(至少那些在 Doxygen 文档中链接的函数调用)发生在每个函数内部,以及这些函数调用中的函数调用但无法回答一个非常简单的问题。 这两个系统调用如何调用虚拟文件系统以进一步调用从文件系统读取实际数据块所需的驱动程序? (如果它是特定于文件系统的,那么请在代码中向我显示它将它交给 FS 驱动程序的位置)
附言我对打开的系统调用做了同样的搜索,但能够找到他们调用 namei.c
代码的一部分来专门执行该任务的位置:struct file *do_filp_open(int dfd,struct filename *pathname,const struct open_flags *op,int flags)
。在这里,他们使用具有来自 inode 的相关信息的结构 nameidata 来打开文件。
解决方法
Linux 中的内核文件系统
在 Linux 中,内核文件系统以模块化方式实现。例如,每个 struct inode
都包含一个指向 struct file_operations
的指针,它与您在问题中复制的结构相同。该结构体包含用于各种文件操作的函数指针。
例如,成员 ssize_t (*read) (struct file *,char __user *,size_t,loff_t *);
是一个函数指针,指向一个以 struct file *
、char *
、size_t
和 loff_t *
作为参数的函数,并返回 ssize_t
。
将系统调用路由到底层文件系统
当read系统调用发生时,内核VFS代码找到对应的inode
,然后调用struct file_operations
中指定的文件系统的read函数。这是 read 系统调用的跟踪:
- 调用
read()
syscall handler, - 调用
ksys_read()
, - 调用
vfs_read()
。
这就是 vfs_read()
的神奇之处:
if (file->f_op->read)
ret = file->f_op->read(file,buf,count,pos);
else if (file->f_op->read_iter)
ret = new_sync_read(file,pos);
else
ret = -EINVAL;
一个相关的结构体 struct file
也包含一个指向 struct file_operations
的指针。上面的 if 条件检查此文件是否有 read()
处理程序,如果存在则调用它。如果 read()
处理程序不存在,它会检查 read_iter
处理程序。如果两者都不存在,则返回 -EINVAL
。
示例:ext4
在 ext4 中,struct file_operations
被定义为 here。它在多个地方使用,但与 inode here 相关联。 ext4 定义了一个 read_iter
处理程序(即 ext4_file_read_iter
),但不是一个 read
处理程序。因此,当对 ext4 文件调用 read(2)
时,最终会调用 ext4_file_read_iter()
。
此时,我们已经了解了文件系统特定的代码。从这里可以进一步探索 ext4 如何管理块。
,我建议使用 ftrace 找出完整的代码库。它提供了内核中所有的函数调用跟踪。