跳转至

Lab7: VFS & FAT32 文件系统

本实验中不涉及 fork 的实现和缺页异常,只需要完成 Lab4 即可开始本实验。

实验目的

  • 为用户态的 Shell 提供 readwrite syscall 的实现(完成该部分的所有实现方得 60 分)。
  • 实现 FAT32 文件系统的基本功能,并对其中的文件进行读写(完成该部分的所有实现方得 40 分)。

实验环境

与先前的实验中使用的环境相同。

背景知识

VFS

虚拟文件系统(VFS)或虚拟文件系统交换机是位于更具体的文件系统之上的抽象层。VFS的目的是允许客户端应用程序以统一的方式访问不同类型的具体文件系统。例如,可以使用VFS透明地访问本地和网络存储设备,而客户机应用程序不会注意到其中的差异。它可以用来弥合Windows、经典Mac OS/macOS和Unix文件系统之间的差异,这样应用程序就可以访问这些类型的本地文件系统上的文件,而不必知道它们正在访问什么类型的文件系统。

VFS指定内核和具体文件系统之间的接口(或“协议”)。因此,只需完成协议,就可以很容易地向内核添加对新文件系统类型的支持。协议可能会随着版本的不同而不兼容地改变,这将需要重新编译具体的文件系统支持,并且可能在重新编译之前进行修改,以允许它与新版本的操作系统一起工作;或者操作系统的供应商可能只对协议进行向后兼容的更改,以便为操作系统的给定版本构建的具体文件系统支持将与操作系统的未来版本一起工作。

VirtIO

Virtio 是一个开放标准,它定义了一种协议,用于不同类型的驱动程序和设备之间的通信。在 QEMU 上我们可以基于 VirtIO 使用许多模拟出来的外部设备,在本次实验中我们使用 VirtIO 模拟存储设备,并在其上构建文件系统。

MBR

主引导记录(英语:Master Boot Record,缩写:MBR),又叫做主引导扇区,是计算机开机后访问硬盘时所必须要读取的首个扇区,它在硬盘上位于第一个扇区。在深入讨论主引导扇区内部结构的时候,有时也将其开头的446字节内容特指为“主引导记录”(MBR),其后是4个16字节的“磁盘分区表”(DPT),以及2字节的结束标志(55AA)。因此,在使用“主引导记录”(MBR)这个术语的时候,需要根据具体情况判断其到底是指整个主引导扇区,还是主引导扇区的前446字节。

FAT32

文件分配表(File Allocation Table,首字母缩略字:FAT),是一种由微软发明并拥有部分专利的文件系统,供MS-DOS使用,也是所有非NT核心的Windows系统使用的文件系统。最早的 FAT 文件系统直接使用扇区号来作为存储的索引,但是这样做的缺点是显然易见的:当磁盘的大小不断扩大,存储扇区号的位数越来越多,越发占用存储空间。以 32 位扇区号的文件系统为例,如果磁盘的扇区大小为 512B,那么文件系统能支持的最大磁盘大小仅为 2TB。

所以在 FAT32 中引入的新的存储管理单位“簇”,一个簇包含一个或多个扇区,文件系统中记录的索引不再为扇区号,而是 簇号 ,以此来支持更大的存储设备。你可以参考这些资料来学习 FAT32 文件系统的标准与实现:

实验步骤

Shell: 与内核进行交互

我们为大家提供了 nish 来与我们在实验中完成的 kernel 进行交互。nish (Not Implemented SHell) 提供了简单的用户交互和文件读写功能,有如下的命令。

echo [string] # 将 string 输出到 stdout
cat  [path]   # 将路径为 path 的文件的内容输出到 stdout
edit [path] [offset] [string] # 将路径为 path 的文件,
            # 偏移量为 offset 的部分开始,写为 string

同步 os23fall-stu 中的 user 文件夹,替换原有的用户态程序为 nish。为了能够正确启动 QEMU,需要下载磁盘镜像并放置在项目目录下。

lab7
├── Makefile
├── disk.img
├── arch
│   └── riscv
│       ├── Makefile
│       └── include
│          └── sbi.h
├── fs
│   ├── Makefile
│   ├── fat32.c
│   ├── fs.S
│   ├── mbr.c
│   ├── vfs.c
│   └── virtio.c
├── include
│   ├── fat32.h
│   ├── fs.h
│   ├── mbr.h
│   ├── string.h
│   ├── debug.h
│   └── virtio.h
├── lib
│   └── string.c
└── user
    ├── Makefile
    ├── forktest.c
    ├── link.lds
    ├── printf.c
    ├── ramdisk.S
    ├── shell.c
    ├── start.S
    ├── stddef.h
    ├── stdio.h
    ├── string.h
    ├── syscall.h
    ├── unistd.c
    └── unistd.h

此外,可能还要向 include/types.h 中补充一些类型别名

typedef unsigned long uint64_t;
typedef long int64_t;
typedef unsigned int uint32_t;
typedef int int32_t;
typedef unsigned short uint16_t;
typedef short int16_t;
typedef uint64_t* pagetable_t;
typedef char int8_t;
typedef unsigned char uint8_t;
typedef uint64_t size_t;

完成这一步后,可能你还需要调整一部分头文件引用和 Makefile,以让项目能够成功编译并运行。

我们在启动一个用户态程序时默认打开了三个文件,stdinstdoutstderr,他们对应的 file descriptor 分别为 012。在 nish 启动时,会首先向 stdoutstderr 分别写入一段内容,用户态的代码如下所示。

// user/shell.c

write(1, "hello, stdout!\n", 15);
write(2, "hello, stderr!\n", 15);

处理 stdout 的写入

我们在用户态已经像上面这样实现好了 write 函数来向内核发起 syscall,我们先在内核态完成真实的写入过程,也即将写入的字符输出到串口。

// arch/riscv/include/syscall.h

int64_t sys_write(unsigned int fd, const char* buf, uint64_t count);

// arch/riscv/include/syscall.c

void trap_handler(uint64_t scause, uint64_t sepc, struct pt_regs *regs) {
    ...
    if (scause == 0x8) { // syscalls
        uint64_t sys_call_num = regs->a7;
        ...
        if (sys_call_num == SYS_WRITE) {
            regs->a0 = sys_write(regs->a0, (const char*)(regs->a1), regs->a2);
            regs->sepc = regs->sepc + 4;
        } else {
            printk("Unhandled Syscall: 0x%lx\n", regs->a7);
            while (1);
        }
    }
    ...
}

注意到我们使用的是 fd 来索引打开的文件,所以在该进程的内核态需要维护当前进程打开的文件,将这些文件的信息储存在一个表中,并在 task_struct 中指向这个表。

// include/fs.h

struct file {
    uint32_t opened;
    uint32_t perms;
    int64_t cfo;
    uint32_t fs_type;

    union {
        struct fat32_file fat32_file;
    };

    int64_t (*lseek) (struct file* file, int64_t offset, uint64_t whence);
    int64_t (*write) (struct file* file, const void* buf, uint64_t len);
    int64_t (*read)  (struct file* file, void* buf, uint64_t len);

    char path[MAX_PATH_LENGTH];
};

// arch/riscv/include/proc.h

struct task_struct {
    ...
    struct file *files;
    ...
};

首先要做的是在创建进程时为进程初始化文件,当初始化进程时,先完成打开的文件的列表的初始化,这里我们的方式是直接分配一个页,并用 files 指向这个页。

// fs/vfs.c
int64_t stdout_write(struct file* file, const void* buf, uint64_t len);
int64_t stderr_write(struct file* file, const void* buf, uint64_t len);
int64_t stdin_read(struct file* file, void* buf, uint64_t len);

struct file* file_init() {
    struct file *ret = (struct file*)alloc_page();

    // stdin
    ret[0].opened = 1;
    ...

    // stdout
    ret[1].opened = 1;
    ret[1].perms = FILE_WRITABLE;
    ret[1].cfo = 0;
    ret[1].lseek = NULL;
    ret[1].write = /* todo */;
    ret[1].read = NULL;
    memcpy(ret[1].path, "stdout", 7);

    // stderr
    ret[2].opened = 1;
    ...

    return ret;
}

int64_t stdout_write(struct file* file, const void* buf, uint64_t len) {
    char to_print[len + 1];
    for (int i = 0; i < len; i++) {
        to_print[i] = ((const char*)buf)[i];
    }
    to_print[len] = 0;
    return printk(buf);
}

// arch/riscv/kernel/proc.c
void task_init() {
    ...
    // Initialize the stdin, stdout, and stderr.
    task[1]->files = file_init();
    printk("[S] proc_init done!\n");
    ...
}

可以看到每一个被打开的文件对应三个函数指针,这三个函数指针抽象出了每个被打开的文件的操作。也对应了 SYS_LSEEKSYS_WRITE,和 SYS_READ 这三种 syscall. 最终由函数 sys_write 调用 stdout 对应的 struct file 中的函数指针 write 来执行对应的写串口操作。我们这里直接给出 stdout_write 的实现,只需要直接把这个函数指针赋值给 stdout 对应 struct file 中的 write 即可。

接着你需要实现 sys_write syscall,来间接调用我们赋值的 stdout 对应的函数指针。

// arch/riscv/kernel/syscall.c

int64_t sys_write(unsigned int fd, const char* buf, uint64_t count) {
    int64_t ret;
    struct file* target_file = &(current->files[fd]);
    if (target_file->opened) {
        /* todo: indirect call */
    } else {
        printk("file not open\n");
        ret = ERROR_FILE_NOT_OPEN;
    }
    return ret;
}

至此,你已经能够打印出 stdout 的输出了。

2023 Hello RISC-V
hello, stdout!

处理 stderr 的写入

仿照 stdout 的输出过程,完成 stderr 的写入,让 nish 可以正确打印出

2023 Hello RISC-V
hello, stdout!
hello, stderr!
SHELL >

处理 stdin 的读取

此时 nish 已经打印出命令行等待输入命令以进行交互了,但是还需要读入从终端输入的命令才能够与人进行交互,所以我们要实现 stdin 以获取键盘键入的内容。

在终端中已经实现了不断读 stdin 文件来获取键入的内容,并解析出命令,你需要完成的只是响应如下的系统调用:

// user/shell.c

read(0, read_buf, 1);

代码框架中已经实现了一个在内核态用于向终端读取一个字符的函数,你需要调用这个函数来实现你的 stdin_read.

// fs/vfs.c

char uart_getchar() {
    /* already implemented in the file */
}

int64_t stdin_read(struct file* file, void* buf, uint64_t len) {
    /* todo: use uart_getchar() to get <len> chars */
}

接着参考 syscall_write 的实现,来实现 syscall_read.

// arch/riscv/kernel/syscall.c

int64_t sys_read(unsigned int fd, char* buf, uint64_t count) {
    int64_t ret;
    struct file* target_file = &(current->files[fd]);
    if (target_file->opened) {
        /* todo: indirect call */
    } else {
        printk("file not open\n");
        ret = ERROR_FILE_NOT_OPEN;
    }
    return ret;
}

至此,就可以在 nish 中使用 echo 命令了。

SHELL > echo "this is echo"
this is echo

FAT32: 持久存储

在本次实验中我们仅需实现 FAT32 文件系统中很小一部分功能,我们为实验中的测试做如下限制:

  • 文件名长度小于等于 8 个字符,并且不包含后缀名和字符 . .
  • 不包含目录的实现,所有文件都保存在磁盘根目录下。
  • 不涉及磁盘上文件的创建和删除。
  • 不涉及文件大小的修改。

准备工作

利用 VirtIO 为 QEMU 添加虚拟存储

我们为大家构建好了磁盘镜像,其中包含了一个 MBR 分区表以及一个存储有一些文件的 FAT32 分区。可以使用如下的命令来启动 QEMU,并将该磁盘连接到 QEMU 的一个 VirtIO 接口上,构成一个 virtio-blk-device

run: all
    @echo Launch the qemu ......
    @qemu-system-riscv64 \
        -machine virt \
        -nographic \
        -bios default \
        -kernel vmlinux \
        -global virtio-mmio.force-legacy=false \
        -drive file=disk.img,if=none,format=raw,id=hd0 \
        -device virtio-blk-device,drive=hd0

virtio 所需的驱动我们已经为大家编写完成了,在 fs/virtio.c 中给出。

然后在创建虚拟内存映射时,还需要添加映射 VritIO 外设部分的映射。

// arch/riscv/kernel/vm.c
create_mapping(task->pgd, io_to_virt(VIRTIO_START), VIRTIO_START, VIRTIO_SIZE * VIRTIO_COUNT, PTE_W | PTE_R | PTE_V);
初始化 MBR

我们为大家实现了读取 MBR 这一磁盘初始化过程。该过程会搜索磁盘中存在的分区,然后对分区进行初步的初始化。

对 VirtIO 和 MBR 进行初始化的逻辑可以被添加在初始化第一个进程的 task_init

// arch/riscv/kernel/proc.c
void task_init() {
    ...
    printk("[S] proc_init done!\n");

    virtio_dev_init();
    mbr_init();
}

这样从第一个用户态进程被初始化完成开始,就能够直接使用 VirtIO,并使用初始化完成的 MBR 表了。

初始化 FAT32 分区

在 FAT32 分区的第一个扇区中存储了关于这个分区的元数据,首先需要读取并解析这些元数据。我们提供了两个数据结构的定义,fat32_bpb 为 FAT32 BIOS Parameter Block 的简写。这是一个物理扇区,其中对应的是这个分区的元数据。首先需要将该扇区的内容读到一个 fat32_bpb 数据结构中进行解析。fat32_volume 是用来存储我们实验中需要用到的元数据的,需要根据 fat32_bpb 中的数据来进行计算并初始化。

// fs/fat32.c

struct fat32_bpb fat32_header;      // FAT32 metadata in the disk
struct fat32_volume fat32_volume;   // FAT32 metadata to initialize

void fat32_init(uint64_t lba, uint64_t size) {
    virtio_blk_read_sector(lba, (void*)&fat32_header);
    fat32_volume.first_fat_sec = /* to calculate */;
    fat32_volume.sec_per_cluster = /* to calculate */;
    fat32_volume.first_data_sec = /* to calculate */;
    fat32_volume.fat_sz = /* to calculate */;

    virtio_blk_read_sector(fat32_volume.first_data_sec, fat32_buf); // Get the root directory
    struct fat32_dir_entry *dir_entry = (struct fat32_dir_entry *)fat32_buf;
}

读取 FAT32 文件

在读取文件之前,首先需要打开对应的文件,这需要实现 openat syscall.

// arch/riscv/syscall.c

int64_t sys_openat(int dfd, const char* filename, int flags) {
    int fd = -1;

    // Find an available file descriptor first
    for (int i = 0; i < PGSIZE / sizeof(struct file); i++) {
        if (!current->files[i].opened) {
            fd = i;
            break;
        }
    }

    // Do actual open
    file_open(&(current->files[fd]), filename, flags);

    return fd;
}

void file_open(struct file* file, const char* path, int flags) {
    file->opened = 1;
    file->perms = flags;
    file->cfo = 0;
    file->fs_type = get_fs_type(path);
    memcpy(file->path, path, strlen(path) + 1);

    if (file->fs_type == FS_TYPE_FAT32) {
        file->lseek = fat32_lseek;
        file->write = fat32_write;
        file->read = fat32_read;
        file->fat32_file = fat32_open_file(path);
    } else if (file->fs_type == FS_TYPE_EXT2) {
        printk("Unsupport ext2\n");
        while (1);
    } else {
        printk("Unknown fs type: %s\n", path);
        while (1);
    }
}

我们使用最简单的判别文件系统的方式,文件前缀为 /fat32/ 的即是本次 FAT32 文件系统中的文件,例如,在 nish 中我们尝试读取文件,使用的命令是 cat /fat32/$FILENAME. file_open 会根据前缀决定是否调用 fat32_open_file 函数。注意因为我们的文件一定在根目录下,也即 /fat32/ 下,无需实现与目录遍历相关的逻辑。此外需要注意的是,需要将文件名统一转换为大写或小写,因为我们的实现是不区分大小写的。

// arch/riscv/syscall.c

struct fat32_file fat32_open_file(const char *path) {
    struct fat32_file file;
    /* todo: open the file according to path */
    return file;
}

在打开文件后自然是进行文件的读取操作,需要先实现 lseek syscall. 注意实现之后需要在打开文件时将对应的 fat32_lseek 赋值到打开的 FAT32 文件系统中的文件的 lseek 函数指针上。

// arch/riscv/kernel/syscall.c

int64_t sys_lseek(int fd, int64_t offset, int whence) {
    int64_t ret;
    struct file* target_file = &(current->files[fd]);
    if (target_file->opened) {
        /* todo: indirect call */
    } else {
        printk("file not open\n");
        ret = ERROR_FILE_NOT_OPEN;
    }
    return ret;
}

// fs/fat32.c

int64_t fat32_lseek(struct file* file, int64_t offset, uint64_t whence) {
    if (whence == SEEK_SET) {
        file->cfo = /* to calculate */;
    } else if (whence == SEEK_CUR) {
        file->cfo = /* to calculate */;
    } else if (whence == SEEK_END) {
        /* Calculate file length */
        file->cfo = /* to calculate */;
    } else {
        printk("fat32_lseek: whence not implemented\n");
        while (1);
    }
    return file->cfo;
}

然后需要完成 fat32_read 并将其赋值给打开的 FAT32 文件的 read 函数指针。

// fs/fat32.c

int64_t fat32_read(struct file* file, void* buf, uint64_t len) {
    /* todo: read content to buf, and return read length */
}

完成 FAT32 读的部分后,就已经可以在 nish 中使用 cat /fat32/email 来读取到在磁盘中预先存储的一个名为 email 的文件了。

当然,最后还需要完成 close syscall 来将文件关闭。

写入 FAT32 文件

在完成读取后,就可以仿照读取的函数完成对文件的修改。在测试时可以使用 edit 命令在 nish 中对文件做出修改。需要实现 fat32_write,可以参考前面的 fat32_read 来进行实现。

// fs/fat32.c

int64_t fat32_write(struct file* file, const void* buf, uint64_t len) {
    /* todo: fat32_write */
}

测试

[S] buddy_init done!
[S] proc_init done!
[S] virtio_blk_init done!
[S] fat32 partition init done!
2023 Hello RISC-V
hello, stdout!
hello, stderr!
SHELL > echo "this is echo"
this is echo
SHELL > cat /fat32/email
From: torvalds@klaava.Helsinki.FI (Linus Benedict Torvalds)
...
SHELL > edit /fat32/email 6 TORVALDS
SHELL > cat /fat32/email
From: TORVALDS@klaava.Helsinki.FI (Linus Benedict Torvalds)
...