[置顶] 泰晓 RISC-V 实验箱,配套 30+ 讲嵌入式 Linux 系统开发公开课
从零开始,徒手写一个 RISC-V 模拟器(3)—— CSR 与特权级 ISA
Corrector: TinyCorrect v0.1 - [spaces images urls autocorrect] Author: YJMSTR pyjmstr@gmail.com<br> Date: 2023/02/06 Revisor: Bin Meng, Falcon Project: RISC-V Linux 内核剖析 Sponsor: PLCT Lab, ISCAS
前言
在之前的文章中我们介绍了 TinyEMU 的基本架构、RISC-V 非特权级指令集以及 TinyEMU 中 RV64I 指令集的实现。本篇文章中将介绍 RISC-V 中的控制与状态寄存器 CSR,Zicsr 扩展在 TinyEMU 中的实现,并介绍特权级 ISA,为之后实现中断和异常处理做准备。
CSR
RISC-V 预留了 12 位的地址空间给至多 4096 个控制与状态寄存器(CSR)。但 RISC-V 规范只使用了其中一部分,我们可以利用剩余的地址空间添加自定义 CSR。
RISC-V 规范中已分配地址的 CSR 如下,非特权级 CSR:
supervisor-level CSR:
hypervisor and VS CSR:
machine-level CSR:
RISC-V 规范中分配了地址的 CSR 并不都是必须实现的,我们只需要根据需求实现其中的一部分即可。目前 TinyEMU 中先不实现 hypervisor 相关的 CSR 以及 RV32 only 的 CSR。
有关这些 CSR 的具体功能,我们将在使用到这些 CSR 时进行介绍。CSR 的不同字段可能有不同的可读写性,手册中会用以下名词标识它们的读写性:
- WPRI:写时保护保留值,读时忽略值。这些字段是保留给未来使用的,软件在读取该 CSR 时需要忽略这些字段,并在写入该寄存器其它字段时保留 WPRI 字段中的值。
- WLRL:只读写合法值。这些可读写 CSR 字段规定:除合法值外,不能向其写入其它内容。且仅当上一次向该字段写入的是合法值时,才能保证从该字段中读取到的是合法值。
- WARL:写任意值,读合法值。这些可读写 CSR 字段定义了一些合法值。WARL 可以写入任意值,但保证任意时刻读取到的都是合法值。
下面向 TinyEMU 中添加 CSR。首先加入如下的 CSR 结构体:
typedef struct CSR {
uint64_t csr[4096];
} CSR;
并修改 CPU 结构体:
typedef struct CPU {
uint64_t regs[32];
uint64_t pc;
BUS bus;
enum CPU_STATE state;
CSR csr;
} CPU;
然后用 enum 为 CSR 分配地址:
enum CSR_ADDR {
cycle = 0xC00,
...
};
Zicsr 扩展
SYSTEM major opcode 用于编码所有的特权级指令,即当 opcode = 0b1110011 时,说明当前指令为特权级指令。其可以分为两部分:Zicsr 扩展中的指令和所有其它的特权级指令。
Zicsr 扩展定义了 CSR 指令来对 CSR 进行原子性的 读-修改-写
操作。CSR 指令分为两类:寄存器指令(CSRRW,CSRRS,CSRRC)和立即数指令(CSRRWI,CSRRSI,CSRRCI)。
CSR 指令格式如下:
各 CSR 指令编码如下:
其中 CSR 指令的立即数位于 rs1 字段,扩展方式为零扩展。opcode 均为 1110011。
如果 rd 寄存器是 x0,指令将不会读取 CSR,以避免读取 CSR 产生的副作用。类似地,若 rs1 寄存器为 x0 或立即数为 0,也不会进行 CSR 写操作。所有 CSR 指令何时进行读/写操作的表格如下:
CSRRW 指令原子性地交换指定的 CSR 和整数寄存器中的值,它读出 CSR 中的值后将其进行零拓展至 XLEN 位,再写回 rd 寄存器中。而 rs1 寄存器中的值将被写入指定的 CSR 里。
CSRRS 指令原子性地读取并置位 CSR,将值零扩展至 XLEN 位后写入 rd。rs1 中的初始值将作为 CSR 的位掩码,即:若寄存器 rs1 中为 1 的位在 CSR 中是可写入的位,那么 CSR 中的该位会被置 1,其它位会保持不变。
CSRRC 指令原子性地读 CSR 值,零扩展至 XLEN 位后写入 rd。rs1 中为 1 的位若在 CSR 中是可写入的位,那么 CSR 中的该位会被置 0,其它位保持不变。
CSRRWI,CSRRSI 和 CSRRCI 指令的行为与之前三条指令的行为一致,但 rs1 被换为了零扩展的立即数。
下面向 TinyEMU 中添加 Zicsr 指令,在 enum INST_NAME
中添加相应指令名称后,修改译码函数,加入对 Zicsr 指令的支持。
接着添加指令对应的执行函数。以 csrrw(DECODER *decoder)
为例,其它 CSR 函数类似:
void csrrw(DECODER *decoder) {
uint64_t csrval;
if (decoder->rd != 0)
csrval = decoder->cpu->csr.csr[decoder->csr_addr];
else csrval = 0;
uint64_t rs1val = decoder->cpu->regs[decoder->rs1];
decoder->cpu->regs[decoder->rd] = csrval;
decoder->cpu->csr.csr[decoder->csr_addr] = rs1val;
}
需要注意的是,CSR 指令中的高 12 位提取出来后是零扩展,而 i 型立即数虽然也是这些位,但是是符号位扩展,因此不能复用提取 i 型立即数的 imm_i 函数。
其它特权指令
前文曾经提到过,opcode = 0b1110011 用于编码所有的特权指令,本小节将介绍除 Zicsr 扩展外的其它特权指令,但不会给出它们的实现。
特权等级
任一时刻,一个 RISC-V 硬件线程(hart)总是运行在某一特权等级上。目前 RISC-V 特权级规范中定义了如下的特权等级:
U 模式通常是用于运行传统的应用程序,S 模式通常用于运行操作系统,M 模式拥有最高的权限,所有的 RISC-V 系统都必须要实现 M 模式。
每个特权模式有属于自己特权等级的 CSR,能够使用的特权指令也有所不同。M 模式可以访问所有模式的 CSR,S 模式只能访问 S 模式和 U 模式的 CSR,U 模式只能访问 U 模式的 CSR,并且没有专属于 U 模式的特权指令。在 RISC-V 的虚拟化扩展(hypervisor extension)中还将 S 模式扩展为了 HS 与 VS 模式。此外还有用于调试的 D(Debug)模式,关于这些模式的详细介绍可以查阅 RISC-V 规范。
下面向 TinyEMU 中加入特权等级。在 cpu.h 中对特权等级进行编码:
enum CPU_PRI_LEVEL {
U = 0b00,
S = 0b01,
M = 0b11,
};
然后在 struct CPU
中加入 enum CPU_PRI_LEVEL pri_level;
用于标识当前 CPU 所处的特权等级。并在 cpu_init
函数中将初始的特权等级设为 M
。
M-mode
机器模式可用的特权指令包括环境调用与断点(Environment Call and Breakpoint),自陷返回指令(Trap-Return Instructions),等待中断(Wait for Interrupt)与自定义系统指令。
环境调用与断点指令包括 ecall
指令与 ebreak
指令。这两条指令在之前介绍 RV64I 的文章中已经实现了译码,但没有添加指令实现的函数。这两条指令的编码格式如下:
RISC-V 中的中断和异常都会引起 trap。一个 hart 通常运行在 U 模式,直到自陷(trap)发生,该 hart 会切换到自陷处理程序(通常运行在更高特权模式),使得当前 hart 原先执行的程序中 trap 发生之后的指令暂停执行,直到 hart 从 trap 返回后才会继续执行。提高当前 hart 运行的特权等级的 trap 被称为垂直 trap,而不改变特权等级的 trap 被称为水平 trap。
M 模式下和 trap 相关的 CSR 寄存器有:
- mtvec:用于保存 M 模式下 trap 时处理器需要跳转到的地址。
- mepc:用于记录 M 模式触发 trap 时的 pc 值。
- mcause:指示发生 trap 的原因。最高位为 1 表示当前 trap 为 interrupt,否则为 exception;其它位用于编码不同的 exception。
- mie:指出处理器目前能处理和必须忽略的中断。
- mip:指出处理器目前正准备处理的中断。
- mtval:用于保存异常发生时的附加信息:比如地址异常时的地址,非法指令异常的指令本身,对于其它异常它的值为 0。
- mscratch:暂时存放一个字大小的数据。
- mstatus:保存全局中断使能等状态。
ecall
指令是 RISC-V 中的自陷指令,在不同的特权等级下,该指令会产生对应的环境调用异常,触发 trap。
ebreak
由调试器使用,该指令会将系统的控制权转交给调试环境,产生断点异常。异常和中断处理我们在之后的文章中再实现,因此此处仅先将这两条指令实现为 nop
。
自陷-返回指令包括 mret
和 sret
这两条指令,用于在处理完自陷(trap)后从自陷状态返回。它们会对 mstatus 寄存器进行操作(sstatus 是 mstatus 的子集)。RV64 中的 mstatus 寄存器如下所示:
mstatus 寄存器中分别为 M 模式和 S 模式提供了全局中断使能位 MIE 和 SIE(注意和 mie 与 sie 寄存器进行区分)。这些位主要用于保证当前特权等级下中断处理程序的原子性。若当前 hart 在特权模式 $x$ 下执行,则 $x$IE=1 表示全局中断启用,$x$IE=0 表示全局中断禁用。更低特权等级 $w$ ($w<x$) 的中断总是全局禁用,无论 $w$IE 的值是多少;更高特权等级 $h$ ($h>x$) 的中断总是全局启用,无论 $h$IE 的值是多少。
mret
和 sret
指令分别用于从 M 模式和 S 模式的 trap 中返回,它们会根据 mstatus 寄存器的信息恢复 trap 之前的中断标志位和特权等级,并分别跳转回 mepc 和 sepc 中所存储的地址。
等待中断(Wait for Interrupt)指令 wfi
,用于将当前 hart 挂起。该指令在任何特权模式下均可用,并且在 U 模式下是可选的。这条指令是 RISC-V 架构中的休眠指令,可以让处理器进入平台特定的低功耗状态,直到中断到来。
S-mode
S 模式可用的特权指令除了之前提到的 sret
外,还有 sfence.vma
指令:
这条指令用于同步更新内存中与内存管理有关的数据结构(比如页表),还能用于弃置地址转译缓存(TLB,Translation Lookaside Buffer)中的条目,具体细节我们将在实现 TinyEMU 的虚拟内存系统时再进行介绍。
U-mode
在 RISC-V 特权级规范 v20211203 版本中,没有给出介绍 U-mode 特权指令的章节。但在 U-mode 下,我们可以通过 ecall
指令主动触发 trap,来切换到更高的特权模式,并通过 mret/sret
指令切换回 U-mode。
如果你想要了解 U-mode 下如何处理中断,可以查阅 RISC-V N 扩展的相关资料。
总结
本文简要介绍了 RISC-V 中的特权指令,并提供了 CSR 以及 Zicsr 扩展在 TinyEMU 中的实现。在之后的文章中我们将进一步实现 trap 的处理,并完善相关指令的实现。
参考资料
猜你喜欢:
- 我要投稿:发表原创技术文章,收获福利、挚友与行业影响力
- 知识星球:独家 Linux 实战经验与技巧,订阅「Linux知识星球」
- 视频频道:泰晓学院,B 站,发布各类 Linux 视频课
- 开源小店:欢迎光临泰晓科技自营店,购物支持泰晓原创
- 技术交流:Linux 用户技术交流微信群,联系微信号:tinylab
支付宝打赏 ¥9.68元 | 微信打赏 ¥9.68元 | |
请作者喝杯咖啡吧 |
Read Album:
- Stratovirt 的 RISC-V 虚拟化支持(四):内存模型和 CPU 模型
- Stratovirt 的 RISC-V 虚拟化支持(三):KVM 模型
- Stratovirt 的 RISC-V 虚拟化支持(二):库的 RISC-V 适配
- Stratovirt 的 RISC-V 虚拟化支持(一):环境配置
- TinyBPT 和面向 buildroot 的二进制包管理服务(3):服务端说明