内容简介:缺页中断会交给PageFaultHandler处理,其根据缺页中断的不同类型会进行不同的处理:本文粗浅地和大家一起学习了Page Fault的相关知识点,包括Linux虚拟地址和物理地址的关系、CPU获取内存数据的过程、MMU和TLB&页表的协同配合、缺页异常产生的原因和分类处理。
1.号外号外
各位老铁,大家好!
上周大白有事停更1次,最近在想如何让大家在10分钟中有所收获,于是准备搞一个" 什么是xxx "系列,写一些精悍的知识点。
先抛一道 阿里面试题给大家热热身,引出今天的主角-缺页异常Page Fault。
谈谈对缺页异常Page Fault的理解。
话不多说,集合上车。
2. 术语约定
-
VA:Virtual Address 虚拟地址
-
PA:Physical Address 物理地址
-
MMU:Memory Manage Unit 内存管理单元
-
TLB:Translation Lookaside Buffer 旁路快表缓存/地址变换高速缓存
-
PTE:Page Table Entry 分页表项
3. 内存的惰性分配
以32位的 Linux 系统为例,每个进程独立拥有4GB的虚拟地址空间,根据局部性原理没有必要也不可能为每个进程分配4GB的物理地址空间。
64位系统也是一样的道理,只不过空间寻址范围大了很多很多倍,进程的虚拟地址空间会分为几个部分:
实际上只有程序运行时用到了才去内存中寻找虚拟地址 对应 的页帧,找不到才可能进行分配,这就是 内存的惰性(延时)分配机制 。
对于一个运行中的进程来说,不是所有的虚拟地址在物理内存中都有对应的页,如图展示了部分虚拟地址存在对应物理页的情况:
虚拟地址空间根据固定大小一般是4KB进行划分,物理内存可以设置不同的页面大小,通常物理页大小和虚拟页大小是一样的,本文按照物理页4KB大小展开。
经过前面的分析,我们 将面临一个问题: 如何将虚拟地址准确快速地映射到物理页呢 ?
>>>高能预警 敲黑板 本段小结<<<
1.Linux的虚拟地址空间就是 空头支票 ,看着很大但是实际对应的物理空间只有很少的一部分。
2.内存的 惰性分配 是个有效的机制,可以保证内存利用率和服务器利用率,是资源合理配置的方法。
3.大量的虚拟地址到物理地址的 快速准确地查询转换 是一个难题。
4. CPU如果获取内存中的数据
CPU并不直接和物理内存打交道,而是把地址转换的活外包给了MMU ,MMU是一种硬件电路,其速度很快,主要工作是 进行内存管理,地址转换只是它承接的业务之一 。
一起看看MMU是如何搞定地址转换的。
4.1 MMU和Page Table
每个进程都会有自己的页表Page Table,页表存储了进程中虚拟地址到物理地址的映射关系,所以就相当于一张地图,MMU收到CPU的虚拟地址之后开始查询页表,确定 是否存在映射以及读写权限是否正常 ,如图:
对于4GB的虚拟地址且大小为4KB页,一级页表将有2^20个表项,页表占有连续内存并且存储空间大,多级页表可以有效降低页表的存储空间以及内存连续性要求,但是 多级页表同时也带来了查询效率问题 。
我们以2级页表为例,MMU要先进行两次页表查询确定物理地址,在确认了权限等问题后,MMU再将这个物理地址发送到总线,内存收到之后开始读取对应地址的数据并返回。
MMU在2级页表的情况下进行了2次检索和1次读写,那么当页表变为N级时,就变成了N次检索+1次读写。
可见, 页表级数越多查询的步骤越多,对于CPU来说等待时间越长 ,效率越低, 这个问题还需要优化才行。
>> 本段小结 敲黑板 划重点 <<
1.页表存在于进程的内存之中,MMU收到虚拟地址之后查询Page Table来获取物理地址。
2.单级页表对连续内存要求高,于是引入了多级页表,但是 多级页表也是一把双刃剑 ,在减少连续存储要求且减少存储空间的同时降低了查询效率。
4.2 MMU和TLB的故事
MMU和TLB的故事就这样开始了...
CPU觉得MMU干活虽然卖力气,但是效率有点低,不太想继续外包给它了,这一下子把MMU急坏了。
MMU于是找来了一些精通统计的朋友,经过一番研究之后发现CPU用的数据经常是一小搓,但是每次MMU都还要重复之前的步骤来检索,害,就知道埋头干活了,也得讲究方式方法呀!
找到瓶颈之后, MMU引入了新武器,江湖人称快表的TLB ,别看TLB容量小,但是正式上岗之后干活还真是不含糊。
当CPU给MMU传新虚拟地址之后,MMU先去问TLB那边有没有,如果有就直接拿到物理地址发到总线给内存,齐活。
TLB容量比较小,难免发生Cache Miss ,这时候MMU还有保底的老武器页表 Page Table,在页表中找到之后MMU除了把地址发到总线传给内存,还把这条映射关系给到TLB,让它记录一下刷新缓存。
TLB容量不满的时候就直接把新记录存储了,当满了的时候就开启了淘汰大法把旧记录清除掉,来保存新记录,彷佛完美解决了问题。
在TLB和Page Table加持之下,CPU感觉最近MMU比较给力了,就问MMU怎么做到的?MMU就一五一十告诉了CPU。
CPU说是个不错的路子,随后说出了自己的建议: TLB还是有点小,缓存不命中也是经常发生的,要不要搞个大的,这样存储更多访问更快 ?
MMU一脸苦笑说道大哥 TLB很贵的 ,要不你给涨点外包费?话音未落,CPU就说涨工资是不可能了,这辈子都不可能了。
>>>高能预警 敲黑板 本段小结<<<
1. CPU要根据用户进程提供的虚拟地址来获取真实数据,但是它并不自己做而是交给了MMU 。
2. MMU也是个聪明的家伙,集成了TLB来存储CPU最近常用的页表项来加速寻址,TLB找不到再去全量页表寻址,可以认为TLB是MMU的缓存。
3. TLB的容量毕竟有限,为此必须依靠Page Table一起完成TLB Miss情况的查询,并且更新到TLB建立新映射关系。
5.缺页异常Page Fault大揭秘
设想CPU给MMU的虚拟地址在TLB和Page Table都没有找到对应的物理页帧或者权限不对,该怎么办呢?
没错,这就是缺页异常Page Fault, 它是一个由硬件中断触发的可以由软件逻辑纠正的错误 。
5.1 PageFault,它来了
假如目标内存页在物理内存中 没有对应的页帧或者存在但无对应权限 , CPU 就无法获取数据 ,这种情况下 CPU就会报告一个缺页错误 。
由于CPU没有数据就无法进行计算,CPU罢工了 用户进程也就出现了缺页中断 ,进程会从用户态切换到内核态,并将缺页中断交给内核的 Page Fault Handler 处理。
缺页异常并不可怕 ,只要CPU要的虚拟地址经过MMU的一番寻址之后没有找到或者找到后无权限,就会出现缺页异常,因此触发异常后的处理流程将是重点内容。
5.2 缺页错误的分类处理
缺页中断会交给PageFaultHandler处理,其根据缺页中断的不同类型会进行不同的处理:
-
Hard Page Fault
也被称为Major Page Fault,翻译为硬缺页错误/主要缺页错误,
这时物理内存中没有对应的页帧
,需要CPU打开磁盘设备读取到物理内存中,再让MMU建立VA和PA的映射。
-
Soft Page Fault
也被称为Minor Page Fault,翻译为软缺页错误/次要缺页错误,
这时物理内存中是存在对应页帧的
,只不过可能是其他进程调入的,发出缺页异常的进程不知道而已,此时MMU只需要建立映射即可,无需从磁盘读取写入内存,一般出现在多进程共享内存区域。
-
Invalid Page Fault
翻译为无效缺页错误,比如进程访问的内存地址越界访问,又比如对空指针解引用内核就会报segment fault错误中断进程直接挂掉。
5.3 缺页错误出现的原因
不同类型的Page Fault出现的原因也不一样,常见的几种原因包括:
-
非法操作访问越界
这种情况产生的影响也是最大的,也是Coredump的重要来源,比如空指针解引用或者权限问题等都会出现缺页错误。
-
使用malloc新申请内存
malloc机制是延时分配内存,当使用malloc申请内存时并未真实分配物理内存,等到真正开始使用malloc申请的物理内存时发现没有才会启动申请,期间就会出现Page Fault。
-
访问数据被swap换出
物理内存是有限资源,当运行很多进程时并不是每个进程都活跃,对此OS会启动内存页面置换将长时间未使用的物理内存页帧放到swap分区来腾空资源给其他进程,当存在于swap分区的页面被访问时就会触发Page Fault从而再置换回物理内存。
>>> 敲黑板 划重点 本段小结:<<<
触发Page Fault的原因可能有很多,归根到底也只有几种大类:
1. 如使用共享内存区域,没有存储VA->PA的映射但是存在物理页帧的软缺页错误,在Page Table/TLB中建立映射关系即可。
2. 访问的地址在物理内存中确实不存在,需要从磁盘/swap分区读入才能使用,这种性能影响会比较大,因为磁盘太慢了,尽量使用高性能的SSD来降低延时。
3. 访问的地址内存非法,缺页错误会升级触发SIGSEGV信号结束进程,这种属于可以导致进程挂掉的一种缺页错误。
6.全文总结
本文粗浅地和大家一起学习了Page Fault的相关知识点,包括Linux虚拟地址和物理地址的关系、CPU获取内存数据的过程、MMU和TLB&页表的协同配合、缺页异常产生的原因和分类处理。
本文并没有对MMU的内部机制、内核态&用户态缺页异常、缺页异常处理函数等内容进行展开,主要是因为这部分内容相对晦涩,还得靠自己深入研究。
本文旨在把火点燃而不是把桶填满,对于文中相关知识点,欢迎交流沟通学习。
感谢各位老铁的倾情安排,下期再见!
以上所述就是小编给大家介绍的《图解|什么是缺页错误Page Fault》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
分布式服务架构:原理、设计与实战
李艳鹏、杨彪 / 电子工业出版社 / 2017-8 / 89.00
《分布式服务架构:原理、设计与实战》全面介绍了分布式服务架构的原理与设计,并结合作者在实施微服务架构过程中的实践经验,总结了保障线上服务健康、可靠的最佳方案,是一本架构级、实战型的重量级著作。 《分布式服务架构:原理、设计与实战》以分布式服务架构的设计与实现为主线,由浅入深地介绍了分布式服务架构的方方面面,主要包括理论和实践两部分。理论上,首先介绍了服务架构的背景,以及从服务化架构到微服务架......一起来看看 《分布式服务架构:原理、设计与实战》 这本书的介绍吧!
URL 编码/解码
URL 编码/解码
html转js在线工具
html转js在线工具