Linux 下的COW机制(copy-on-write)

        

        Linux通过MMU进行虚拟地址到物理地址的转换,当进程执行fork()后,会把页中的权限设置为RD-ONLY(只读)。

MMU(内存管理单元)

·       MMU本质是一个集成在CPU核心的硬件电路模块,其核心任务是实现和管理虚拟内存机制,主要是进行虚拟地址到物理地址的实时、高效转换。
在Linu系统中,MMU的作用是:

  1. 提供虚拟地址空间抽象:采用虚拟的思想,让每个进程都感觉自己拥有一个连续的,独立的,巨大的内存空间(这个空间从0开始)
  2. 内存保护和隔离:防止一个进程无意或恶意地访问或修改另一个进程的内存
  3. 内存利用:只加载程序实际需要的部分到物理内存
  4. 共享内存:允许多个进程安全地共享相同的物理内存页

工作流程:

  • 页表管理:Linux内核负责创建,修改和销毁进程的页表结构。在进程创建、内存分配、缺页处理、进程切换时执行这些操作
    • CPU发出虚拟地址
    • MMU基于页表将虚拟地址转换物理地址
    • 访问页表
      • 缺页处理:当MMU在地址转换过程中无法找到有效的PTE或遇到权限错误时,它会触发一个Page Fault中断给一个CPU。CPU陷入内核模式
    • 虚拟地址解析:MMU将地址分为两部分:
      • 高阶位:用作进入页表的索引
      • 低阶位:页内偏移量

COPY-ON-WRITE

  1. 最开始,当一个新进程通过fork被创建,或者创建共享内存映射(mmap)时,父子进程(或映射共享区域)最初共享相同的物理内存页。内核将进程/映射的页表项标记为只读或设置COW标志。此时没有发生实际的物理内存复制。

    • 复制页表:Linux内核会为字进程创建一份父进程页表的副本。此时,父子进程都指向相同的物理页框。
    • 修改权限:内核不仅会将父子进程页表中指向共享物理页的页表项权限设置为 RD-ONLY,还会设置一个专门的标记位来标志这是一个COW页(并非所有RD-ONLY页都是COW页),这个标记能告诉内核缺页处理程序——如果该页发生了写保护错误,别直接报错,可能是一个COW页
  2. 进程尝试写入

    • ​​CPU 尝试执行写指令:​​ P1 执行一条向该共享虚拟地址(比如 Virtual Address 1, VA1)写入数据的指令。
      ​​ * MMU 触发 Page Fault:​​
      ​​ * 原因1:写操作检测:​​ MMU 发现当前指令要求写入一个权限为 RO 的内存页。
      ​​ * 原因2:权限冲突:​​ RO 权限不允许写入,违反了页表项中的权限设置。
    • ​​中断:​​ MMU 产生一个 ​​Page Fault 异常 (中断)​​。CPU 停止当前用户态代码的执行,切换到内核态,调用 Linux 内核的缺页中断处理程序 (Page Fault Handler)。
    • 执行COW
      • 分配新物理页面:内核从空闲物理页面中分配新的物理页面
      • 复制内容:内核将原始物理页框的内容完整复制到这个新分配的物理页框
      • 更新页表:内核修改进程的页表,及那个该页表项指向新的物理页框地址,并设置权限为可读写或其他,然后清除COW标志
    • 恢复执行
      (如果有)内核完后缺页处理,CPU恢复用户态进程的执行,重新执行那条发生缺页的指令

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/83258.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

客户案例 | 短视频点播企业海外视频加速与成本优化:MediaPackage+Cloudfront 技术重构实践

01技术背景与业务挑战 某短视频点播企业深耕国内用户市场,但其后台应用系统部署于东南亚印尼 IDC 机房。 随着业务规模扩大,传统架构已较难满足当前企业发展的需求,企业面临着三重挑战: ① 业务:国内用户访问海外服…

开发Vue.js组件的二三事

Vue.js作为一款渐进式JavaScript框架,其组件化开发模式是其核心优势之一。在多年的Vue开发实践中,我积累了一些组件开发的经验和思考,在此与大家分享。 组件设计原则 单一职责原则 每个组件应该只关注一个特定的功能或UI部分。如果一个组件…

实现多路视频截图预览之后上传到后台系统

********************父组件********************** <div class"camera-box" v-loading"i.loading"> <div class"camera-box-inner" v-for"(x, y) in i.children" :key"y children x.featureCode" v-show"…

分布式锁-Redisson实现

目录 本地锁的局限性 Redisson解决分布式锁问题 在分布式环境下&#xff0c;分布式锁可以保证在多个节点上的并发操作时数据的一致性和互斥性。分布式锁有多种实现方案&#xff0c;最常用的两种方案是&#xff1a;zookeeper和redis&#xff0c;本文介绍redis实现分布式锁方案…

【办公类-48-04】202506每月电子屏台账汇总成docx-5(问卷星下载5月范围内容,自动获取excel文件名,并转移处理)

背景需求&#xff1a; 1-4月电子屏表格&#xff0c;都是用这个代码将EXCEL数据整理成分类成3个WORD表格。 【办公类-48-04】20250118每月电子屏台账汇总成docx-4&#xff08;提取EXCLE里面1月份的内容&#xff0c;自制月份文件夹&#xff09;-CSDN博客文章浏览阅读1.2k次&…

【websocket】安装与使用

websocket安装与使用 1. 介绍2. 安装3. websocketpp常用接口4. Websocketpp使用4.1 服务端4.2 客户端 1. 介绍 WebSocket 是从 HTML5 开始支持的一种网页端和服务端保持长连接的 消息推送机制。 传统的 web 程序都是属于 “一问一答” 的形式&#xff0c;即客户端给服务器发送…

微算法科技(NASDAQ:MLGO)基于信任的集成共识和灰狼优化(GWO)算法,搭建高信任水平的区块链网络

随着数字化转型的加速&#xff0c;区块链技术作为去中心化、透明且不可篡改的数据存储与交换平台&#xff0c;正逐步渗透到金融、供应链管理、物联网等多个领域&#xff0c;探索基于信任的集成共识机制&#xff0c;并结合先进的优化算法来提升区块链网络的信任水平&#xff0c;…

【项目实战】通过多模态+LangGraph实现PPT生成助手

PPT自动生成系统 基于LangGraph的PPT自动生成系统&#xff0c;可以将Markdown文档自动转换为PPT演示文稿。 功能特点 Markdown解析&#xff1a;自动解析Markdown文档结构PPT模板分析&#xff1a;分析PPT模板的布局和风格智能布局决策&#xff1a;匹配内容与合适的PPT布局自动…

贝叶斯优化+LSTM+时序预测=Nature子刊!

贝叶斯优化与LSTM的融合在时间序列预测领域取得了显著成效&#xff0c;特别是在处理那些涉及众多超参数调整的复杂问题时。 1.这种结合不仅极大提高了预测的精确度&#xff0c;还优化了模型训练流程&#xff0c;提升了效率和成本效益。超参数优化的新篇章&#xff1a;LSTM因其…

AWSLambda之设置时区

目标 希望Lambda运行的时区是东八区。 解决 只需要设置lambda的环境变量TZ为东八区时区即可&#xff0c;即Asia/Shanghai。 参考 使用 Lambda 环境变量

RAG系统向量数据库选型与Prompt Engineering鲁棒性测试实践

引言 在AI应用不断落地的今天&#xff0c;RAG&#xff08;Retrieval-Augmented Generation&#xff0c;检索增强生成&#xff09;和Prompt Engineering&#xff08;提示工程&#xff09;成为大模型工程师和测试工程师的核心武器。 一方面&#xff0c;RAG系统依赖强大的向量数据…

2.Socket 编程 UDP

1.UDP网络编程 0.背景知识 自实现IP转化 相关函数理解 IP相关理解 1. V2版本 - DictServer封装版 实现一个简单的英译汉的网络字典 Dict.hpp dictionary.txt InetAddr.hpp • 在 InetAddr 中&#xff0c;重载一下方便对用户是否是同一个进行比较 Log.hpp makefile Mutex.hpp…

数据可视化交互

目录 【实验目的】 【实验原理】 【实验环境】 【实验步骤】 一、安装 pyecharts 二、下载数据 三、实验任务 实验 1&#xff1a;AQI 横向对比条形图 代码说明&#xff1a; 运行结果&#xff1a; 实验 2&#xff1a;AQI 等级分布饼图 实验 3&#xff1a;多城市 AQI…

【MATLAB去噪算法】基于CEEMDAN联合小波阈值去噪算法(第四期)

CEEMDAN联合小波阈值去噪算法相关文献 一、EMD 与 EEMD 的局限性 &#xff08;1&#xff09;EMD (经验模态分解) 旨在自适应地将非线性、非平稳信号分解成一系列 本征模态函数 (IMFs)&#xff0c;这些 IMFs 从高频到低频排列。 核心问题&#xff1a;模态混合 (Mode Mixing) 同…

大话软工笔记—架构模型

1. 架构模型1—拓扑图 &#xff08;1&#xff09;拓扑图概念 拓扑图&#xff0c;将多个软件系统用网络图连接起来的表达方式。 &#xff08;2&#xff09;拓扑图分类 总线型结构 比较普遍采用的方式&#xff0c;将所有的系统接到一条总线上。 星状结构 各个系统通过点到…

24-Oracle 23 ai ​Lock-Free Reservations​(无锁列值保留)

数据库领域为了解决ACID的平衡&#xff0c;尝试了各种锁、各种模式&#xff0c; 引擎技术特性、厂家实现方式各放异彩&#xff0c;被各种锁折磨的小伙伴&#xff0c;是不是感同身受。 一、数据库锁 1. 锁的类型与特点 ​全局锁​&#xff1a;锁定整个数据库实例&#xff0c;备…

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别

OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别 直接训练提示词嵌入向量的核心区别 您提到的代码: prompt_embedding = initial_embedding.clone().requires_grad_(True) optimizer = torch.optim.Adam([prompt_embedding

从零写一个ALSA声卡驱动学习(1)

前言&#xff1a; 本文档描述了如何编写 ALSA&#xff08;高级 Linux 音频架构&#xff09;驱动程序。文档主要聚焦于 PCI 声卡的实现。对于其他类型的设备&#xff0c;可能会使用不同的 API。不过&#xff0c;至少 ALSA 的内核 API 是一致的&#xff0c;因此本文档在编写这些驱…

链结构与工作量证明7️⃣:用 Go 实现比特币的核心机制

链结构与工作量证明:用 Go 实现比特币的核心机制 如果你用 Go 写过区块、算过哈希,也大致理解了非对称加密、数据序列化这些“硬核知识”,那么恭喜你,现在我们终于可以把这些拼成一条完整的“区块链”。 不过别急,这一节我们重点搞懂两件事: 区块之间是怎么连接成“链”…

深入理解 React 样式方案

React 的样式方案较多,在应用开发初期,开发者需要根据项目业务具体情况选择对应样式方案。React 样式方案主要有: 1. 内联样式 2. module css 3. css in js 4. tailwind css 这些方案中,均有各自的优势和缺点。 1. 方案优劣势 1. 内联样式: 简单直观,适合动态样式和…