Linux 内核 Slab 分配器核心组件详解

Slab 分配器是 Linux 内核中用于高效管理内存的机制,其核心目标是通过对象缓存减少内存碎片和分配/释放开销。以下详细解析其核心组件及其协作关系:

 

一、Slab 系统的核心组件

 

组件 描述 作用场景

Slab 描述符 每个 Slab 的管理结构(如 struct slab),记录页帧状态、空闲对象链表等。 跟踪 Slab 的元数据(如对象数量、空闲链表头、所属缓存等)。

Slab 节点 NUMA 架构下的内存节点(struct kmem_cache_node),管理本地 Slab 资源。 优化 NUMA 系统内存访问,减少跨节点访问延迟。

本地对象缓冲池 每 CPU 的缓存(struct kmem_cache_cpu),存放快速分配的空闲对象。 无锁快速分配对象,避免全局竞争。

共享对象缓冲池 节点级别的共享缓存池(struct kmem_cache_node 中的链表)。 当本地缓冲池耗尽时,从共享池批量获取对象或 Slab。

三个 Slab 链表 每个节点维护三个链表:slabs_full、slabs_partial、slabs_free。 按 Slab 的填充状态分类,优先从 slabs_partial 分配,释放时调整链表位置。

N 个 Slab 物理连续的页帧集合,划分为多个等大小的对象。 承载实际对象存储,一个 Slab 可分配多个对象。

Slab 缓存对象 每个 Slab 中划分出的内存块,用于存储特定类型的内核对象(如 inode)。 直接被内核代码分配和释放,避免频繁调用页分配器。

 

二、组件协作流程

 

1. 对象分配流程

 

步骤 1:尝试从 本地对象缓冲池(Per-CPU 缓存)获取空闲对象。

步骤 2:若本地池为空,从 共享对象缓冲池(节点 slabs_partial 链表)批量获取对象填充本地池。

步骤 3:若共享池耗尽,从 Slab 空闲链表(slabs_free)分配新 Slab,分割为对象后加入本地池。

步骤 4:若系统内存不足,触发页分配器(如 Buddy System)分配新页帧创建 Slab。

 

2. 对象释放流程

 

步骤 1:将对象归还到 本地对象缓冲池。

步骤 2:若本地池已满,将部分对象批量返还到 共享对象缓冲池(slabs_partial)。

步骤 3:若 Slab 中所有对象均释放,将 Slab 移至 slabs_free 链表,在内存紧张时释放回页分配器。

三、关键数据结构关系

 

struct kmem_cache

├── struct kmem_cache_cpu *cpu_slab // 每 CPU 的本地缓存

├── struct kmem_cache_node *node[NUM_NODES] // NUMA 节点共享缓存

│ ├── struct list_head slabs_full // 满 Slab 链表

│ ├── struct list_head slabs_partial // 部分满 Slab 链表

│ └── struct list_head slabs_free // 空闲 Slab 链表

└── unsigned int object_size // 对象大小

 

struct slab

├── struct list_head slab_list // 所属链表(full/partial/free)

├── void *freelist // 空闲对象链表头

├── unsigned int active_objects // 已分配对象数

└── unsigned int num_pages // 占用的页帧数

 

四、代码案例分析:Slab 分配器的内部操作

 

以下伪代码展示 Slab 分配器在对象分配时的核心逻辑:

 

// 分配对象

void *kmem_cache_alloc(struct kmem_cache *cache, gfp_t flags) {

    struct kmem_cache_cpu *cpu_slab = get_cpu_ptr(cache->cpu_slab);

    void *object;

 

    // 1. 尝试从本地缓冲池获取对象

    if (likely(cpu_slab->freelist)) {

        object = cpu_slab->freelist;

        cpu_slab->freelist = get_next_freepointer(object);

        return object;

    }

 

    // 2. 本地池为空,从节点共享池填充

    if (unlikely(!fill_local_cache(cpu_slab, cache, flags))) {

        // 3. 共享池不足,分配新 Slab

        struct slab *new_slab = allocate_slab(cache, flags);

        if (!new_slab)

            return NULL; // 内存不足

        cpu_slab->freelist = new_slab->freelist;

        cpu_slab->slab = new_slab;

        object = cpu_slab->freelist;

        cpu_slab->freelist = get_next_freepointer(object);

        return object;

    }

    // ... 其他错误处理

}

 

// 填充本地缓冲池

static int fill_local_cache(struct kmem_cache_cpu *cpu_slab, 

                           struct kmem_cache *cache, 

                           gfp_t flags) {

    struct kmem_cache_node *node = cache->node[cpu_to_node(smp_processor_id())];

    struct slab *slab;

 

    // 从节点的部分满链表获取 Slab

    spin_lock(&node->list_lock);

    slab = list_first_entry_or_null(&node->slabs_partial, struct slab, slab_list);

    if (!slab) {

        // 若无部分满 Slab,尝试从空闲链表分配

        slab = list_first_entry_or_null(&node->slabs_free, struct slab, slab_list);

        if (!slab) {

            spin_unlock(&node->list_lock);

            return 0; // 需要分配新 Slab

        }

        list_move(&slab->slab_list, &node->slabs_partial);

    }

    // 将 Slab 的空闲对象导入本地缓存

    cpu_slab->freelist = slab->freelist;

    slab->freelist = NULL;

    slab->active_objects = cache->num_objects;

    list_move(&slab->slab_list, &node->slabs_full);

    spin_unlock(&node->list_lock);

    cpu_slab->slab = slab;

    return 1;

}

 

五、关键设计优势

 

减少内存碎片

Slab 按对象大小预分配内存块,避免频繁分割物理页,减少外部碎片。

 

提升分配速度

通过本地缓冲池(Per-CPU 无锁缓存)实现快速分配,避免全局锁竞争。

 

NUMA 优化

每个节点管理本地 Slab,减少跨节点内存访问带来的性能损耗。

 

内存重用

释放的对象归还到空闲链表,避免频繁调用页分配器,降低系统开销。

 

六、实际观察工具

 

查看 Slab 状态

 

cat /proc/slabinfo

输出示例:显示每个缓存的名称、对象数量、活动对象数、Slab 使用情况等。

内核调试工具

使用 systemtap 或 ftrace 跟踪特定缓存的对象分配/释放路径。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/83426.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Oracle 的AHF (Automatic Health Framework) 工具

Oracle 的AHF (Automatic Health Framework) 工具 Oracle AHF (Automatic Health Framework) 是 Oracle 官方提供的诊断工具集合,用于自动收集、分析和诊断 Oracle 数据库及集群环境的健康状态和问题。 一 AHF 核心功能概述 1. 主要组件 TFA (Trace File Analyz…

华为服务器obsutil使用方法

本文不生产技术,只做技术的搬运工!!! 前言 最近在使用华为云服务器进行模型训练,发现其上传下载文件都极慢,询问华为官方人员是否限速,对方推荐使用obsutil作为中转服务进行下载,在…

【大模型训练】中短序列attention 和MOE层并行方式(二)

我们考虑一个典型的Transformer模型结构,在多层堆叠中,其中包含Attention层和MoE层(FeedForward层被替换为MoE层)。在模型最后是LM Head(语言模型头),通常是一个全连接层,将隐层向量…

2025-06-09(批量智能裁剪视频尺寸并延长视频时长)

import os import subprocess import random import json # 配置参数 TARGET_WIDTH 500 TARGET_HEIGHT 600 TARGET_DURATION 180 # 目标时长(秒) OUTPUT_DIR "processed_videos" MIRROR_MODES ["none", "horizontal&quo…

CKA考试知识点分享(9)---gateway api

CKA 版本:1.32 第九套题是涉及gateway api相关。 注意:本文不是题目,只是为了学习相关知识点做的实验。仅供参考 实验目的 创建一个gateway api,来实现后端镜像的外部访问。 gateway api 通过nginx实现 实验开始 安装nginx ga…

Kafka 消息模式实战:从简单队列到流处理(一)

一、Kafka 简介 ** Kafka 是一种分布式的、基于发布 / 订阅的消息系统,由 LinkedIn 公司开发,并于 2011 年开源,后来成为 Apache 基金会的顶级项目。它最初的设计目标是处理 LinkedIn 公司的海量数据,如用户活动跟踪、消息传递和…

Linux中使用yum安装MYSQL

1、关系型数据库 MySQL 使用 yum 安装mysql 1、检查是否已经安装 Mysql rpm -qa | grep mysql如果安装了 就进行卸载 rpm -e mysql-community-libs-5.7.44-1.el7.x86_64 rpm -e mysql57-community-release-el7-11.noarch rpm -e mysql-community-common-5.7.44-1.el7.x86_64…

Linux 文件系统与 I/O 编程核心原理及实践笔记

文章目录 一、理解文件1.1 狭义理解1.2 广义理解1.3 文件操作的归类认识1.4 系统角度:进程与文件的交互1.5 实践示例 二、回顾 C 文件接口2.1 hello.c 打开文件2.2 hello.c 写文件2.3 hello.c 读文件2.4 输出信息到显示器的几种方法2.5 stdin & stdout & st…

1.9 Express

Express 是一个基于 Node.js 平台的轻量级、灵活的 Web 应用框架,它为构建 Web 应用和 API 提供了一系列强大的功能。 核心特性 中间件支持:Express 使用中间件(middleware)函数来处理 HTTP 请求和响应。中间件可以访问请求对象&…

面壁智能MiniCPM4.0技术架构与应用场景

📋 目录 1. 引言:端侧智能新时代2. MiniCPM4.0概述3. 核心技术架构 3.1 高效双频换挡机制3.2 稀疏注意力机制3.3 系统级优化创新 4. 技术突破与性能表现5. 应用场景深度解析 5.1 智能手机应用5.2 智能家居场景5.3 汽车智能化5.4 其他端侧应用 6. 行业影…

RabbitMQ路由核心解密:从Exchange到RoutingKey的深度实践与避坑指南

🔍 RabbitMQ路由核心解密:从Exchange到RoutingKey的深度实践与避坑指南 “消息去哪了?”——这是每位RabbitMQ使用者在调试时最常发出的灵魂拷问。 理解Exchange与RoutingKey的协作机制,正是解开路由谜题的关键钥匙。 一、Exchang…

Spring MVC完全指南 - 从入门到精通

目录 1. Spring MVC简介 2. MVC架构模式 3. Spring MVC核心组件 4. 请求处理流程 5. 控制器详解 6. 请求映射 7. 参数绑定 8. 数据验证 9. 视图解析器 10. 模型数据处理 11. 异常处理 12. 拦截器 13. 文件上传下载 14. RESTful API 15. 配置详解 总结 1. Sprin…

实战使用docker compose 搭建 Redis 主从复制集群

文章目录 前言技术积累1、Redis 主从复制机制2、Docker Compose 编排3、 Redis 配置文件定制4、 验证主从状态5、 自动化部署与维护 环境准备实战演示创建redis目录及配置1、创建redis目录2、创建redis配置文件 启动redis集群服务1、创建docker-compose编排文件2、编排docker-c…

【学习笔记】RTSP-Ovnif-GB28181

【学习笔记】RTSP-Ovnif-GB28181 一、RTSP_RTP_RTCP RTSP(Real Time Streaming Protocol),RFC2326,实时流传输协议,是TCP/IP协议体系中的一个应用层协议。 RTP协议详细说明了在互联网上传递音频和视频的标准数据包格…

stm32-c8t6实现语音识别(LD3320)

目录 LD3320介绍: 功能引脚 主要特色功能 通信协议 端口信息 开发流程 stm32c8t6代码 LD3320驱动代码: LD3320介绍: 内置单声道mono 16-bit A/D 模数转换内置双声道stereo 16-bit D/A 数模转换内置 20mW 双声道耳机放大器输出内置 5…

RAG技术全解析:从概念到实践,构建高效语义检索系统——嵌入模型与向量数据库搭建指南

一、RAG技术概述:为什么需要RAG? 1.1 什么是RAG? RAG(Retrieval-Augmented Generation)是一种结合检索与生成能力的AI架构。其核心思想是通过外部知识库动态增强大语言模型(LLM)的生成能力&…

【资源分享】手机玩转经典游戏!小鸡模拟器1.9.0:PSP/NDS/GBA完美运行!

阿灿今天给大家推荐一款小鸡模拟器,这是一个老款PC和掌上游戏机模拟器。完美模拟街机(fbamamemameplus).PS、PSP、FC(NES)SFC(SNES)、GBA、GBC、MD、NDS、DC、NGP、WS (WSC) PCE、ONS 等18款经典掌机游戏机。小鸡模拟器同时也提供海量热门的汉化版游戏免…

matlab脉冲信号并绘制波形2025.6.11

以下是一个使用MATLAB生成5V、10MHz脉冲信号并绘制波形的示例代码: % 5V 10MHz脉冲信号仿真 clc; clear; close all; % 参数设置 voltage = 5; % 信号幅度(V) frequency = 10e6; % 脉冲频率(10MHz) duty_cycle =

ElasticJob初探

依赖版本 JDK版本是&#xff1a;jdk17 springboot版本 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.2.4</version></parent>zookeeper elasticjo…

【Vue3】(三)vue3中的pinia状态管理、组件通信方式及总结、插槽

目录 一、vue3的pinia 1、什么是pinia&#xff1f; 2、为什么Vue3选择pinia&#xff1f; 3、使用pinia的好处 4、安装pinia 2、项目配置 3、存储/读取pinia中的数据 4、修改pinia中的数据 5、storeToRefs&#xff08;保持store中数据的响应式&#xff09; 6、getters 7、…