Dockerfile 镜像构建

简介

一、Docker镜像概念与结构

1.1 镜像的分层存储机制

1.2 镜像分层的关键特性

二、Dockerfile语法

2.1 基础构建指令

2.2 环境配置指令

2.3 文件操作指令

2.4 运行时指令

2.5 网络与数据管理

三、实战案例

3.1 构建Nginx Web服务器

3.2 构建Tomcat应用服务器

3.3 构建MySQL数据库

四、Dockerfile实践优化技巧

4.1 指令书写规范

4.2 镜像构建优化

4.3 安全最佳实践

4.4 高级构建技巧

五、总结

简介

Docker作为容器化技术的核心，其镜像构建能力是实现应用快速部署的关键。本文将围绕Dockerfile这一镜像构建脚本，深入解析Docker镜像的底层原理，并通过实战案例演示如何构建高效、可靠的Docker镜像。

一、Docker镜像概念与结构

Docker镜像不仅是应用发布的标准格式，更是容器运行的基础。理解镜像的结构和工作机制，是掌握Dockerfile的前提。

1.1 镜像的分层存储机制

Docker镜像采用分层结构设计，每个镜像由多个只读层叠加而成。这种设计带来了显著的优势：

缓存复用：未修改的层会被缓存，加速后续构建
增量更新：只需更新变化的层，减少镜像体积
版本控制：每层对应一次构建操作，便于追溯

通过docker history命令可以查看镜像的分层结构：

# 查看镜像分层及大小
docker history nginx:latest

镜像默认存储在/var/lib/docker/<storage-driver>目录，容器运行时会在镜像顶部添加一个可读写层，所有运行时修改都存储在此层。这解释了为何容器删除后数据会丢失——因为可读写层随之删除。

1.2 镜像分层的关键特性

每层对应一条Dockerfile指令：每条指令生成一个新层
缓存失效机制：当指令内容或依赖文件变化时，对应层及后续层缓存失效
不可变性：层一旦生成不可修改，后续层的删除操作只是隐藏文件而非真正移除

二、Dockerfile语法

Dockerfile是定义镜像构建过程的脚本文件，通过一系列指令告诉Docker如何构建镜像。下面详解核心指令及使用场景。

2.1 基础构建指令

FROM：指定基础镜像

# 基于Ubuntu 20.04构建新镜像
FROM ubuntu:20.04

所有Dockerfile必须以FROM开头
基础镜像可以是官方镜像或自定义镜像
推荐使用alpine等轻量级镜像以减小体积

LABEL：添加镜像元数据

# 添加作者、版本、描述等信息
LABEL maintainer="John Doe <johndoe@example.com>" \version="1.0" \description="This is a sample image"

替代已弃用的MAINTAINER指令
元数据便于镜像管理和识别

2.2 环境配置指令

ENV：设置环境变量

# 设置MySQL root密码环境变量
ENV MYSQL_ROOT_PASSWORD=password

环境变量在容器运行时持续存在
可被容器内应用程序直接使用

ARG：定义构建参数

# 定义版本参数，默认值1.0
ARG VERSION=1.0

仅在镜像构建过程中有效
可通过docker build --build-arg VERSION=2.0传递参数

2.3 文件操作指令

COPY：复制本地文件

# 将本地app.py复制到镜像/app目录
COPY app.py /app/

简单高效的文件复制方式
推荐优先使用COPY而非ADD

ADD：增强型复制

# 下载并解压远程压缩包
ADD http://example.com/file.tar.gz /app/

支持远程URL下载和自动解压
功能复杂可能带来安全风险，谨慎使用

WORKDIR：设置工作目录

# 设置后续指令的工作目录为/app
WORKDIR /app

避免使用绝对路径硬编码
支持多次切换工作目录

2.4 运行时指令

RUN：构建时执行命令

# 更新软件源并安装Python3
RUN apt-get update && apt-get install -y python3

用于安装软件、配置环境等操作
建议合并多条命令减少层数：RUN command1 && command2

CMD：容器默认命令

# 容器启动时默认执行python3 app.py
CMD ["python3", "app.py"]

一个Dockerfile只能有一个CMD
可被docker run命令后的参数覆盖

ENTRYPOINT：容器入口点

# 配置容器入口点为python3，默认参数app.py
ENTRYPOINT ["python3"]
CMD ["app.py"]

入口点命令不会被覆盖
docker run <image> test.py会执行python3 test.py

2.5 网络与数据管理

EXPOSE：声明监听端口

# 声明容器监听8080端口
EXPOSE 8080

仅作声明，需配合docker run -p实现端口映射
明确告知使用者容器需要的网络资源

VOLUME：创建数据卷

# 创建/app/data数据卷挂载点
VOLUME ["/app/data"]

实现数据持久化和容器间数据共享
推荐用于日志、配置文件等需要持久化的目录

三、实战案例

3.1 构建Nginx Web服务器

准备工作

# 拉取CentOS 7基础镜像
docker pull centos:7# 创建工作目录
mkdir -p /opt/nginx
cd /opt/nginx

Dockerfile内容

FROM centos:7
# 删除默认源文件
RUN rm -rf /etc/yum.repos.d/*
# 配置阿里云镜像源
RUN curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo
# 清理缓存
RUN yum clean all
# 安装编译依赖
RUN yum -y install pcre-devel zlib-devel zlib gcc* make openssl-devel
# 复制Nginx源码
ADD nginx-1.19.5.tar.gz /opt
# 切换工作目录
WORKDIR /opt/nginx-1.19.5
# 编译安装Nginx
RUN ./configure --prefix=/usr/local/nginx && make && make install
# 复制配置文件
ADD nginx.conf /usr/local/nginx/conf/nginx.conf
# 声明服务端口
EXPOSE 80
EXPOSE 443
# 复制启动脚本并赋予权限
ADD run.sh /run.sh
RUN chmod 775 /run.sh
# 设置容器启动命令
CMD ["/run.sh"]

启动脚本run.sh

#!/bin/bash
# 启动Nginx服务
/usr/local/nginx/sbin/nginx

构建与运行

# 构建镜像，-t指定镜像名称
docker build -t mynginx .# 启动容器，-p映射端口，-d后台运行
docker run -d -p 8080:80 --name nginx01 mynginx# 带数据卷挂载的启动方式
docker run -d -p 8081:80 --name nginx02 \
-v /www/html:/web \
mynginx /bin/bash -c "/run.sh"

3.2 构建Tomcat应用服务器

Dockerfile核心部分

FROM centos:7
# 安装JDK
ADD jdk-8u91-linux-x64.tar.gz /usr/local/
# 配置Java环境变量
ENV JAVA_HOME /usr/local/jdk1.8.0_91
ENV PATH $PATH:/usr/local/jdk1.8.0_91/bin
# 安装Tomcat
ADD apache-tomcat-8.5.16.tar.gz /
RUN mv /apache-tomcat-8.5.16 /usr/local/tomcat
# 声明端口
EXPOSE 8080
# 启动脚本
ADD run.sh /run.sh
RUN chmod 775 /run.sh
CMD ["/run.sh"]

启动脚本关键逻辑

#!/bin/bash
# 启动Tomcat
/usr/local/tomcat/bin/startup.sh
# 保持容器运行
tail -f /dev/null

3.3 构建MySQL数据库

初始化脚本安全设置

#!/bin/bash
# 初始化MySQL
mysql_install_db --user=mysql
# 启动服务
mysqld_safe &
sleep 3
# 设置root密码
mysqladmin -u"root" password "123456"
# 授权远程访问
mysql -uroot -p123456 -e "GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456';"
# 刷新权限
mysql -uroot -p123456 -e "FLUSH PRIVILEGES;"

安全建议

避免在Dockerfile中硬编码密码
使用docker run -e MYSQL_ROOT_PASSWORD=xxx传递密码
生产环境建议限制root用户远程访问

四、Dockerfile实践优化技巧

4.1 指令书写规范

大小写约定：指令使用大写（FROM/RUN/CMD），增强可读性
顺序优化：将不变的指令（如FROM、LABEL）放在前面，充分利用缓存
注释原则：使用#添加注释，解释关键步骤的目的

4.2 镜像构建优化

减少层数：合并相关命令，例如：

RUN apt-get update && apt-get install -y \package1 \package2 \&& rm -rf /var/lib/apt/lists/*

清理临时文件：安装完成后删除缓存和临时文件，减小镜像体积
利用缓存：将不常变更的操作（如安装依赖）放在前面，频繁变更的放在后面

4.3 安全最佳实践

使用非root用户：通过RUN useradd appuser && chown appuser /app设置非root用户
最小化权限：仅开放必要的端口，避免暴露敏感服务
避免敏感信息：不在Dockerfile中存储密码、密钥等敏感信息

4.4 高级构建技巧

多阶段构建：使用多个FROM指令，先构建编译环境，再复制最终产物：

FROM builder AS build
# 编译过程...FROM runtime
# 复制编译结果...

环境变量隔离：区分构建时参数（ARG）和运行时变量（ENV）
缓存管理：使用docker build --no-cache强制重新构建

五、总结

通过掌握Dockerfile的核心语法和实践技巧，我们能够：

理解Docker镜像的分层存储与缓存机制
熟练使用各类指令构建自定义镜像
通过实战案例掌握常见服务的容器化部署
应用最佳实践优化镜像构建流程

进阶学习方向建议：

深入研究Docker存储驱动（Overlay2、AUFS等）
探索Docker Compose实现多容器协同部署
学习Kubernetes容器编排，实现容器服务的规模化管理

Dockerfile作为容器化的核心技术，其灵活性和强大功能为应用部署带来了前所未有的便利。不断实践和优化Dockerfile编写，将有效提升应用交付效率和系统稳定性。